Guide du débutant pour éviter le grattage du contenu d'un blog dans WordPress

Guide du débutant pour éviter le grattage du contenu d'un blog dans WordPress / Guide du débutant

Si vous écrivez du contenu original jour après jour, vous savez déjà que vos publications se retrouveront sur des sites pourriels de SPAM en quelques jours, voire même en quelques minutes. Certains utilisateurs ont même remarqué que le site contenant du contenu volé était supérieur à la publication originale. En tant que propriétaire de site Web, il est très frustrant de voir que quelqu'un vole votre contenu sans permission, le monétise, vous devance en tant que SERP et vole votre public. Le raclage de contenu est un énorme problème ces jours-ci, sachant qu'il est si facile pour quelqu'un de voler votre contenu. Dans cet article, nous aborderons ce qui est le grattage du contenu de blog, comment attraper les grattoirs de contenu, comment traiter les grattoirs de contenu, comment réduire et empêcher le grattage de contenu, comment tirer parti du grattage de contenu, comment gagner de l'argent avec les grattoirs de contenu , et le contenu raclage toujours bon?

Quel est le contenu du blog Scraping?

Le grattage du contenu d'un blog est un acte généralement effectué à l'aide de scripts qui extraient le contenu de nombreuses sources et le tirent dans un site. Il est si facile maintenant que tout le monde peut installer un site WordPress, mettre un thème gratuit ou commercial et installer quelques plug-ins qui vont supprimer le contenu de blogs sélectionnés pour qu'il puisse être publié sur leur site..

Pourquoi volent-ils mon contenu??

Certains de nos utilisateurs nous ont demandé pourquoi ils volaient mon contenu. La réponse simple est parce que vous êtes génial. La vérité est que ces grattoirs de contenu ont des arrière-pensées. Vous trouverez ci-dessous quelques-unes des raisons pour lesquelles une personne gratterait votre contenu:

  • Commission d'affiliation - Certains spécialistes du marketing affiliés sales veulent exploiter le système pour gagner quelques dollars supplémentaires. Ils utiliseront votre contenu et le contenu d'autres personnes pour générer du trafic sur leur site via le moteur de recherche. Ces sites sont généralement ciblés sur un créneau spécifique, ils proposent donc des produits connexes qu'ils promeuvent..
  • Génération de leads - Nous voyons souvent des avocats et des agents immobiliers faire cela. Ils veulent ressembler à des chefs de file de l'industrie dans leurs petites collectivités. Ils ne disposent pas de la bande passante nécessaire pour produire un contenu de qualité. Ils vont donc extraire le contenu d'autres sources. Parfois, ils ne sont même pas conscients de cela, car ils paient 30 euros par mois pour ajouter du contenu et les aider à obtenir un meilleur référencement. Nous en avons rencontré plusieurs par le passé.
  • Revenue publicitaire - Certaines personnes veulent simplement créer un «centre» de connaissances. Un guichet unique pour les utilisateurs d'un créneau spécifique. Si j'avais un centime pour chaque fois que quelqu'un a fait cela avec notre contenu, nous aurions quelques centaines de centimes. Nous remarquons souvent que le contenu de notre site est en train d’être effacé. Le racleur répond toujours, je le faisais pour le bien de la communauté. Sauf que le site est recouvert de publicités.

Ce ne sont là que quelques raisons pour lesquelles quelqu'un vole votre contenu..

Comment attraper des grattoirs de contenu?

La capture de contenus de récupération est une tâche fastidieuse et peut prendre beaucoup de temps. Voici quelques moyens que vous pouvez utiliser pour attraper des scrapers de contenu.

Rechercher dans Google avec vos titres de publication

Oui, c'est aussi douloureux que ça en a l'air. Cette méthode ne vaut probablement pas la peine, surtout si vous écrivez sur un sujet très populaire.

Rétroliens

Si vous ajoutez des liens internes dans vos messages, vous remarquerez un rétrolien si un site vole votre contenu. De cette manière, le grattoir vous dit qu’ils grattent votre contenu. Si vous utilisez Akismet, beaucoup de ces rétroliens apparaîtront dans le dossier SPAM. Encore une fois, cela ne fonctionnera que si vous avez des liens internes dans vos messages.

Outils pour les webmasters

Si vous utilisez les outils Google pour les webmasters, vous êtes probablement au courant de la page Liens vers votre site. Si vous regardez sous «Trafic», vous verrez une page qui contient des liens vers votre site. Les chances sont vos racleurs seront parmi les meilleurs là-bas. Ils auront des centaines, voire des milliers de liens vers vos pages (étant donné que vous avez des liens internes).

FeedBurner Usages peu communs

Si vous avez configuré Feedburner pour votre blog WordPress, vous pouvez voir des utilisations inhabituelles. Dans l'onglet Analyser, sous Statistiques de flux, vous verrez «Utilisations peu communes». Là vous verrez une liste de sites.

Comment traiter avec les racleurs de contenu

Il existe peu d'approches que les gens utilisent lorsqu'ils traitent avec des scrapers de contenu. L'approche «Ne rien faire», approchez-les tous, tuez-les, profitez-en.

L'approche Ne rien faire

C’est de loin l’approche la plus facile à adopter. C'est généralement ce que recommandent les blogueurs les plus populaires, car cela prend BEAUCOUP de temps pour combattre les scrapers. Cette approche recommande simplement «au lieu de les combattre, passez votre temps à produire encore plus de contenu de qualité et à vous amuser». Maintenant, évidemment, s’il s’agit d’un blog bien connu comme Smashing Magazine, CSS-Tricks, Problogger ou autres, ils n’ont pas à s’inquiéter. Ce sont des sites d'autorité aux yeux de Google.

Cependant, lors de la mise à jour de Panda, nous savons que certains bons sites ont été signalés comme des scrapers, car Google pensait que leurs scrapers étaient du contenu original. Donc, cette approche n'est pas toujours la meilleure à notre avis.

Tuez-les tous

L'opposé exact de l'approche «ne rien faire». Dans cette approche, il vous suffit de contacter le racleur et de lui demander de retirer le contenu. S'ils refusent de le faire ou ne répondent simplement pas à vos demandes, vous déposez un DMCA (Digital Millennium Copyright Act) auprès de leur hôte. D'après notre expérience, la plupart des sites Web de scraping ne disposent pas d'un formulaire de contact. S'ils le font, utilisez-le. S'ils n'ont pas le formulaire de contact, alors vous devez faire une recherche Whois.

Vous pouvez voir les informations de contact sur le contact administratif. Le contact administratif et technique est généralement le même. Le whois montre également le registraire de domaine. Les sociétés d’hébergement Web et les registraires de domaines les plus connus disposent de formulaires ou d’e-mails DMCA. Vous pouvez voir que cette personne spécifique est avec Hostgator en raison de leurs serveurs de noms. HostGator a un formulaire pour les plaintes DMCA. Si le serveur de noms ressemble à quelque chose comme ns1.theirdomain.com, vous devez aller plus loin en procédant à des recherches IP inversées et en recherchant des adresses IP..

Vous pouvez également utiliser un service tiers pour DMCA.com pour les takedowns..

Jeff Starr, dans son article, suggère de bloquer les adresses IP du méchant. Accédez à vos journaux pour leur adresse IP, puis bloquez-les avec quelque chose de similaire dans votre fichier .htaccess racine:

Deny à partir de 123.456.789

Vous pouvez également les rediriger vers un fil factice en procédant comme suit:

RewriteCond% REMOTE_ADDR 123 \ .456 \ .789 \. RewriteRule. * Http://dummyfeed.com/feed [R, L]

Vous pouvez être vraiment créatif ici, comme le suggère Jeff. Envoyez-les à de très grands flux de texte contenant Lorem Ipsum. Vous pouvez leur envoyer des images dégoûtantes de mauvaises choses. Vous pouvez également les renvoyer directement sur leur propre serveur, ce qui provoque une boucle infinie qui plantera leur site..

La dernière approche que nous prenons consiste à en tirer avantage.

Comment tirer parti des grattoirs de contenu

C’est notre approche qui consiste à traiter les scrapers de contenu, et cela s’avère plutôt bien. Cela aide notre référencement et nous aide à gagner plus d'argent. La majorité des scrapeurs utilisent votre flux RSS pour voler votre contenu. Voici certaines des choses que vous pouvez faire:

  • Liaison interne - Vous devez interconnecter le CRAP de vos messages. Avec la fonctionnalité de liaison interne dans WordPress 3.1, c'est maintenant plus simple que jamais. Lorsque vous avez des liens internes dans votre article, cela vous aide à augmenter le nombre de pages vues et à réduire le taux de rebond sur votre propre site. Deuxièmement, vous obtenez des liens retour des personnes qui volent votre contenu. Enfin, cela vous permet de voler leur public. Si vous êtes un blogueur talentueux, alors vous comprenez l'art des liens internes. Vous devez placer vos liens sur des mots-clés intéressants. Faites en sorte que l'utilisateur soit tenté de cliquer dessus. Si vous faites cela, alors le public du racleur cliquera aussi dessus. Juste comme ça, vous avez pris un visiteur de leur site et vous l'avez ramené là où il aurait dû être.
  • Lien automatique Mots-clés avec des liens d'affiliation - Il existe peu de plugins comme Ninja Affiliate et SEO Smart Links qui remplaceront automatiquement les mots clés attribués par des liens d’affiliation. Par exemple: HostGator, StudioPress, MaxCDN, Gravity Forms << These all will be auto-replaced with affiliate links when this post goes live.
  • Soyez créatif avec RSS Footer - Vous pouvez utiliser le pied de page RSS ou le plugin WordPress SEO by Yoast pour ajouter des éléments personnalisés à votre pied de page RSS. Vous pouvez ajouter à peu près tout ce que vous voulez ici. Nous connaissons des personnes qui aiment promouvoir leurs propres produits auprès de leurs lecteurs RSS. Donc, ils vont ajouter des bannières. Devinez quoi, maintenant, ces bannières apparaîtront également sur le site Web de cette scraper. Dans notre cas, nous ajoutons toujours un petit disclaimer au bas de nos messages dans nos flux RSS. Il se lit simplement comme suit: «Comment mettre votre site WordPress en lecture seule pour les migrations et la maintenance de site est une publication de: WPBeginner qu'il est interdit de copier sur d'autres sites». Ce faisant, nous obtenons un lien retour vers l'article d'origine. sur le site de Scraper, qui indique à Google et aux autres moteurs de recherche que nous sommes l'autorité. Cela permet également à leurs utilisateurs de savoir que le site vole notre contenu. Si vous êtes doué avec les codes, vous pouvez devenir totalement fou. Tels que l'ajout de publications connexes uniquement destinées à vos lecteurs RSS et de nombreuses autres choses. Consultez notre guide pour manipuler complètement votre flux RSS WordPress.

Comment réduire le grattage du contenu d'un blog et éventuellement le prévenir

Si vous prenez notre approche de nombreux liens internes, ajoutez des liens d’affiliation, des bannières rss, vous réduirez de beaucoup les possibilités de rognage du contenu. Si vous prenez la suggestion de Jeff Starr de rediriger les scrapers de contenu, cela arrêtera également ces scrapers. En plus de ce que nous avons partagé ci-dessus, il existe quelques autres astuces que vous pouvez utiliser..

Flux RSS complet vs résumé

La communauté des blogs a eu un débat sur l'opportunité de disposer d'un flux RSS complet ou d'un flux RSS de résumé. Nous n'allons pas entrer dans les détails sur ce débat, mais l'un des avantages de disposer d'un flux RSS de résumé uniquement est d'empêcher la suppression du contenu. Vous pouvez modifier les paramètres en accédant à votre panneau d’administration WordPress et en sélectionnant Paramètres »Lecture. Puis modifiez le paramètre Pour chaque article dans une émission de flux: Résumé.

Remarque: nous avons un fil complet car nous nous soucions davantage de nos lecteurs RSS que des spammeurs..

Spam Trackback

Les trackbacks et les Pingbacks avaient certainement de grandes utilisations, mais ils sont constamment maltraités. Les thèmes affichent souvent des rétroliens et des pingback sous ou parmi les commentaires. Cela incite le polluposteur à gratter votre site et à envoyer des rétroliens. Si vous l'approuvez par erreur, ils reçoivent un lien retour et une mention de votre site. Voici comment vous pouvez désactiver les rétroliens sur toutes les publications futures. Voici un article qui vous montrera comment désactiver les rétroliens et les pings sur les publications WordPress existantes..

Le contenu raclage est-il toujours bon??

Ça peut être. Si vous voyez que vous gagnez de l'argent sur le site du racleur, alors vous pouvez le faire. Si vous voyez beaucoup de trafic sur le site d'un racleur, c'est possible. Dans la plupart des cas cependant, ce n'est pas le cas. Vous devriez toujours essayer de retirer votre contenu. Mais vous réaliserez que plus votre blog grossit, plus il est impossible de garder une trace de tous les scrapers de contenu. Nous continuons à envoyer des plaintes DMCA, mais nous savons qu'il existe des tonnes d'autres sites qui volent notre contenu et que nous ne pouvons tout simplement pas suivre..

Quelles sont vos pensées? Utilisez-vous d'autres mécanismes pour empêcher le contenu de se racler? Aimerais entendre vos pensées.