3 façons de supprimer les pages de blog indésirables de Google

Croyez-vous en l’idée qu’une fois que quelque chose est publié sur Internet, il est publié pour toujours? Eh bien, aujourd'hui, nous allons dissiper ce mythe.

La vérité est que dans de nombreux cas, il est tout à fait possible d’éliminer des informations d’Internet. Bien sûr, il existe un enregistrement des pages Web qui ont été supprimées si vous effectuez une recherche dans la Wayback Machine, n'est-ce pas? Oui, absolument. Sur la Wayback Machine, il existe des enregistrements de pages Web remontant à de nombreuses années - pages que vous ne trouverez pas avec une recherche Google car la page Web n'existe plus. Quelqu'un l'a supprimé ou le site Web a été fermé.

Donc, il n'y a pas moyen de s'en sortir, non? L'information restera à jamais gravée dans la pierre de l'Internet, à la portée des générations futures? Eh bien, pas exactement.

La vérité est qu’il peut être difficile, voire impossible, de supprimer les informations importantes qui se sont multipliées d’un site Web à l’autre ou d’un blog à l’autre, comme un virus, il est en fait assez facile d’éradiquer complètement une page Web ou plusieurs pages Web de tous les registres. d’existence - supprimer cette page des moteurs de recherche ainsi que de la Wayback Machine. La nouvelle machine Wayback vous permet de voyager visuellement dans le temps Internet. La nouvelle machine Wayback vous permet de voyager visuellement avec le temps Internet. Il semble que depuis le lancement de Wayback Machine dans En 2001, les propriétaires du site ont décidé de lancer le back-end basé sur Alexa et de le redéfinir avec leur propre code source ouvert. Après avoir effectué des tests avec le… Lire la suite. Il y a un piège bien sûr, mais nous y reviendrons.

3 façons de supprimer des pages de blog du réseau

La première méthode est celle utilisée par la majorité des propriétaires de sites Web, car ils ne connaissent pas mieux le processus, à savoir la suppression de pages Web. Cela peut se produire si vous réalisez que le contenu de votre site est dupliqué ou que vous ne souhaitez pas qu'une page apparaisse dans les résultats de recherche..

Supprimer simplement la page

Le problème avec la suppression complète des pages de votre site Web est que, puisque vous avez déjà créé la page sur le réseau, il est probable qu'il y ait des liens provenant de votre propre site ainsi que des liens externes d'autres sites vers cette page. Lorsque vous la supprimez, Google reconnaît immédiatement cette page comme étant une page manquante..

Donc, en supprimant votre page, vous avez non seulement créé un problème avec “Pas trouvé” crawlez les erreurs pour vous-même, mais vous avez également créé un problème pour tous ceux qui ont déjà créé un lien vers la page. Habituellement, les utilisateurs qui accèdent à votre site à partir de l'un de ces liens externes voient votre page 404, ce qui ne pose pas de problème majeur, si vous utilisez un code de code 404 personnalisé de Google pour leur fournir des suggestions utiles ou des solutions de remplacement. Mais on pourrait penser qu’il pourrait exister des moyens plus gracieux de supprimer des pages de résultats de recherche sans supprimer toutes ces 404 pour les liens entrants existants, à droite.?

Eh bien, il y a.

Supprimer une page des résultats de recherche Google

Tout d’abord, vous devez comprendre que si la page Web que vous souhaitez supprimer des résultats de recherche Google n’est pas une page de votre propre site, vous n’aurez pas de chance, sauf pour des raisons juridiques ou si le site a publié votre message personnel. informations en ligne sans votre permission. Si tel est le cas, utilisez l'outil de résolution des problèmes de suppression de Google pour envoyer une demande de suppression de la page dans les résultats de recherche. Si votre cas est valide, vous pourrez peut-être obtenir du succès en supprimant la page. Naturellement, vous pourriez avoir encore plus de succès en contactant simplement le propriétaire du site Web. Comment supprimer les fausses informations personnelles sur Internet? Comment supprimer les fausses informations personnelles sur Internet En savoir plus comme je l'ai décrit comment faire en 2009.

Maintenant, si la page que vous souhaitez supprimer des résultats de recherche se trouve sur votre propre site, vous avez de la chance. Tout ce que vous avez à faire est de créer un robots.txt fichier et assurez-vous que vous avez interdit la page spécifique que vous ne voulez pas dans les résultats de la recherche, ou le répertoire entier avec le contenu que vous ne voulez pas indexer. Voici à quoi ressemble le blocage d'une seule page.

Utilisateur-agent: * Interdit: /my-deleted-article-that-i-want-removed.html

Vous pouvez empêcher les robots d'explorer des répertoires entiers de votre site comme suit:.

User-agent: * Disallow: / content-about-personal-stuff /

Google dispose d'une excellente page d'assistance qui peut vous aider à créer un fichier robots.txt si vous n'en avez jamais créé un auparavant. Cela fonctionne extrêmement bien, comme je l'expliquais récemment dans un article sur la structuration des offres de syndication. Comment négocier des offres de syndication et protéger vos classements de recherche Comment négocier des offres de syndication et protéger vos classements de recherche La syndication fait fureur de nos jours. Mais tout à coup, vous pourriez trouver que le partenaire de syndication est répertorié plus haut que vous dans les résultats de recherche pour une histoire que vous avez écrite à l'origine! Protégez vos classements de recherche. Lisez Plus pour ne pas vous faire de mal (demander aux partenaires de syndication de ne pas autoriser l'indexation de leurs pages sur lesquelles vous êtes souscrit). Une fois que mon propre partenaire de syndication a accepté de le faire, les pages en double du contenu de mon blog ont complètement disparu des listes de recherche..

Seul le site principal apparaît à la troisième place pour la page sur laquelle notre titre est répertorié, mais mon blog figure désormais aux premier et deuxième emplacements. ce qui aurait été presque impossible si un site Web de haute autorité avait laissé la page dupliquée indexée.

Ce que beaucoup de gens ne réalisent pas, c’est qu’il est également possible de le faire avec Internet Archive (the Wayback Machine). Voici les lignes que vous devez ajouter à votre fichier robots.txt pour que cela se produise..

Agent utilisateur: ia_archiver Disallow: / sample-category /

Dans cet exemple, je demande à Internet Archive de supprimer de la Wayback Machine tout élément situé dans le sous-répertoire sample-category de mon site. L’archive Internet explique comment procéder sur la page d’aide Exclusion. C’est aussi là qu’ils expliquent que “Internet Archive n'est pas intéressé à offrir l'accès à des sites Web ou à d'autres documents Internet dont les auteurs ne veulent pas que leurs documents fassent partie de la collection..”

Cela va à l’encontre de la croyance populaire selon laquelle tout ce qui est posté sur Internet est emporté dans les archives pour toute l’éternité. Non - les webmasters qui possèdent le contenu peuvent spécifiquement supprimer le contenu de l'archive en utilisant l'approche robots.txt.

Supprimer une page individuelle avec des balises méta

Si vous ne souhaitez supprimer que quelques pages des résultats de la recherche Google, vous n'avez en fait absolument pas besoin d'utiliser l'approche robots.txt. Vous pouvez simplement ajouter la bonne “des robots” balise méta sur les pages individuelles, et dire aux robots de ne pas indexer ni suivre les liens sur toute la page.

Vous pouvez utiliser le “des robots” méta ci-dessus pour empêcher les robots d’indexer la page; vous pouvez également indiquer au robot Google de ne pas l'indexer afin que la page soit uniquement supprimée des résultats de recherche Google et que d'autres robots de recherche puissent toujours accéder au contenu de la page..

C'est à vous de décider comment vous souhaitez gérer ce que les robots font avec la page et si la page est répertoriée ou non. Pour quelques pages seulement, cela peut être la meilleure approche. Pour supprimer un répertoire complet de contenu, utilisez la méthode robots.txt.

L'idée de “Enlever” Contenu

Cette sorte de tourne toute la notion de “suppression de contenu d'Internet” sur sa tête. Techniquement, si vous supprimez tous vos propres liens vers une page de votre site et que vous supprimez celui-ci de la recherche Google et de l'Internet Archive à l'aide de la technique robots.txt, la page est à toutes fins pratiques. “supprimé” de l'Internet. La bonne chose cependant est que s’il existe des liens vers la page, ces liens fonctionneront toujours et vous ne déclencherez pas d’erreurs 404 pour ces visiteurs..

C'est un plus “doux” approche permettant de supprimer du contenu d’Internet sans gâcher entièrement la popularité des liens existants de votre site sur Internet. En fin de compte, c'est à vous de décider comment gérer le contenu recueilli par les moteurs de recherche et Internet Archive, mais souvenez-vous toujours que, malgré ce que les gens disent à propos de la durée de vie des éléments mis en ligne, ils sont entièrement sous votre contrôle..

En savoir plus sur: Google, Google Search, SEO, Web Design, Webmaster Tools.

« 3 façons de préserver votre présence en ligne en prison 3 façons d’exécuter des jeux et des applications MS-DOS sous Linux »