Le duplicate content
« Duplicate content » est le terme utilisé par Google pour désigner des textes similaires entre deux ou plusieurs « pages » sur le web (d’un même site ou de sites différents).
Google distingue 3 « duplicate content » différents :
-
Les pages complètement identiques (codes totalement identiques) sur 2 noms de domaines différents (sites miroirs) : Google semble désindexer les pages qui ont le plus faible PageRank estimant que ce n’est pas l’auteur premier.
-
Pages identiques, mais ayant des balises < TITLE> et <DESCRIPTION> différentes : Souvent le cas du plagiat. Aucune page n’est réellement désindexée mais lorsque les résultats de la recherche correspondent au texte commun aux différentes pages, Google donnera comme résultat la page ayant le plus fort PageRank ou ayant été indexée la première par ses robots. Les autres pages seront visibles en cliquant sur « relancer la recherche en incluant les pages ignorées » : ce que peu de personnes font !
-
Pages différentes, mais ayant les mêmes balises< TITLE> et <DESCRIPTION> : C’est rarement le cas du plagiat mais surtout le cas de vos pages entre elles sur votre site internet ! Les pages ne sont souvent pas indexées par Google !
Attention, la « page » ne veut pas dire le site dans son ensemble. De plus, désindexé ou non-indexé, ne veut pas dire blacklisté !
Vous l’aurez compris, si votre « page » est plus populaire et plus ancienne que celle du copieur, vous n’avez pas de souci à vous faire pour le référencement de celle-ci, bien que ce soit tout de même frustrant d’être plagié(e) !
Vous aurez aussi compris qu’il est inutile de copier le texte d’un autre site sur le web ! A moins que celui-ci soit inclus dans une balise <cite></cite> qui permet à Google de reconnaitre le texte comme une citation et que la source soit précisée.
De même, lorsque vous proposez à la publication la présentation de votre agence ou un shooting d’inspiration à plusieurs blogs, sites ou annuaires différents, veillez à fournir des textes différents pour chacun des sites !
Comment savoir si vous êtes victime de plagiat sur le web ?
Voici un outil efficace pour savoir si vous êtes victime de « duplicate content » :
http://www.positeo.com/check-duplicate-content/
Cette application permet de scruter tout le web à la recherche d’une page similaire à celle testée. Attention : il faut tester chaque page de votre site et pas uniquement votre page d’accueil !
Que faire en cas de plagiat ?
Les textes que vous avez vous-même rédigés sont protégés par le code de la propriété intellectuelle, sans qu’il n’est besoin de le préciser avec un signe particulier (type copyright), bien qu’il soit tout de même utile de le mentionner (en bas de page par exemple).
Malheureusement, un mail rappelant la loi à votre « plagieur » n’est souvent pas vraiment efficace car il sait qu’il serait bien long, fastidieux et inutile pour vous d’aller plus loin.
Une technique qui marche donc assez bien est de lui rappeler la définition du « Duplicate content », car aucune entreprise n’a envie de voir ses pages désindexées par Google et c’est une pénalisation plus rapide que la justice !
Dans un prochain article nous aborderons plus précisément le plagiat et les recours juridiques.
Last Updated on 31 mars 2022 by IWI