Duplicate content ou en français « duplication de contenu » est une problématique à laquelle sont confrontés tous les moteurs de recherche.
Ils ne peuvent se permettre de garder de multiples copies sur leurs serveurs d’un même contenu.
Des millions de nouvelles pages étant mises en ligne chaque jour, ils doivent coûte que coûte préserver leurs ressources en gérant au mieux leur espace de stockage ainsi que leur capacité de calcul.
Globalement, nous sommes dans une situation de duplication de contenu lorsqu’un moteur indexe plusieurs fois un même texte (portion ou texte complet) depuis des URLs différentes.
Il existe plusieurs formes de duplication, allant de la copie totale ou partielle d’une page sur deux sites différents, à l’auto duplication de contenu (sur un même site donc) qui est très courante.
Le contenu très proche (on parle de near duplicate) fait également l’objet d’attentions spécifiques.
Le moteur de recherche n’aura aucun intérêt à présenter à ses utilisateurs plusieurs résultats identiques ou très analogues. Il préférera diversifier ses propositions de contenus pertinents.