Quelles sont les erreurs les plus courantes provoquant de la duplication de contenu ?

La duplication de contenu est un problème qui touche la plupart des sites Web (on parle de 60%). Il est possible de parler de duplication, lorsqu’un contenu est indexable sous plusieurs URLs.

Par exemple, la page d’accueil d’un site Web est souvent accessible des 2 manières suivantes :

domaine.com

domaine.com/index.php (ou /accueil…)

Toutes les pages d’un site sont également régulièrement dupliquées via l’absence (ou l’ajout) du sous domaine www.

www.domaine.com/page.html

http://domaine.com/page.html

La sécurisation des sites (le « https ») réclamée à corps et à cri par Google depuis longtemps peut aussi, malgré vous renforcer le duplicate.

Ex : j’ai un site en https déclaré en https://www. Si je n’ai pas mis en place de redirections vers cette url principale, il sera aussi accessible en https (sans les www) et/ou en http (avec ou sans les www.). Donc au lieu de proposer aux moteurs 1 site propre et unique, vous pouvez (malgré vous) leur offrir jusque 4 fois le même ! Une belle (et courante) balle dans le pied.

Le troisième problème le plus fréquent est l’indexation du site via toutes les extensions (TLD) achetées :

www.domaine.fr

www.domaine.com

La encore, il faut rediriger (en 301, dite redirection permanente) toutes les noms de domaines annexes vers votre NDD principale afin d’éviter des doublons.

Ex : j’ai choisi un NDD .fr pour être visible prioritairement des français et pour protéger ma marque j’ai acheté les NDD en .com, .net (et/ou par exemple ma marque-ville ou pays.fr).

Il est indispensable que je redirige TOUS les NDD annexes vers mon NDD principal en 301. Donc si vous avez bien suivi, vers le NDD canonique donc généralement en https avec ou sans les www.

D’autres problèmes courants concernent l’indexation par Google de la version de pré-production/ recettage. (test et validation avant la mise en ligne) ou bien encore des URLs contenant des paramètres de tracking. Donc méfiance, il faut privilégier une version de pré-production uniquement accessible par login/mot de passe et donc invisible de Google. Un bon prestataire y pensera, pas un mauvais.

Enfin, les liens internes qui ne sont pas cohérents sur l’ensemble du site constituent une autre erreur grave et relativement pernicieuse. Donc ne créez pas du lien pour créer du lien en passant de la cuisine thaï aux boules de bowling. Il faut bien segmenter vos contenus. Aussi il faut éviter les liens rompus (404) ou autres problématiques mal vues par les moteurs.

Ainsi pour accéder par exemple à la fiche produit d’un site Ecommerce, il pourra être proposé plusieurs URL (attention à certains CMS) :

www.domaine.com/categorie/produit.html

www.domaine.com/produit.html

Les agences Web sont rarement sensibilisées ou ne serait-ce que sensibles à ces problématiques fines et chronophages. Le SEO ne passionne que rarement les développeurs.

Il convient donc d’être très attentif même si d’après Google, la duplication de contenu n’est pas un problème majeur…ou tout au moins pas une problématique de pénalité contrairement à la légende.

Logiciel SEO Oseox Monitoring