Contenu dupliqué

Lorsque vous créez un contenu unique et de qualité, Google y voit un avantage. Qu’est-ce qui s’oppose au contenu unique ? Le contenu dupliqué. Dans cet article, nous expliquons ce qu’est le contenu dupliqué et quel est son impact sur le référencement d’un site web.

Qu’est-ce que le contenu dupliqué ?

Le contenu dupliqué est littéralement traduit de l’anglais : duplicate content. Le contenu dupliqué interne se produit souvent au sein d’un site web pour des raisons techniques.

C’est le cas, par exemple, lorsqu’un site web comporte à la fois une version http et une version https. Dans ce cas, le site web est déjà complètement dupliqué, ce qui pose de sérieux problèmes à Google. C’est également le cas lorsque le site web possède à la fois le nom www. en tant que non-www. en direct.

L’impact du contenu dupliqué sur le référencement

L’une de vos pages contient-elle un contenu qui a également été publié sur une autre page (à l’intérieur ou à l’extérieur de votre site web) ? Lorsque c’est le cas, cela peut envoyer un signal de classement négatif à Google. Google exerce un contrôle strict sur ce point. La raison ? Google ne veut que du contenu unique et de qualité dans les moteurs de recherche.

Le moteur de recherche a été créé à l’origine pour fournir aux visiteurs les réponses les meilleures et les plus rapides à leurs questions. Lorsque l’index de Google contient un grand nombre de contenus dupliqués, cela est impossible. Google sanctionne également le contenu dupliqué. Lorsque vous copiez le travail de quelqu’un d’autre et que vous le copiez aveuglément sur votre site web, Google le pénalise plus durement que lorsque cela se produit à l’intérieur d’un site web.

 

Comment éviter le contenu dupliqué ?

Une solution pour les pages qui contiennent du contenu dupliqué est d’utiliser la « balise canonique ». Vous indiquez ainsi à Google quelle page doit être mieux classée. De cette manière, vous pouvez être sûr que Google fera le bon choix et que la bonne page sera mieux classée.

Cas courants de contenu dupliqué

Le contenu dupliqué se réfère à un contenu substantiellement similaire ou identique qui apparaît sur plus d’une adresse web (URL). Cela peut se produire à la fois au sein d’un site web (contenu dupliqué interne) et sur plusieurs sites web (contenu dupliqué externe). Voici quelques formes courantes de contenu dupliqué :

  1. Versions WWW et non WWW: Lorsque la même page est accessible via www.example.com et example.com sans que l’une des versions soit redirigée vers l’autre.
  2. HTTP vs. HTTPSLe contenu d’un site web est disponible à la fois sur les versions sécurisées (HTTPS) et non sécurisées (HTTP) d’un site web.
  3. Barre oblique à la fin : pages accessibles avec ou sans barre oblique à la fin de l’URL (par exemple, example.com/about et example.com/about/).
  4. Paramètres d’URL: lorsque des paramètres d’URL tels que des identifiants de session ou des codes de suivi rendent le contenu accessible à partir de plusieurs URL.
  5. Versions imprimables : Un contenu disponible à la fois en version simple et en version imprimable peut être considéré comme un doublon si des mesures appropriées ne sont pas prises.
  6. Pages de produits: Les sites de commerce électronique ont souvent plusieurs URL menant au même produit, par exemple en raison de choix de couleurs ou de tailles différentes.
  7. Syndication de contenu: un contenu publié à l’origine sur un site web et reproduit ensuite sur d’autres sites peut donner lieu à un contenu dupliqué externe.
  8. URL spécifiques à une langue ou à une région: Les sites web qui proposent plusieurs versions linguistiques ou régionales d’une même page peuvent créer par inadvertance du contenu dupliqué s’ils ne sont pas configurés correctement avec des balises hreflang ou d’autres méthodes.
  9. Pages d’archives et de catégorisation: Les blogs ou les sites d’information peuvent afficher des articles identiques sur les pages des articles individuels et sur les pages d’archives ou de catégories.
  10. Versions mobile et de bureau: Avant que le responsive design ne devienne monnaie courante, les sites web avaient souvent des versions mobiles séparées (par exemple m.example.com) qui contenaient le même contenu que leur équivalent de bureau.

Le contenu dupliqué peut être problématique pour le référencement, car il peut créer une confusion dans les moteurs de recherche quant à la version du contenu qui doit être indexée et à la manière dont les liens doivent être distribués. L’utilisation correcte des redirections 301, des balises canoniques et des balises hreflang est une des techniques permettant de résoudre ces problèmes.

Fixer des priorités

En ce qui concerne la correction du contenu dupliqué, j’essaie toujours d’établir un ordre de priorité. Pour ce faire, je divise une feuille de calcul de la manière suivante (avec une explication pour chaque colonne ci-dessous) :

URLTrafic SEOMotsDuplicata (%)Mots en doublePertinence
  • URL : J’entre ici l’URL de la page dont il est question.
  • Trafic SEO : C’est ici que j’entre le trafic SEO mensuel (je filtre généralement ce trafic de haut en bas, pour obtenir une image immédiate des pages importantes pour le SEO). Pour être plus complet, vous pouvez ajouter le nombre de conversions.
  • Mots : Le nombre total de mots sur la page (créer brièvement une exportation à partir de Screaming Frog).
  • Duplicate (%) : C’est ici que j’entre le pourcentage de contenu dupliqué (nombre de mots dupliqués). Ceci sans le menu principal/de bas de page, qui est toujours dupliqué bien sûr.
  • Mots en double : C’est ici que j’indique le nombre de mots de contenu dupliqué par page.
  • Pertinence : J’indique ici le degré de pertinence de la page pour notre entreprise (élevé/moyen/faible). À partir de cette colonne, il est facile de déterminer si une page est réellement pertinente pour nous. Il arrive que des pages reçoivent beaucoup de trafic mais ne génèrent pas de conversions. Cela permet en outre d’éviter que ces pages ne soient immédiatement classées par ordre de priorité.

Souvent, la mise en place d’un système de duplicate content est un projet de grande envergure, d’où l’importance de fixer les bonnes priorités. Lorsque vous commencez par les priorités les plus importantes, vous pouvez immédiatement avoir le plus grand impact sur la facilité de recherche organique.

Contenu dupliqué sur des pages clés

Sur les pages les plus importantes d’un site web pour le référencement (souvent environ 5 pages), j’essaie vraiment de faire en sorte qu’il n’y ait pas de contenu dupliqué. Pensez à optimiser les éléments suivants :

  • Faites en sorte que les appels à l’action soient propres à la page (oui, même l’image utilisée dans l’appel à l’action).
  • Pas de photos d’archives (je ne le ferais pas dans le cadre d’un voyage de référencement de toute façon).
  • Rendre les revues ou le portefeuille uniques. N’utilisez donc pas les mêmes éléments de portefeuille sur ces pages lorsqu’ils sont également utilisés sur la page de portefeuille.
  • Réécrivez les USP sur ces pages importantes pour qu’elles soient également uniques. Pensez également aux icônes utilisées à cette fin.
  • Faites en sorte que les images de bannière ou d’arrière-plan soient uniques en leur genre.

Soyez minutieux, cela représente encore ces pourcentages supplémentaires d’optimisation pour ces pages d’atterrissage importantes. Il ne vous aidera pas à passer de la troisième page à la première, mais il peut faire la différence entre une position 3 et une position 2.

Mes conseils

Dans de nombreux cas, le contenu dupliqué est créé par une erreur technique interne. Google est très conciliant à cet égard et, dans de nombreux cas, se contente d’afficher l’une des versions. La version jugée bonne par Google est affichée en tête pour le mot-clé pour lequel elle est classée.

Cependant, dans certains cas, Google ne voit pas exactement quelle page devrait être affichée en premier. Dans ce cas, c’est la page qui a le plus d’autorité (lire : le rang de page le plus élevé) qui est affichée. Dans de nombreux cas, il ne s’agit pas exactement de la page que le propriétaire souhaite afficher pour le mot-clé en question. Même si un site web contient beaucoup de contenu dupliqué, il peut encore être bien classé.

En tant que consultants en référencement, nous prenons toujours en compte le contenu dupliqué. Tous les contenus que nous avons rédigés sont uniques. De même, nous accordons une attention toute particulière au contenu dupliqué sur notre site.

Il est donc recommandé de consacrer suffisamment de temps à la création d’un contenu unique et de qualité. Cela porte ses fruits !


Questions fréquemment posées

Qu’est-ce que le contenu dupliqué ?

Duplicate content signifie contenu dupliqué en néerlandais. Cela peut se produire, par exemple, si un site web a une version http et une version https ouvertes en même temps. Si c’est le cas, vous êtes complètement dupliqué et cela peut poser des problèmes à Google. Google vérifie strictement tout contenu dupliqué possible.

Quel est l’impact du contenu dupliqué sur le référencement ?

Avant tout, Google souhaite que le contenu des moteurs de recherche soit unique et de bonne qualité. Si vous avez du contenu dupliqué, cela enverra un signal de classement négatif et sera pénalisé par Google. Un moteur de recherche doit donner aux visiteurs des réponses à toutes leurs questions le plus rapidement possible.

Senior SEO-specialist

Ralf van Veen

Senior SEO-specialist
Five stars
Mon client m'a donné 5.0 sur Google sur 78 avis

Je travaille depuis 12 ans en tant que spécialiste SEO indépendant pour des entreprises (néerlandaises et l'étrangèr) qui souhaitent obtenir un meilleur classement dans Google de manière durable. Au cours de cette période, j'ai conseillé des marques de premier plan, mis en place des campagnes internationales de référencement à grande échelle et coaché des équipes de développement mondiales dans le domaine de l'optimisation des moteurs de recherche.

Grâce à cette vaste expérience dans le domaine de l'optimisation des moteurs de recherche, j'ai développé le cours d'optimisation des moteurs de recherche et j'ai aidé des centaines d'entreprises à améliorer leur visibilité dans Google de manière durable et transparente. Pour cela, vous pouvez consulter mon portfolio, références et mes collaborations.

Cet article a été initialement publié le 28 mars 2024. La dernière mise à jour de cet article date du 28 mars 2024. Le contenu de cette page a été rédigé et approuvé par Ralf van Veen. Pour en savoir plus sur la création de mes articles, consultez mes lignes directrices éditoriales.