Qu’est-ce que le duplicate content en rédaction web ?
Parmi les éléments à vérifier pour s’assurer de la crédibilité d’un site web figure le duplicate content. Le rédacteur web proposant des contenus doit faire des choix en harmonie avec les critères des moteurs de recherche. Ainsi, pour concevoir des contenus de qualité, il se doit de proposer des textes uniques et riches. Cela contribue non seulement à la notoriété de l’entreprise cliente, mais aussi à sa stratégie digitale.
- Que faut-il savoir sur le duplicate content ?
- Les différents types de duplicate content
- Conséquences négatives du contenu dupliqué pour le SEO
- Quelles dispositions prendre pour éviter le plagiat sur son site ?
Que faut-il savoir sur le duplicate content ?
Le duplicate content (en français : contenu dupliqué) est un concept qui s’utilise dans l’optimisation des moteurs de recherche. Il consiste à reproduire une partie ou l’ensemble du contenu d’une page web sur d’autres pages. Le texte dupliqué peut être identique ou contenir de légères modifications.
La duplication peut provenir d’une erreur du rédacteur ou d’une faille technique, mais elle peut aussi être volontaire. Dans tous les cas, le plagiat pose des problèmes juridiques et impacte négativement le référencement naturel des sites concernés. En effet, les moteurs de recherche mettent en avant l’originalité des contenus. La duplication nuit à l’indexation des sites.
Les différents types de duplicate content
Il existe différents types de duplicate content. Les cas que voici sont le plus souvent mentionnés :
- pages aux contenus identiques, mais comportant des méta titres et des méta descriptions différents ;
- pages aux contenus identiques et aux mêmes balises méta titres et méta descriptions. Ces pages sont aussi appelées « pages miroirs » ;
- les pages aux contenus différents, mais comportant les mêmes balises méta titres et méta descriptions ;
- de nombreux URL pointant vers une même page.
En outre, il existe deux catégories particulières de contenus dupliqués : le duplicate content sur un même site et le duplicate content externe.
Le duplicate content sur un même site
Le contenu repris sur un même site n’est pas la forme la plus grave considérée par les moteurs de recherche. Toutefois, il pose de sérieux problèmes quand le phénomène est répétitif. Il en résulte que le CMS fait apparaître des pages avec des adresses différentes, mais aux mêmes contenus.
Cela s’observe par exemple entre la version desktop et la version mobile d’un site. Dans ce cas, il n’est pas rare de voir les nouvelles URLs disputer la place aux anciennes. Il est important d’y remédier en adoptant des techniques adéquates. Utiliser des balises “rel=canonical” est une option parmi tant d’autres.
Le duplicate content sur des sites extérieurs
Le duplicate externe qui est le type de duplication de contenus d’un site vers un autre site est assez difficile à gérer. Il se passe surtout entre des sites d’e-commerce ou des marketplaces (comme Amazon et Cdiscount).
À ce niveau, le problème est beaucoup plus grave. Même des contenus qui traitent de produits identiques (des fiches de descriptions de produits) peuvent se retrouver accidentellement dans ce cas.
De plus, les rédacteurs qui publient les mêmes contenus sur différents sites ou blogs sont des auteurs de plagiat. Cette forme de duplicate content est punie par les moteurs de recherche. Le site en fraude ne doit pas s’attendre à ce que ce genre de contenus monte en compte en première place dans les SERP.
On rencontre généralement deux types de plagiat sur le web.
- Le contenu boilerplate
Il s’agit de tout texte original ayant servi à la rédaction de nouveaux contenus sans aucune modification apparente. Pour qu’un tel contenu soit identifié, Google opère des vérifications pour détecter des similitudes sur d’autres pages grâce à des corpus de phrases. Ce processus permet de remonter à l’auteur du contenu original.
Ce genre de contenus peut également être un élément spécifique perçu comme un duplicate content par Google.
- Le near-duplicate
Le near-duplicate prend en compte les textes copiés sur un site et ensuite modifiés. Google détecte ce type de contenus grâce à un algorithme destiné à cet effet. C’est pour cela que le rédacteur doit toujours vérifier le taux de plagiat de ses contenus et y remédier avant publication.
Conséquences négatives du contenu dupliqué pour le SEO
Le duplicate content peut engendrer deux conséquences majeures :
Nuisance à l’expérience des internautes
En principe, les résultats de recherche correspondent à des contenus uniques publiés sur des sites internet (dont la création se fait ici). Quand de nombreux sites ont des contenus identiques, cela ne facilite pas la tâche aux moteurs de recherche. L’expérience utilisateur est également entachée. Tomber deux fois sur le même contenu alors qu’on s’attend à trouver des informations différentes est tout aussi décevant.
Nuisance au référencement naturel de son site
Google est en mesure de détecter un duplicate content et d’identifier le site copié. Le risque pour le site copieur est qu’il perd en visibilité. Sa page se retrouve très loin dans les résultats de recherche. C’est un gros coup pour le trafic vers le site, et c’est la concurrence qui en profite. Il est donc nécessaire de concevoir des contenus web de qualité pour ne pas voir son site disparaître des résultats de recherche.
Quelles dispositions prendre pour éviter le plagiat sur son site ?
Pour ne pas nuire à la réputation de son entreprise, il faut adopter un certain nombre de comportements en tant que rédacteur ou éditeur de contenus web. Mettez en place un suivi permanent de l’ensemble des contenus de votre site. Il faudra aussi se montrer plus exigeant dans l’achat de contenus auprès d’un prestataire. N’acceptez pas les contenus qui ont servi sur d’autres sites.
Il est nécessaire de vérifier très souvent que le contenu de son site est à l’abri des auteurs de plagiat. Il suffit d’entrer dans la barre de recherche une partie de son texte entre guillemets et d’observer les résultats fournis par le moteur de recherche.
Enfin, auditez régulièrement vos pages pour prendre connaissance des erreurs des rédacteurs ou commises par le CMS lui-même.
Le duplicate content est prohibé en rédaction web. Il influe négativement non seulement sur l’image de l’entreprise, mais également sur son référencement naturel. Pour éviter cela, il est faut adopter les règles qui entourent l’optimisation des contenus web comme celles-ci. Le mot d’ordre en la matière et de donner la priorité aux contenus uniques et de qualité.