Le numérique encourage-t-il le vol de contenu ?

2 avril 2013 | ACTUALITÉS, Questionner le numérique

« Copier / coller – Ctrl c + Ctrl v – Selection Copier / Selection Coller ».
Qui n’a jamais effectué cette manipulation sur un ordinateur ou un smartphone ?

Cette petite fonctionnalité très pratique aura permis à des milliards de contenus de changer de support. Mais tout aussi pratique qu’elle soit, cette manipulation se heurte à des limites légales ou morales. Elle a aussi des impacts insoupçonnés par nombre de ses utilisateurs.

Pour quelles pratiques ?

Vous copiez une photo sur votre ordinateur, vous allez l’imprimer et l’accrocher au-dessus de votre bureau ? Vous copiez l’article d’un journal pour le lire tranquillement chez vous le soir ?
Dans ces cas, personne ne vous reprochera quoi que ce soit. Excepté pour la musique ou les films, cet usage personnel est parfaitement toléré.

Vous copiez une photo sur Google image ou un texte sur un site ou livre pour les diffuser sur votre propre site ou livre ? Vous tombez là sous le coup de la loi.

Que dit la loi

« Toute représentation ou reproduction intégrale ou partielle faite sans le consentement de l’auteur ou de ses ayants droit ou ayants cause est illicite. Il en est de même pour la traduction, l’adaptation ou la transformation, l’arrangement ou la reproduction par un art ou un procédé quelconque. »

Légalement, seule est autorisée la courte citation. Sur le web, les webmasters tolèrent généralement une reprise très partielle à condition qu’un lien pointe vers la source complète (le contenu original).

Dans le cas contraire, la contrefaçon, le parasitisme commercial, la concurrence déloyale peuvent être invoqués et être punis de peine allant jusqu’à 3 ans de prison et trois cent mille euros d’amende.

La vision d’un référenceur

C’est plutôt sous cet angle que je développerai mon approche, car c’est mon métier et peu de gens sont au fait de l’impact des pratiques de copier/coller sur la visibilité de leur site sur les moteurs de recherche.

Pour faire simple, le référencement (SEO) consiste à rendre un site plus visible dans les résultats de recherche des moteurs (Google, Bing…).

Le contenu dupliqué

Les moteurs ont développé des algorithmes visant à pénaliser les contenus rédactionnels dits « dupliqués». On parle de contenu dupliqué lorsque celui-ci est accessible à partir de plusieurs URL (sur le même site, ou sur des sites différents).

Ces filtres sont très appréciés des utilisateurs. En effet, comment jugeriez-vous la qualité d’un moteur de recherche qui vous afficherai 10 fois le même contenu sur sa première page sous prétexte que celui-ci est diffusé sur 10 sites (noms de domaine) différents ? Votre expérience utilisateur serait décevante !

La qualité des textes

En parallèle, le contenu textuel qualitatif a prit une importance prépondérante en référencement. Les améliorations successives de l’algorithme de Google (portant les noms de « Panda » ou « Pinguin ») lui ont permit de dévaloriser, et donc de déclasser, les contenus de faible qualité (textes trop succincts, sémantique trop simple, manque de richesse). Les textes qualitatifs sont donc devenus un très bon moyen de sortir son épingle du jeu.

Vol de textes et référencement

Quoi de plus facile alors que d’aller chercher les contenus de qualité sur les autres sites pour les publier sur le sien ?

Le site pénalisé ne sera pas forcément celui que l’on croit.
La plupart des gens pensent que Google donnera la primeur au premier site qui aura diffusé une information. Mais il n’en est rien.

Google ne saura jamais qui est le premier, il sait seulement quand lui aura trouvé ce contenu en premier, la nuance est grande. D’autant plus que ses robots visitent bien plus souvent certains sites que d’autres.

Il fonctionne donc plutôt sur sa perception de l’autorité d’un site. Pour faire simple, le site d’un grand journal existant depuis 10 ans sera jugé comme ayant plus d’autorité que le petit site récent de la petite école locale.

Si un professeur de cette petite école publie un excellent article, une nouvelle méthode pédagogique par exemple, et que le grand journal copie intégralement ce contenu pour le publier sous son propre nom, le site original a toutes les chances d’être déclassé pour « contenu dupliqué ». Oui c’est injuste, mais c’est comme cela que fonctionne Google.

Voila donc pourquoi les référenceurs font particulièrement attention à la copie de leur contenu.

Tel est pris, qui croyait prendre !

Dans le sens contraire, si vous avez un petit site récent, mais aucune compétence rédactionnelle, la copie de textes sur d’autres sites pourra vous pénaliser de manière importante. Et ne croyez pas qu’il suffise de changer quelques mots en utilisant des synonymes. Google est parfaitement capable de déceler ce type de pratique.

Quelques cas récents

Notre agence est régulièrement plagiée, probablement car nos textes apparaissent fréquemment en première page de Google (le dernier cas en date). Un exemple qui démontre que le monde de l’entreprise est fortement impacté par ces pratiques.
Les blogs culinaires sont fréquemment plagiés que ce soit pour leurs photos ou leur contenu.

Mais ces vols ne s’arrêtent pas au web.

Nous avons tous entendu parler de devoir d’étudiants reprenant mot pour mot des articles entiers du célèbre site Wikipédia. Un professeur s’est même amusé à piéger ses élèves pour mettre en exergue ces pratiques.

Le numérique, un accélérateur de vol de contenu ?

Probablement, car la manipulation technique est bien plus simple que du temps de Gutemberg. Mais en contrepartie, les outils servant à identifier les textes copiés sont toujours plus nombreux et performants. On citera par exemple Copyscape, Noplagiat, Compilatio

Au fil du temps et des sanctions, il est donc probable que la tentation devienne moindre.

Quelle part de responsabilité pour Google ?

Les pratiques de classement de résultats de Google ont fortement encouragé la copie, car la production de contenu en volumes importants est devenue l’une des clés du positionnement sur ce moteur. La tentation est donc grande d’aller se servir gratuitement (si l’on omet les risques judiciaires) plutôt que de travailler sa propre production.

C’est aussi l’occasion de se poser la question de la restriction de l’information liée à la prédominance de Google en France (90% de la recherche). Ceux qui utiliseront parfois BING ou Qwant découvriront sans doute de nouveaux horizons qu’ils ne soupçonnaient pas, mais c’est peut-être l’occasion d’un autre sujet pour « Questionner le Numérique » !

En conclusion

De tout temps le plagiat a existé. Quelques affaires ont d’ailleurs fait parler d’elles dans les milieux littéraires il y a peu de temps. Mais les outils numériques l’ont sans doute rendu plus facile, plus rapide.

sylvain-richardLa question restante est de savoir si le risque de se faire prendre et les peines ou la perte de réputation encourues, rendent la pratique suffisamment risquée pour éviter la tentation ?

Une contribution de Sylvain RichardFondateur de l’agence SEO AxeNet

ligne-grise

Towards a Zero Trust philosophy: a break in continuity for application security

Cigref has published a report on the work of its "Zero Trust" working group, led by Thierry Borgel, CIO of the ICADE group. Zero Trust is a development of IT security principles and a philosophy that organisations will need to adopt to strengthen the security of their...

Vers une philosophie Zero Trust : une rupture dans la continuité pour la sécurité des applications

Le Cigref publie, sous forme de rapport, les travaux de son groupe de travail sur le thème « Zero Trust », piloté par Thierry BORGEL, DSI du groupe ICADE. Le Zero Trust est une évolution des principes de sécurité IT et une philosophie que les...

Strategies for migrating IT to cloud computing: a strategic adventure for enterprise

Cigref has published a report on the work of its working group on "Cloud migration strategies", led by Jean-Christophe Lalanne, EVP IT at Air France KLM, and Stéphane Rousseau, CIO at Eiffage. The migration paths to the cloud are multiple, with many starting and...