Le Text and Data Mining (TDM) est le processus d’extraction automatique d’informations à partir de grands ensembles de textes et de données à l’aide d’outils et de techniques logiciels. Le TDM est utilisé dans de nombreux domaines, notamment la recherche universitaire, la veille économique et le journalisme de données, pour découvrir de nouvelles connaissances et perspectives.
Utilisé par les intelligences artificielles, pour « aspirer » toujours plus de contenu, le TDM peut poser des problèmes de droit d’auteurs (copyright) au niveau des ressources de votre site web. Ainsi les textes, images, vidéos, fichiers, pages web peuvent se retrouver sans votre consentement dans une base de données d’intelligence artificielle.
Pour résoudre ce problème, un protocole existe : le TDM Reservation Protocol. J’ai intégré ce protocole sous une extension WordPress officielle afin de permettre à chaque utilisateur de pouvoir protéger les ressources de son site, sans connaissance requise.
TDMRep est une intégration plugin WordPress qui vous permet de contrôler la façon dont les robots et les intelligences artificielles (IA) comme Bard, Mistral AI, ChatGPT et Googlebot accèdent à votre contenu. Il s’intègre au protocole TDM Reservation Protocol pour vous aider à protéger vos droits d’auteur et à promouvoir l’innovation.
Imaginez tout le travail que vous avez investi dans la création et l’organisation du contenu de votre site web. Vous souhaitez le partager avec le monde entier, mais vous voulez aussi contrôler qui peut copier et utiliser votre travail.
C’est là que TDMRep intervient ! Ce plugin simple pour WordPress vous permet de gérer l’accès des robots et des IA à votre contenu en intégrant directement le protocole TDM Reservation Protocol sur votre site web.
Imaginez TDMRep comme un ensemble d’instructions destinées aux robots qui visitent votre site web. Vous pouvez leur dire exactement ce que vous voulez qu’ils fassent avec votre contenu, par exemple :
Il existe deux raisons principales pour lesquelles TDMRep est important :
En résumé, TDMRep est un outil précieux pour quiconque souhaite contrôler l’accès à son contenu et protéger ses droits d’auteur.
Rendez-vous directement sur l’extension WordPress et suivez les étapes d’installation pour protéger votre site contre le Text and Data Mining des robots et des IAs. Pour plus d’information sur cet article, contactez-moi !
Le protocole TDM Reservation Protocol (TDMRep) est un standard web simple et pratique qui permet aux titulaires de droits d’exprimer la réserve de leurs droits relatifs au Text and Data Mining (TDM) appliqué au contenu web accessible légalement. Il facilite également la découverte des politiques de licence TDM associées à ce contenu.
– Ajoute des en-têtes HTTP aux réponses web pour indiquer si le TDM est autorisé (0) ou non (1).
– Propose un fichier tdmrep.json
optionnel pour des politiques TDM plus détaillées.
– Permet l’utilisation de balises HTML tdm-reservation
et tdm-policy
pour des règles spécifiques aux pages
TDMRep offre plusieurs avantages, notamment :
– Protège les droits d’auteur: Les titulaires de droits peuvent utiliser TDMRep pour indiquer que leur contenu ne peut pas être extrait par le TDM.
– Favorise l’innovation responsable: TDMRep permet aux robots et aux IA d’accéder au contenu avec des restrictions claires, ce qui peut stimuler la recherche et le développement de nouvelles technologies.
– Améliore la transparence: TDMRep oblige les sites web à divulguer leurs politiques TDM, ce qui donne aux utilisateurs plus d’informations sur la façon dont leurs données sont utilisées.
TDMRep est encore un protocole relativement nouveau, mais il est déjà utilisé par un certain nombre de sites web et d’organisations, notamment :
– Ouest-France: Un grand journal français qui utilise TDMRep pour protéger ses articles de presse.
– Mistral AI: Une société française d’IA qui utilise TDMRep pour accéder au contenu web de manière responsable.
– Le Centre Pompidou: Un musée français qui utilise TDMRep pour protéger ses collections numériques.
Vous pouvez en savoir plus sur TDMRep en consultant les ressources suivantes :
– Spécification TDMRep : https://www.w3.org/community/reports/tdmrep/CG-FINAL-tdmrep-20240202/
– Site web TDMRep : https://www.w3.org/community/reports/tdmrep/CG-FINAL-tdmrep-20240202/
– Article sur TDMRep sur le blog Alyze : https://github.com/w3c/tdm-reservation-protocol/blob/main/docs/use-cases.md