Technologie
OpenAI a développé un système de filigrane pour identifier les textes générés par ChatGPT, ainsi qu’un outil de détection de ce filigrane, qui est prêt depuis environ un an, selon des informations rapportées par un média. Cependant, la décision de le rendre public divise l’entreprise. D’un côté, cela pourrait être perçu comme une démarche responsable ; de l’autre, cela pourrait nuire à ses revenus.
Le filigrane d’OpenAI fonctionne en modifiant la manière dont le modèle prédit les mots et phrases les plus probables à suivre, créant ainsi un schéma détectable. Bien que cela soit une simplification, des explications plus détaillées sont disponibles, notamment celles de Google concernant le filigrane de texte de son modèle Gemini.
La possibilité de détecter des contenus rédigés par une intelligence artificielle pourrait s’avérer bénéfique pour les enseignants cherchant à dissuader les étudiants de soumettre des travaux rédigés par des IA. Selon le média, l’entreprise a constaté que l’ajout de filigrane n’affectait pas la qualité des textes produits par son chatbot. Une enquête commandée par OpenAI a révélé que « les personnes à travers le monde soutenaient l’idée d’un outil de détection d’IA par un rapport de quatre contre un ».
Suite à la publication de cet article, OpenAI a confirmé ses travaux sur le filigrane dans une mise à jour de son blog, repérée par un autre site d’actualités. Dans cette mise à jour, l’entreprise affirme que sa méthode est très précise (« 99,9 % d’efficacité », selon des documents consultés par le média) et résistante à des tentatives de contournement, comme le paraphrasage. Cependant, elle reconnaît que des techniques telles que la reformulation avec un autre modèle rendent la détection « triviale à contourner pour des acteurs malveillants ». OpenAI exprime également des préoccupations concernant la stigmatisation des outils d’IA, en particulier pour les locuteurs non natifs.
Il semble également qu’OpenAI soit inquiet que l’utilisation du filigrane puisse dissuader certains utilisateurs de ChatGPT, près de 30 % d’entre eux ayant indiqué qu’ils utiliseraient moins le logiciel si le filigrane était mis en place.
Malgré cela, certains employés estiment que le filigrane est une solution efficace. Cependant, face aux préoccupations des utilisateurs, certains ont suggéré d’explorer des méthodes « potentiellement moins controversées mais non prouvées ». Dans sa mise à jour, l’entreprise a mentionné qu’elle était « dans les premières étapes » de l’exploration de l’intégration de métadonnées. Elle a précisé qu’il était encore « trop tôt » pour évaluer l’efficacité de cette approche, mais que, grâce à une signature cryptographique, il n’y aurait pas de faux positifs.
Mise à jour du 4 août : Détails ajoutés d’une mise à jour du blog d’OpenAI.