fermer
Intelligence Artificielle

OpenAI lance un outil pour détecter les textes générés par l’IA, notamment ChatGPT

lp logo 3.0 jpg
OpenAI lance un outil pour détecter les textes générés par l'IA, notamment ChatGPT

ChatGPT est devenu le sujet de conversation d’Internet ces derniers temps en raison de ses capacités d’écriture par l’IA, et la société qui en est à l’origine est OpenAI. Aujourd’hui, OpenAI présente un nouvel outil permettant de distinguer un texte écrit par un humain d’un texte généré par l’IA, en utilisant un classificateur de texte IA basé sur le Web qui prédit la probabilité qu’un texte soit écrit par un humain ou par une IA.

Microsoft a récemment fait un investissement pluriannuel de plusieurs milliards de dollars dans OpenAI, prolongeant ainsi son partenariat avec la société.

Nouveau classificateur de texte d’IA

OpenAI affirme avoir formé un classificateur pour différencier les textes écrits par des humains de ceux générés par l’IA à partir de diverses sources. L’entreprise reconnaît qu’il n’est pas possible de détecter avec certitude tous les textes écrits par l’IA, mais le classificateur devrait permettre de contrer les fausses allégations d’origine humaine pour les textes générés par l’IA, comme dans la diffusion de fausses informations, la malhonnêteté académique ou les chatbots IA trompeurs se faisant passer pour des humains.

OpenAI souligne également que le classificateur a des limites et qu’il ne faut pas s’y fier uniquement. Il doit être utilisé en complément d’autres méthodes pour déterminer l’origine d’un texte.

OpenAI souligne les limites suivantes de son classificateur :

  • Le classificateur n’est pas fiable pour les textes courts (moins de 1 000 caractères). Même les textes plus longs peuvent parfois être mal identifiés
  • Un texte écrit par un humain peut être incorrectement identifié comme étant écrit par l’IA, mais en toute confiance
  • Il est recommandé de n’utiliser le classificateur qu’avec du texte anglais et ses performances peuvent être médiocres dans d’autres langues et pour du code
  • Le classificateur ne peut pas distinguer un texte très prévisible. Par exemple, il ne peut pas déterminer si une liste des 1 000 premiers nombres premiers a été écrite par un humain ou par une IA, car la réponse est toujours la même
  • Le texte écrit par l’IA peut être modifié pour éviter d’être détecté par le classificateur, et on ignore si la détection présente un avantage à long terme, car le classificateur peut être mis à jour
  • Les classificateurs basés sur des réseaux neuronaux peuvent être mal calibrés et faire des prédictions incorrectes extrêmement fiables pour des entrées très différentes de leurs données d’apprentissage

OpenAI AI Text Classifier Result jpg

Formation du classificateur

OpenAI explique que son classificateur est un modèle linguistique affiné sur un ensemble de données constitué de paires de textes écrits par des humains et générés par l’IA sur des sujets analogues. Les données ont été collectées à partir de diverses sources censées être écrites par des humains, telles que les données de pré-entraînement d’InstructGPT et les réponses générées par des humains à des invites.

OpenAI reconnaît l’importance de l’identification des textes générés par l’IA et son impact sur l’éducation. Elle a créé un guide de ressources pour les enseignants sur l’utilisation de ChatGPT, y compris ses capacités et ses limites. OpenAI s’engage auprès des enseignants aux États-Unis pour mieux comprendre leurs expériences et recueillir leurs commentaires.

L’entreprise invite les personnes directement concernées par ces questions, notamment les enseignants, les étudiants et les prestataires de services éducatifs, à lui faire part de leurs commentaires et à lui fournir toute ressource utile dont ils pourraient disposer. Dans le cadre de sa mission, l’entreprise vise à déployer de grands modèles linguistiques de manière sûre et responsable, en étroite collaboration avec les communautés touchées.

Essayer vous-même AI Text Classifier en allant ici.

Lors de l’annonce de ce nouvel outil d’IA, OpenAI a indiqué que :

L’utilisation que nous souhaitons faire de l’AI Text Classifier est d’encourager la conversation sur la distinction entre le contenu écrit par l’homme et le contenu généré par l’IA. Les résultats peuvent aider à déterminer si un document a été généré par l’IA, mais ne doivent pas être la seule preuve. Le modèle a été entraîné sur des textes écrits par des humains provenant de sources diverses, qui ne sont pas nécessairement représentatives de tous les types de textes écrits par des humains.

Tags : ChatGPTIAOpenAI
Yohann Poiron

The author Yohann Poiron

J’ai fondé le BlogNT en 2010. Autodidacte en matière de développement de sites en PHP, j’ai toujours poussé ma curiosité sur les sujets et les actualités du Web. Je suis actuellement engagé en tant qu’architecte interopérabilité.