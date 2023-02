ChatGPT est devenu le sujet de conversation d’Internet ces derniers temps en raison de ses capacités d’écriture par l’IA, et la société qui en est à l’origine est OpenAI. Aujourd’hui, OpenAI présente un nouvel outil permettant de distinguer un texte écrit par un humain d’un texte généré par l’IA, en utilisant un classificateur de texte IA basé sur le Web qui prédit la probabilité qu’un texte soit écrit par un humain ou par une IA.

Microsoft a récemment fait un investissement pluriannuel de plusieurs milliards de dollars dans OpenAI, prolongeant ainsi son partenariat avec la société.

We’re developing a new tool to help distinguish between AI-written and human-written text. We’re releasing an initial version to collect feedback and hope to share improved methods in the future. https://t.co/4dQE3dX6vX — OpenAI (@OpenAI) January 31, 2023

Nouveau classificateur de texte d’IA

OpenAI affirme avoir formé un classificateur pour différencier les textes écrits par des humains de ceux générés par l’IA à partir de diverses sources. L’entreprise reconnaît qu’il n’est pas possible de détecter avec certitude tous les textes écrits par l’IA, mais le classificateur devrait permettre de contrer les fausses allégations d’origine humaine pour les textes générés par l’IA, comme dans la diffusion de fausses informations, la malhonnêteté académique ou les chatbots IA trompeurs se faisant passer pour des humains.

OpenAI souligne également que le classificateur a des limites et qu’il ne faut pas s’y fier uniquement. Il doit être utilisé en complément d’autres méthodes pour déterminer l’origine d’un texte.

OpenAI souligne les limites suivantes de son classificateur :

Le classificateur n’est pas fiable pour les textes courts (moins de 1 000 caractères). Même les textes plus longs peuvent parfois être mal identifiés

Un texte écrit par un humain peut être incorrectement identifié comme étant écrit par l’IA, mais en toute confiance

Il est recommandé de n’utiliser le classificateur qu’avec du texte anglais et ses performances peuvent être médiocres dans d’autres langues et pour du code

Le classificateur ne peut pas distinguer un texte très prévisible. Par exemple, il ne peut pas déterminer si une liste des 1 000 premiers nombres premiers a été écrite par un humain ou par une IA, car la réponse est toujours la même

Le texte écrit par l’IA peut être modifié pour éviter d’être détecté par le classificateur, et on ignore si la détection présente un avantage à long terme, car le classificateur peut être mis à jour

Les classificateurs basés sur des réseaux neuronaux peuvent être mal calibrés et faire des prédictions incorrectes extrêmement fiables pour des entrées très différentes de leurs données d’apprentissage

Formation du classificateur

OpenAI explique que son classificateur est un modèle linguistique affiné sur un ensemble de données constitué de paires de textes écrits par des humains et générés par l’IA sur des sujets analogues. Les données ont été collectées à partir de diverses sources censées être écrites par des humains, telles que les données de pré-entraînement d’InstructGPT et les réponses générées par des humains à des invites.

OpenAI reconnaît l’importance de l’identification des textes générés par l’IA et son impact sur l’éducation. Elle a créé un guide de ressources pour les enseignants sur l’utilisation de ChatGPT, y compris ses capacités et ses limites. OpenAI s’engage auprès des enseignants aux États-Unis pour mieux comprendre leurs expériences et recueillir leurs commentaires.

L’entreprise invite les personnes directement concernées par ces questions, notamment les enseignants, les étudiants et les prestataires de services éducatifs, à lui faire part de leurs commentaires et à lui fournir toute ressource utile dont ils pourraient disposer. Dans le cadre de sa mission, l’entreprise vise à déployer de grands modèles linguistiques de manière sûre et responsable, en étroite collaboration avec les communautés touchées.

Essayer vous-même AI Text Classifier en allant ici.

Lors de l’annonce de ce nouvel outil d’IA, OpenAI a indiqué que :