OpenAI, l’entreprise derrière ChatGPT, vient de franchir un nouveau cap dans le domaine de l’intelligence artificielle. Après des mois d’attente, OpenAI a finalement présenté une série de nouveaux modèles appelés « o1 » qui excellent dans le raisonnement avancé, et qui étaient auparavant appelés « Strawberry ».

Les nouveaux modèles comprennent o1, o1-preview et o1-mini. Les modèles o1-preview et o1-mini sont disponibles dès aujourd’hui pour les utilisateurs payants de ChatGPT Plus. À une date ultérieure, o1-mini sera également disponible pour les utilisateurs gratuits de ChatGPT.

Selon OpenAI, les modèles o1 ont besoin d’un certain temps de réflexion avant de générer une réponse, mais ils peuvent « raisonner à travers des tâches complexes » et résoudre des problèmes plus difficiles en mathématiques, en sciences et en codage. En outre, OpenAI affirme que les nouveaux modèles de raisonnement obtiennent des résultats équivalents à ceux d’étudiants en doctorat sur des sujets scientifiques difficiles.

Ainsi, bien que ces modèles ne puissent pas encore récupérer des informations en temps réel sur le Web ni utiliser des fichiers et des images pour le contexte, ils sont déjà capables de rivaliser avec des étudiants en doctorat en physique, chimie et biologie.

Pour vous donner un point de repère, le modèle OpenAI o1 a obtenu un score de 83 % dans un examen rigoureux comme l’Olympiade internationale de mathématiques (OIM), alors que GPT-4o n’a pu résoudre que 13 % des problèmes. Et dans la compétition Codeforces, le nouveau modèle o1 a atteint le 89e percentile alors que GPT-4o s’est contenté du 11e percentile. Dans le benchmark MMLU, OpenAI o1 a obtenu un score de 92,3 et dans le benchmark MATH, un score de 94,8. OpenAI affirme que dans les tâches nécessitant un raisonnement approfondi, o1 se rapproche des performances des experts humains, ce qui est assez significatif.

Des applications concrètes et prometteuses de OpenAI o1

OpenAI met en avant plusieurs exemples d’utilisation de ces nouveaux modèles d’IA dans la vie réelle, notamment l’annotation de données de séquençage cellulaire, la génération de formules mathématiques complexes pour l’optique quantique et l’exécution de workflows en plusieurs étapes.

En parallèle, l’entreprise propose également un modèle de raisonnement plus abordable et plus rapide, o1-mini, que les développeurs peuvent intégrer pour créer des applications nécessitant un raisonnement logique, mais pas forcément une connaissance approfondie du monde.

Une sécurité renforcée

OpenAI a également mis au point un nouveau système de formation à la sécurité pour permettre aux nouveaux modèles de « raisonner sur nos règles de sécurité en contexte », ce qui devrait leur permettre de les appliquer plus efficacement. L’entreprise affirme que ces modèles ont réussi des tests rigoureux de « jailbreaking » (tentatives de contournement des garde-fous) avec des scores bien supérieurs à ceux des modèles précédents.

Les modèles o1 ont été formés à l’aide d’une technique de chaîne de pensée par apprentissage par renforcement. Ils décomposent les étapes en étapes plus simples et abordent chaque étape par le biais de différentes stratégies jusqu’à ce qu’ils parviennent à la bonne conclusion. Par ailleurs, les modèles o1 ne prennent actuellement en charge que les entrées textuelles. Vous ne pouvez pas utiliser le modèle pour naviguer sur le web ou analyser des fichiers et des images.