Le PDG d’OpenAI, Sam Altman, s’exprimant lors du T-Mobile Capital Markets Day 2024, a annoncé une courbe d’amélioration de l’IA très prononcée grâce au modèle o1.

L’un des responsables de ChatGPT a indiqué que le modèle o1 en était au stade de raisonnement GPT-2 et a insisté sur la différence exponentielle entre la version preview du modèle o1 et la version finale à venir.

Au début de l’année, lors d’un séminaire à l’université de Stamford, Sam Altman a déclaré que la version actuelle de l’IA de l’entreprise était la « plus stupide » et qu’elle serait surpassée par les futures versions d’OpenAI. Sam Altman espère que o1 créera un saut générationnel dans les modèles d’IA.

o1 est centré sur le raisonnement avancé pour la résolution de problèmes, auquel Altman fait largement référence dans l’interview. Selon Altman, les utilisateurs ne voudront pas revenir en arrière, mais seulement aller de l’avant avec les nouveaux modèles, qui aboutiront finalement à un équivalent GPT-4, avant de dépasser les modèles existants.

Altman a décrit cinq niveaux de développement de l’IA, o1 se situant au niveau 2 (raisonneurs), et a laissé entendre que le niveau 3 (agents) pourrait suivre dans un court laps de temps. Dans le cadre de l’événement, Altman a déclaré : « Dans les mois à venir, vous verrez que les choses s’améliorent considérablement à mesure que nous passons de o1-preview à o1, dont nous avons partagé certaines mesures dans notre article de blog sur le lancement ».

o1, le prochain grand saut générationnel

L’article de lancement de o1 présente les prévisions que OpenAI considère comme le prochain grand saut générationnel pour les modèles d’apprentissage. L’article présente également la version allégée de la preview o1, o1-mini, qui est également 80 % moins chère que la preview.

Dans le cadre d’un processus de recherche sur o1, les régulateurs de sécurité et de sûreté de l’IA du Royaume-Uni et des États-Unis ont été impliqués dans le développement du nouveau modèle, et OpenAI a produit un cadre de sécurité.

Selon l’entreprise, ce cadre est un document évolutif destiné à « suivre, évaluer, prévoir et protéger contre les risques catastrophiques posés par des modèles de plus en plus puissants ». Dans le cadre de l’événement organisé par T-Mobile, Altman a réaffirmé que le modèle et le développement de ses capacités ne sont à aucun moment entraînés sur des données sensibles.

Les utilisateurs doivent apprivoiser les nouveaux modèles o1

Altman est convaincu que l’IA de résolution de problèmes sera rapidement adoptée par les utilisateurs, mais il a évoqué les difficultés rencontrées par les utilisateurs pour se familiariser avec les produits précédents d’OpenAI. Il a déclaré : « Les gens ont mis du temps à comprendre comment utiliser ChatGPT, et il nous a fallu du temps pour le construire. Il faudra du temps aux utilisateurs pour comprendre comment l’utiliser, ce qui est très différent des modèles GPT ».