Dire que ChatGPT, l’IA gratuite génératrice de texte développée par OpenAI, une startup basée à San Francisco, est un succès est un euphémisme. En décembre, ChatGPT comptait environ 100 millions d’utilisateurs actifs mensuels. Il a attiré l’attention des médias et a donné naissance à d’innombrables mèmes sur les médias sociaux. Mais OpenAI, en tant qu’entreprise devait monétiser ChatGPT d’une manière ou d’une autre, de peur que les investisseurs ne s’impatientent.

Elle a fait un pas dans cette direction en lançant un service premium, ChatGPT Plus, en février. Aujourd’hui, elle a fait un pas de plus en introduisant une API qui permettra à toute entreprise d’intégrer la technologie ChatGPT dans ses applications, sites Web, produits et services.

OpenAI a annoncé que ses modèles ChatGPT et Whisper sont désormais disponibles sur son API, offrant aux développeurs un accès à des capacités de langage et de synthèse vocale alimentées par l’IA.

Grâce à des optimisations à l’échelle du système, OpenAI a réussi à réduire le coût de ChatGPT de 90 % depuis décembre, et fait désormais profiter les utilisateurs de l’API de ces économies.

OpenAI estime que la meilleure façon de réaliser le plein potentiel de l’IA est de permettre à chacun de construire avec elle. Les changements annoncés aujourd’hui peuvent conduire à de nombreuses applications dont tout le monde peut bénéficier. Davantage d’entreprises peuvent tirer parti des capacités linguistiques et de reconnaissance vocale d’OpenAI pour développer des applications de nouvelle génération alimentées par ChatGPT et Whisper.

En outre, OpenAI a pris en compte les commentaires des développeurs et a apporté des modifications aux conditions de service de son API pour mieux répondre à leurs besoins.

API ChatGPT

OpenAI lance une nouvelle famille de modèles ChatGPT appelée gpt-3.5-turbo, au prix de 0,002 dollars par 1 000 jetons, ce qui la rend dix fois moins chère que les modèles GPT-3.5 existants. Ce modèle est idéal pour de nombreux cas d’utilisation hors chat et est le même dans le produit ChatGPT. OpenAI affirme que son API ChatGPT peut être utilisée à d’autres fins que la création d’une interface de chat alimentée par l’IA — bien qu’elle mette en avant plusieurs entreprises qui l’ont utilisée à cette fin, notamment la fonction My AI de Snap, annoncée plus tôt cette semaine.

Alors que les modèles GPT consomment traditionnellement du texte non structuré, représenté comme une séquence de jetons, les modèles ChatGPT consomment une séquence de messages avec des métadonnées. Cependant, l’entrée est rendue au modèle sous la forme d’une séquence de tokens que le modèle peut consommer. Selon la documentation d’OpenAI, « ChatGPT is great! » nécessite 6 jetons — son API le décompose en « Chat », « G », « PT », « is », « great » et « ! ». La société fournit un outil permettant de vérifier le nombre de jetons nécessaires pour interpréter une chaîne de texte et indique qu’en règle générale, « un jeton correspond généralement à ~4 caractères » en anglais.

Le modèle gpt-3.5-turbo utilise un nouveau format appelé Chat Markup Language (ChatML).

Mises à jour de ChatGPT

Il convient de noter que ce modèle n’est probablement pas le même que celui utilisé par Bing, que Microsoft a qualifié de « nouveau modèle de langage OpenAI de nouvelle génération » qui est « encore plus rapide, plus précis et plus performant » que ChatGPT et GPT-3.5.

OpenAI améliore continuellement ses modèles ChatGPT et vise à offrir ces mises à jour aux développeurs. Ceux qui utilisent le modèle gpt-3.5-turbo recevront toujours le modèle stable recommandé, tout en ayant la possibilité de choisir une version spécifique. OpenAI lance une nouvelle version appelée gpt-3.5-turbo-0301, qui bénéficiera d’un support jusqu’au 1er juin au moins, et une nouvelle version stable est attendue en avril.

Les développeurs peuvent trouver des mises à jour sur la page des modèles pour passer à la dernière version.

Instances dédiées

OpenAI propose désormais des instances dédiées pour les utilisateurs qui souhaitent avoir plus de contrôle sur les versions de leurs modèles et les performances de leur système. Par défaut, les demandes sont traitées sur une infrastructure de calcul partagée, et les utilisateurs paient par demande.

Cependant, avec les instances dédiées, les développeurs paient pour une période de temps afin d’allouer une infrastructure de calcul réservée exclusivement à leurs demandes. Les développeurs ont un contrôle total sur la charge de l’instance, la possibilité d’activer des limites de contexte plus longues et la possibilité d’épingler l’instantané du modèle.

Les instances dédiées peuvent être rentables pour les développeurs qui traitent plus de 450 millions de jetons par jour environ.

API Whisper

Si ChatGPT est susceptible de retenir l’attention, OpenAI a également annoncé une autre nouvelle API pour Whisper, son modèle de conversion de la parole en texte. La société indique que vous pouvez l’utiliser pour transcrire ou traduire des données audio à un coût de 0,006 dollar par minute. Techniquement, le modèle Whisper est open source, vous pouvez donc l’exécuter sur votre propre matériel sans rien payer. Cependant, OpenAI a probablement accès à du matériel plus puissant, donc si vous recherchez un délai d’exécution rapide ou si vous avez besoin de faire de la transcription sur des appareils moins puissants comme des téléphones, l’utilisation de l’API peut être la solution.

Une attention aux développeurs

OpenAI a apporté des changements spécifiques après avoir reçu des commentaires de développeurs. Voici quelques exemples de ces changements :

Ne pas utiliser les données soumises via l’API pour améliorer les services, y compris la formation des modèles, sauf si l’organisation y consent

L’établissement d’une politique de conservation des données par défaut de 30 jours, avec la possibilité d’une conservation plus stricte en fonction des besoins de l’utilisateur

Améliorer la documentation destinée aux développeurs

Simplifier ses conditions de service et ses politiques d’utilisation.

OpenAI reconnaît que la fourniture d’un service fiable est nécessaire pour garantir que l’IA profite à tous. À cette fin, OpenAI s’engage à améliorer son temps de fonctionnement au cours des prochains mois.

Alors que plusieurs développeurs ont trouvé des solutions de contournement pour inclure des services de chat dans leurs applications — notamment en utilisant l’API GPT standard d’OpenAI, qui est disponible depuis un certain temps — l’introduction d’une API ChatGPT officielle semble être le moment où les vannes s’ouvrent. Bien que de nombreuses entreprises travaillent sur leurs propres modèles de chatbot IA, ce genre de choses est totalement hors de portée de la plupart des développeurs. Maintenant, ils seront en mesure d’utiliser la technologie d’OpenAI.