OpenAI a opté pour une approche plus discrète lors de sa conférence DevDay 2024, privilégiant l’amélioration de ses outils existants plutôt que le lancement de nouveaux produits révolutionnaires. Cette stratégie témoigne d’une volonté de démocratiser l’accès à l’IA en misant sur son écosystème de développeurs.

En effet, contrairement à l’événement organisé l’année dernière dans un seul lieu et qui comprenait un discours liminaire du PDG Sam Altman, DevDay 2024 est plus qu’une simple journée, adoptant une approche mondiale avec des événements supplémentaires prévus à Londres le 30 octobre et à Singapour le 21 novembre.

L’événement de San Francisco, qui s’est tenu sur invitation uniquement et était fermé à la presse, a accueilli des intervenants sur scène qui ont fait des présentations techniques.

Quatre innovations majeures pour stimuler la créativité

OpenAI a dévoilé quatre innovations clés lors de l’événement DevDay 2024 : Prompt Caching, Vision Fine-Tuning, API Realtime et Model Distillation. Ces outils reflètent un changement de cap stratégique, OpenAI se positionnant désormais comme un facilitateur pour les développeurs plutôt qu’un concurrent direct dans le domaine des applications grand public.

Prompt Caching : une économie substantielle pour les développeurs

L’introduction du Prompt Caching est une avancée majeure pour les développeurs. Cette fonctionnalité permet de réduire les coûts et la latence en appliquant une réduction de 50 % sur les jetons d’entrée récemment traités par le modèle. Les applications qui réutilisent fréquemment le contexte pourront ainsi réaliser des économies considérables.

« Il y a deux ans, GPT-3 était à son apogée. Aujourd’hui, nous avons réduit les coûts de près de 1000x. Je ne connais aucune autre technologie ayant réduit ses coûts aussi drastiquement en si peu de temps », a déclaré Olivier Godement, responsable produit de la plateforme chez OpenAI.

Vision Fine-Tuning : l’IA visuelle personnalisée

Le Vision Fine-Tuning pour GPT-4o, le dernier modèle de langage d’OpenAI, permet aux développeurs de personnaliser les capacités de compréhension visuelle du modèle en utilisant des images et du texte. Cette fonctionnalité ouvre de nouvelles perspectives dans des domaines tels que les véhicules autonomes, l’imagerie médicale et la recherche visuelle.

Grab, une entreprise leader de livraison de repas et de VTC en Asie du Sud-Est, utilise déjà cette technologie pour améliorer ses services de cartographie. Avec seulement 100 exemples, Grab a amélioré la précision du comptage des voies de 20 % et la localisation des panneaux de limitation de vitesse de 13 %.

API Realtime : des interactions vocales plus fluides

L’API Realtime, désormais en version bêta publique, permet aux développeurs de créer des expériences multimodales à faible latence, notamment pour les applications de synthèse vocale. Les développeurs peuvent ainsi intégrer les commandes vocales de ChatGPT dans leurs applications.

OpenAI affirme que l’API Realtime simplifie le processus de création d’assistants vocaux. Auparavant, les développeurs devaient utiliser plusieurs modèles pour la reconnaissance vocale, le traitement de texte et la conversion de texte en parole. Désormais, ils peuvent gérer l’ensemble du processus avec un seul appel d’API.

OpenAI a présenté une version mise à jour de Wanderlust, une application de planification de voyages, pour illustrer le potentiel de l’API Realtime. Les utilisateurs peuvent désormais interagir vocalement avec l’application pour planifier leurs voyages, avec la possibilité d’interrompre la conversation en cours, comme dans un dialogue humain.

Model Distillation : l’IA accessible à tous

L’annonce la plus marquante est sans doute l’introduction du Model Distillation. Ce workflow intégré permet aux développeurs d’utiliser les sorties de modèles avancés comme o1-preview et GPT-4o pour améliorer les performances de modèles plus légers tels que GPT-4o mini.

Cette approche permet aux petites entreprises d’exploiter des capacités similaires à celles des modèles avancés sans supporter les mêmes coûts de calcul. Elle comble ainsi le fossé entre les systèmes d’IA de pointe, gourmands en ressources, et leurs homologues plus accessibles, mais moins performants.

OpenAI : vers un écosystème d’IA durable

Le DevDay 2024 d’OpenAI marque un tournant stratégique pour l’entreprise, qui privilégie le développement de son écosystème à des lancements de produits spectaculaires. Contrairement à l’année dernière, la DevDay n’a pas été diffusée en direct, même si OpenAI prévoit de publier du contenu ultérieurement sur sa chaîne YouTube. La programmation de l’événement comprend des sessions en petits groupes, des présentations de la communauté et des démonstrations. Mais le plus grand changement depuis l’année dernière est l’absence de discours d’ouverture du PDG de l’entreprise. Cette année, le discours d’ouverture a été assuré par l’équipe produit d’OpenAI.

Cette approche, moins sensationnelle pour le grand public, témoigne d’une compréhension mature des défis et des opportunités du secteur de l’IA. En améliorant l’efficacité et la rentabilité de ses modèles, OpenAI vise à maintenir son avantage concurrentiel tout en répondant aux préoccupations concernant l’intensité des ressources et l’impact environnemental.

En passant du statut de disrupteur à celui de fournisseur de plateforme, le succès d’OpenAI dépendra en grande partie de sa capacité à favoriser un écosystème de développeurs florissant. En fournissant des outils améliorés, des coûts réduits et un support accru, l’entreprise pose les bases d’une croissance et d’une stabilité à long terme dans le secteur de l’IA.

Bien que l’impact immédiat puisse être moins visible, cette stratégie pourrait à terme conduire à une adoption plus durable et plus répandue de l’IA dans de nombreux secteurs.