Après une valorisation record de 1 000 milliards de dollars et des rumeurs de pénurie de processeurs graphiques (GPU), Nvidia a annoncé aujourd’hui un tout nouveau produit pour les développeurs, leur permettant de créer leurs propres modèles d’IA générative à partir de zéro sur un PC ou une station de travail.

Baptisée AI Workbench, la nouvelle plateforme, annoncée aujourd’hui lors de la conférence annuelle SIGGRAPH (Special Interest Group on Computer Graphics and Interactive Techniques) à Los Angeles, fournit une interface utilisateur simple qui tourne sur la machine du développeur et se connecte à HuggingFace, Github, NVIDIA NGC, le portail Web d’entreprise de Nvidia, ainsi qu’à d’autres référentiels populaires de code d’IA open source ou disponible dans le commerce. Cela permet à un développeur d’y accéder facilement sans avoir à ouvrir plusieurs fenêtres de navigateur. Les développeurs peuvent alors importer le code modèle et le personnaliser à leur guise.

AI Workbench « élimine la complexité du démarrage d’un projet d’IA d’entreprise », selon le communiqué de presse de Nvidia.

Des fournisseurs d’infrastructure d’IA de premier plan, notamment Dell Technologies, Hewlett Packard Enterprise, HP Inc, Lambda, Lenovo et Supermicro, ont déjà adopté AI Workbench, selon Nvidia, et voient son potentiel pour stimuler leurs dernières générations de stations de travail de bureau multi-GPU, de stations de travail mobiles haut de gamme et de stations de travail virtuelles.

En outre, les développeurs équipés de PC ou de stations de travail RTX sous Windows ou Linux peuvent désormais tester et peaufiner des projets d’IA générative de niveau entreprise sur leurs systèmes RTX locaux et accéder à des ressources de centre de données et de cloud computing en fonction des besoins.

D’autres nouveautés à venir

Parallèlement à Workbench, Nvidia a annoncé la dernière version de sa plateforme logicielle d’entreprise, Nvidia AI Enterprise 4.0, qui vise à fournir aux entreprises des outils pour intégrer et déployer des modèles d’IA générative dans leurs opérations, mais de manière sécurisée, avec des connexions API stables.

Parmi les fonctionnalités de AI Enterprise 4.0 figurent Nvidia NeMo, un framework cloud-native qui permet une prise en charge de bout en bout pour la création et la personnalisation d’applications LLM, et le service de gestion Nvidia Triton, qui automatise et optimise les déploiements de production. Le système comprend également le logiciel de gestion de cluster Nvidia Base Command Manager Essentials, qui aide les entreprises à maximiser les performances et l’utilisation des serveurs AI dans les centres de données, les environnements multicloud et hybrides-cloud.

ServiceNow, Snowflake et Dell Technologies annoncent également des collaborations avec Nvidia pour de nouveaux produits d’IA.

N’oublions pas que l’IA peut s’emballer d’elle-même, comme dans les premiers jours de Bing Chat, et plus il y aura de gens qui créeront et entraîneront ces différents modèles, plus nous verrons de cas de comportements problématiques ou fous dans la nature. Mais si tout se passe bien, l’AI Workbench de Nvidia pourrait certainement simplifier le processus de déploiement d’une nouvelle IA générative pour un grand nombre d’entreprises.