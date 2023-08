by

by

Nvidia dévoile une puce d’IA plus puissante pour l’année prochaine

Nvidia dévoile une puce d'IA plus puissante pour l'année prochaine

Nvidia, déjà leader sur le marché des processeurs haut de gamme destinés à l’IA générative, va lancer une puce encore plus puissante pour répondre à la demande d’exécution de grands modèles d’IA.

La société a annoncé la disponibilité de la super puce GH200, qui, selon Nvidia, peut gérer « les charges de travail d’IA générative les plus complexes, couvrant de grands modèles de langage, des systèmes de recommandation et des bases de données vectorielles ».

Le GH200 aura le même GPU que le H100, actuellement l’offre la plus puissante et la plus populaire de Nvidia en matière d’IA, mais une capacité de mémoire triplée. L’entreprise a déclaré que les systèmes fonctionnant avec le GH200 commenceront au deuxième trimestre 2024.

Nvidia n’a pas révélé le prix du GH200 ; la gamme H100 se vend actuellement à environ 40 000 dollars.

Les modèles d’IA complexes nécessitent des GPU puissants afin que le système puisse effectuer les calculs nécessaires pour générer du texte ou une photo. L’exécution de ces modèles nécessite une puissance de traitement considérable et, même avec les puces H100 de Nvidia, certains doivent « répartir » les modèles entre d’autres GPU pour les faire fonctionner.

Pas pour Monsieur tout le monde

Nvidia détient un quasi-monopole sur les GPU capables de générer de l’IA. Les fournisseurs de cloud comme AWS, Azure et Google utilisent tous les GPU H100 Tensor Core de Nvidia et proposent des services pour aider leurs clients à mettre en place et à exécuter des projets utilisant de grands modèles de langage afin de se différencier.

Microsoft et Nvidia se sont également associés pour construire de nouveaux superordinateurs, même si Microsoft elle-même chercherait à fabriquer des puces d’IA.

Nvidia doit également faire face à la concurrence d’AMD, qui souhaite accélérer la production de son propre GPU d’IA au quatrième trimestre de cette année.