DeepSeek : Performances et efficacité qui met à mal NVIDIA

Le paysage de l’intelligence artificielle a été bouleversé par l’ascension fulgurante de DeepSeek, une startup chinoise dont l’assistant IA s’est hissé au sommet des classements de l’App Store d’Apple aux États-Unis.

L’application DeepSeek a détrôné ChatGPT d’OpenAI comme application gratuite la plus téléchargée, grâce à son modèle révolutionnaire R1 et à une approche innovante qui promet des avancées significatives à moindre coût.

L’ascension de DeepSeek et le modèle R1

L’application DeepSeek a vu ses téléchargements exploser après le lancement du modèle R1 le 20 janvier. Ce modèle, conçu pour résoudre des problèmes complexes, est présenté comme équivalent au modèle o1 d’OpenAI sur plusieurs benchmarks. R1 repose sur le modèle de langage étendu V3 de DeepSeek, dévoilé en décembre 2024, que l’entreprise affirme être comparable au GPT-4o et au Claude 3.5 Sonnet.

Alors que OpenAI aurait investi plus de 100 millions de dollars pour entraîner GPT-4, DeepSeek affirme avoir développé R1 pour moins de 6 millions de dollars. De plus, la startup indique n’avoir utilisé qu’environ 2 000 puces Nvidia pour entraîner V3, contre plus de 16 000 puces souvent nécessaires pour les modèles leaders du marché.

Ces affirmations, bien que non vérifiées, perturbent l’industrie et remettent en question les approches traditionnelles basées sur une infrastructure coûteuse.

Impact sur les marchés financiers

Les déclarations de DeepSeek ont secoué les marchés financiers, alimentant les inquiétudes concernant les coûts exorbitants nécessaires au développement de l’IA. Nvidia, fournisseur clé de puces pour l’entraînement des modèles IA, a vu son cours chuter de plus de 12 % avant l’ouverture des marchés. D’autres acteurs majeurs, comme Microsoft et Meta, ont également enregistré des baisses, suscitant des interrogations sur la viabilité des approches actuelles.

Cette perturbation intervient alors que l’industrie consacre des sommes colossales à l’infrastructure IA. Nvidia, Microsoft, OpenAI et Meta investissent collectivement plus de 500 milliards de dollars dans des centres de données IA, dont environ 100 milliards de dollars uniquement pour le projet Stargate de Nvidia. Les investisseurs se demandent désormais si ces approches coûteuses restent les meilleures à long terme.

Des solutions créatives face aux restrictions

L’ascension de DeepSeek est d’autant plus remarquable qu’elle s’est réalisée malgré les restrictions commerciales visant à limiter l’accès de la Chine aux puces avancées. Si les affirmations de DeepSeek sur ses performances élevées avec un matériel réduit sont exactes, cela témoigne d’innovations significatives pour contourner ces obstacles. La capacité de former des modèles compétitifs avec moins de ressources pourrait redéfinir le secteur et démocratiser le développement de l’IA.

Alors que l’application DeepSeek continue de dominer l’App Store, l’approche de l’entreprise suscite à la fois admiration et scepticisme. Le caractère open source de ses modèles a été salué pour sa transparence et son esprit de collaboration, le Dr Jim Fan, chercheur principal chez Nvidia, affirmant que DeepSeek « perpétue la mission initiale d’OpenAI ». Cependant, les affirmations de l’entreprise sont étroitement surveillées, et la viabilité à long terme de ses méthodes reste incertaine.

Pour l’instant, le modèle R1 de DeepSeek place la startup au centre des discussions sur l’IA, forçant les géants de l’industrie à réévaluer leurs stratégies et suscitant des débats sur l’avenir du développement de l’intelligence artificielle.