La course mondiale à l’intelligence artificielle s’accélère. DeepSeek s’apprête à lancer son modèle de nouvelle génération, DeepSeek R2, entre le 15 et le 30 août 2025, soit quelques jours seulement après la sortie de GPT-5, inclut dans son chatbot ChatGPT.

Les premiers détails, révélés lors d’une interaction avec le propre modèle IA de la société, laissent entrevoir une avancée technologique majeure.

DeepSeek R2 : Une architecture Mixture of Experts encore plus poussée

DeepSeek R2 adoptera une architecture Mixture of Experts (MoE) de nouvelle génération, associée à un gating network plus intelligent pour mieux gérer les charges lourdes d’inférence.

Selon des sources proches du développement, le modèle pourrait atteindre 1,2 trillion de paramètres, presque le double de DeepSeek R1 (671 milliards), tout en restant en deçà des 1,8 trillion+ de ChatGPT-4 et GPT-5.

100 % entraîné sur des puces chinoises Huawei

Dans le cadre de la stratégie chinoise d’autosuffisance en IA, DeepSeek R2 a été entièrement entraîné sur les puces Huawei Ascend 910B. Le cluster Huawei, affichant 512 PFLOPS de performance FP16 à 82 % d’utilisation, atteindrait 91 % des performances d’un cluster Nvidia A100.

Le gain stratégique est de se libérer de la dépendance aux GPU américains et réduire considérablement les coûts d’entraînement. Résultat : 97 % de réduction du coût de formation par rapport à GPT-4, grâce à l’utilisation de matériel local et de techniques d’optimisation avancées.

Des prix agressifs pour bousculer OpenAI et Anthropic

Avec des coûts réduits, les analystes s’attendent à ce que DeepSeek propose un accès API à prix cassés, de quoi perturber les modèles économiques actuels dominés par OpenAI et Anthropic.

L’annonce a déjà eu un effet immédiat sur les marchés : l’action du fabricant chinois de puces Cambricon a bondi de 20 %, propulsant sa capitalisation boursière à 355 milliards de yuans (≈ 49,7 milliards de dollars).

Huawei dévoile aussi son framework UCM

En parallèle, Huawei lance Unified Cache Manager (UCM), un nouveau framework d’inférence IA optimisant la gestion des KV Cache sur différents niveaux de mémoire (HBM, DRAM, SSD). Testé avec China UnionPay, UCM a permis 90 % de réduction de la latence et un gain en débit de 22 fois.

Huawei prévoit de publier UCM en open source dès septembre 2025.

Le duo DeepSeek R2 + UCM illustre l’ambition de Pékin : bâtir et exécuter des systèmes d’IA hautes performances sans recourir à des puces ou outils occidentaux.

Si les promesses sont tenues, DeepSeek pourrait devenir un acteur incontournable sur le marché mondial des modèles LLM, avec un rapport puissance/coût très agressif.

Windows 11 : Microsoft lance Windows MIDI Services avec support natif de MIDI 2.0

Google retouche enfin ses AI Overviews : des liens plus visibles… sans vraie réparation pour les éditeurs

Apple a 50 ans : du garage de Cupertino à l’ère de l’intelligence spatiale

Instagram abandonne le chiffrement de bout en bout : vos messages ne seront plus privés dès le 8 mai

Test du DJI ROMO P : DJI réussit-il son premier robot aspirateur haut de gamme ?

Test de NotebookLM : L’application de Google est-elle le copilot IA rêvé ?

Test Huawei MatePad 11.5 : La tablette PaperMatte, l’alliée idéale pour les étudiants et pros ?

Faut-il craquer pour la Huawei Watch GT 6 Pro ? Les premières impressions

Galaxy Z Flip 8 : la fuite sur sa batterie suggère une stagnation décevante pour 2026

Samsung Galaxy Z Wide Fold : un nouveau format 4:3 pour tuer le complexe de l’écran étroit

iPhone Fold à 1 999 dollars : Apple prépare un duel frontal avec le Galaxy Z Fold 7

Vivo X300 FE : la « mini-bête » de Vivo se précise avant un lancement attendu en mars

Google alerte : des hackers « augmentent » leurs attaques avec Gemini — et l’IA accélère surtout ce qui faisait déjà mal

Deepfakes vocaux : votre cerveau démasque l’IA avant même que vous ne le sachiez

OpenAI : 10 ans après, de la startup de recherche au titan mondial de l’IA

NemoClaw : Nvidia lance son offensive open source contre l’agent IA OpenClaw

MacBook Pro M6 : OLED, tactile et design ultra-fin pour la révolution de 2026

Google alerte : des hackers « augmentent » leurs attaques avec Gemini — et l’IA accélère surtout ce qui faisait déjà mal

Galaxy Glasses : Samsung confirme une caméra intelligente et un lancement en 2026

Figure 03 : le robot humanoïde qui range votre salon de manière autonome

Android Bench : Google lance le premier benchmark IA pour le développement mobile

Claude Code Review : Anthropic lance une IA capable de relire votre code

Figma branche Codex d’OpenAI : quand le design et le code cessent (enfin) de se renvoyer la balle

Claude Code : Pourquoi l’édition directe de fichiers change tout pour les développeurs ?

Claude Code vs ChatGPT Codex : Quel agent choisir pour votre workflow en 2026 ?

Tracker du Père Noël 2025 : comment suivre le Père Noël en direct avec NORAD et Google ?

Spotify Wrapped 2025 : comment voir, partager et comprendre votre rétrospective

Pourquoi NotebookLM est un assistant personnel qui vaut son abonnement ?

DeepSeek R2 : le nouveau modèle IA chinois prêt à rivaliser avec GPT-5

DeepSeek R2 : Une architecture Mixture of Experts encore plus poussée

100 % entraîné sur des puces chinoises Huawei

Des prix agressifs pour bousculer OpenAI et Anthropic

Huawei dévoile aussi son framework UCM

OpenAI adoucit la personnalité de GPT-5 après les critiques pour le rendre plus chaleureux

Google Pixel 10 : des prix inchangés par rapport à 2024, même pour le modèle pliant

The author Yohann Poiron

DeepSeek R2 : le nouveau modèle IA chinois prêt à rivaliser avec GPT-5

DeepSeek R2 : Une architecture Mixture of Experts encore plus poussée

100 % entraîné sur des puces chinoises Huawei

Des prix agressifs pour bousculer OpenAI et Anthropic

Huawei dévoile aussi son framework UCM

The author Yohann Poiron

vous pourriez aussi aimer