fermer

Intelligence Artificielle

L’intelligence artificielle (IA) transforme de nombreux secteurs, de la santé à la finance, en passant par l’éducation et la sécurité. Explorez comment l’IA est utilisée pour automatiser des tâches, augmenter l’efficacité et créer de nouvelles opportunités de marché.

Nos discussions incluent également les défis éthiques et les implications sociétales de l’adoption de l’IA, fournissant une perspective équilibrée sur ce développement technologique clé.

Intelligence Artificielle

Xiaomi MiMo-V2.5-Pro UltraSpeed dépasse 1 000 tokens par seconde

Xiaomi MiMo-V2.5-Pro UltraSpeed dépasse 1 000 tokens par seconde

Xiaomi accélère brutalement dans la course aux grands modèles de langage. Avec le mode UltraSpeed de MiMo-V2.5-Pro, le groupe chinois affirme avoir franchi la barre symbolique des 1 000 tokens par seconde sur des GPU généralistes.

Développé avec TileRT, ce modèle de 1 000 milliards de paramètres promet une vitesse de génération spectaculaire, environ dix fois supérieure à l’accès API standard de MiMo-V2.5-Pro.

Une vitesse pensée pour les usages en temps réel

Le précédent MiMo-V2-Flash atteignait déjà 150 tokens par seconde fin 2025, soit une cadence plus rapide que la lecture humaine. Avec UltraSpeed, Xiaomi change d’échelle.

À ce niveau, l’IA ne se contente plus de répondre rapidement. Elle devient capable de générer du code, du texte ou des interactions longues presque instantanément, ouvrant la voie à des agents plus fluides, des assistants temps réel et des outils de développement beaucoup plus réactifs.

Une performance obtenue par co-conception

Xiaomi explique cette avancée par une optimisation conjointe du modèle et de l’infrastructure d’inférence. Autrement dit, MiMo-V2.5-Pro UltraSpeed n’est pas seulement un modèle plus rapide. Il est conçu avec le système qui l’exécute, afin de réduire les goulets d’étranglement entre calcul, mémoire et génération de tokens.

C’est précisément ce type d’optimisation qui devient stratégique à mesure que les modèles IA grossissent.

1000tpsfp4

Une option premium, trois fois plus chère

Cette vitesse a toutefois un prix. L’API MiMo-V2.5-Pro-UltraSpeed coûte trois fois plus cher que l’accès standard. Xiaomi présente ce compromis comme une équation simple : trois fois le prix pour une expérience de sortie dix fois plus rapide.

Le mode UltraSpeed n’est pas inclus dans les Token Plans classiques et reste pour l’instant limité à un accès API expérimental.

Un essai réservé aux entreprises et développeurs avancés

En raison de ressources d’inférence limitées, Xiaomi ouvre une phase de test sur candidature du 9 au 23 juin 2026.

Les entreprises et développeurs professionnels disposant de besoins concrets seront prioritaires. Les comptes approuvés bénéficieront de deux semaines d’essai gratuit, avec des limites strictes : files d’attente plafonnées, sessions de 30 minutes et libération automatique des ressources en cas d’inactivité.

Xiaomi veut exister face aux géants de l’IA

Avec MiMo, Xiaomi ne se contente plus d’intégrer l’IA dans ses smartphones, voitures ou objets connectés. Le groupe construit progressivement une véritable famille de modèles couvrant texte, voix et multimodalité.

UltraSpeed montre surtout une ambition claire : se distinguer non seulement par la taille du modèle, mais par l’expérience utilisateur. Dans l’IA générative, la vitesse devient un avantage compétitif aussi important que la précision.

Lire plus
Intelligence Artificielle

Huawei Ascend 910C : la nouvelle puce IA chinoise qui veut concurrencer Nvidia

Huawei Ascend 910C : la nouvelle puce IA chinoise qui veut concurrencer Nvidia

Malgré les restrictions américaines sur les semi-conducteurs, Huawei continue de démontrer sa résilience technologique. Le géant chinois vient de dévoiler la Ascend 910C, sa nouvelle puce dédiée à l’intelligence artificielle, tout en renforçant son arsenal logiciel autour de la plateforme CANN. Une double annonce qui dépasse largement le simple lancement d’un processeur : Huawei cherche désormais à bâtir une alternative complète à l’écosystème Nvidia.

Dans un marché mondial dominé par CUDA et les GPU de Nvidia, la bataille ne se joue plus uniquement sur la puissance brute. Elle se joue sur l’ensemble de la chaîne technologique, du silicium jusqu’aux frameworks de développement.

Ascend 910C : Huawei franchit une nouvelle étape

La Ascend 910C représente la dernière évolution de la famille d’accélérateurs IA développée par Huawei. Gravée en 7 nanomètres par le fondeur chinois SMIC, la puce améliore les performances de la Ascend 910B tout en conservant une compatibilité avec les infrastructures existantes. Selon les informations communiquées, elle serait capable d’atteindre des niveaux de performances comparables à certaines générations antérieures des GPU Nvidia H100 dans plusieurs scénarios d’entraînement de modèles d’IA.

Un résultat loin d’être anodin.

Depuis plusieurs années, les sanctions américaines limitent fortement l’accès de Huawei aux technologies de fabrication avancées, aux logiciels de conception électronique et aux équipements de pointe utilisés par l’industrie des semi-conducteurs. Dans ce contexte, parvenir à développer une puce compétitive constitue déjà une réussite stratégique.

Pour les entreprises chinoises engagées dans le développement de grands modèles de langage ou de plateformes d’inférence IA, la Ascend 910C offre désormais une alternative locale aux accélérateurs occidentaux devenus plus difficiles à obtenir.

Le véritable enjeu se situe dans le logiciel

Toutefois, l’annonce matérielle s’accompagne d’une évolution potentiellement plus importante encore : la montée en puissance de la plateforme logicielle CANN (Compute Architecture for Neural Networks).

Huawei affirme avoir considérablement amélioré les performances de son compilateur, l’optimisation des opérateurs et la gestion des ressources matérielles. Résultat : les développeurs pourraient exploiter davantage les capacités des puces Ascend sans réécrire entièrement leurs applications.

Cette approche vise directement le principal avantage concurrentiel de Nvidia.

Car si Nvidia domine aujourd’hui entre 80 et 90 % du marché mondial des accélérateurs IA, cette position repose autant sur son environnement logiciel CUDA que sur ses GPU eux-mêmes. Des millions de développeurs utilisent quotidiennement ses bibliothèques, ses frameworks optimisés et ses outils de développement.

Huawei tente désormais de construire son propre écosystème autour de CANN et de son framework MindSpore.

L’objectif est clair : réduire les coûts de migration et rendre les modèles existants compatibles avec les infrastructures Ascend aussi facilement que possible.

La Chine accélère sa souveraineté technologique

Le contexte joue également en faveur du constructeur chinois. La demande en infrastructures IA explose dans tout le pays. Les géants du numérique, les centres de recherche et les entreprises publiques multiplient les investissements dans les centres de données destinés à l’entraînement de modèles d’intelligence artificielle.

Dans le même temps, les restrictions américaines compliquent l’approvisionnement en GPU Nvidia, même dans leurs versions conformes aux réglementations d’exportation.

Huawei apparaît donc comme une solution stratégique pour répondre à cette demande croissante.

Des groupes comme Baidu, Alibaba ou Tencent expérimentent déjà activement les plateformes Ascend afin de diversifier leurs infrastructures et réduire leur dépendance aux fournisseurs étrangers.

Une stratégie verticale inspirée des leaders mondiaux

L’un des atouts de Huawei réside dans sa capacité à contrôler plusieurs couches de la pile technologique.

Au-delà des accélérateurs IA, le groupe développe également ses propres solutions réseau, ses composants de stockage, ses interconnexions haute vitesse et ses outils logiciels.

Cette intégration verticale permet d’optimiser les performances globales des clusters d’IA. Les communications entre processeurs, essentielles lors de l’entraînement de modèles massifs, bénéficient notamment d’améliorations spécifiques intégrées directement aux équipements réseau du constructeur.

Une approche qui rappelle la stratégie poursuivie par Nvidia depuis plusieurs années avec ses plateformes complètes destinées aux centres de données.

Nvidia reste leader, mais la concurrence s’organise

Malgré ces avancées, Huawei reste encore loin du leadership mondial.

Les dernières architectures Blackwell de Nvidia conservent une avance significative en matière de performances maximales, d’efficacité énergétique et surtout d’écosystème logiciel.

Cependant, l’objectif de Huawei n’est plus nécessairement de conquérir immédiatement le marché mondial.

Le groupe vise avant tout le marché chinois, l’un des plus importants au monde pour l’intelligence artificielle. Dans cet environnement, la disponibilité des composants, la souveraineté technologique et l’intégration locale deviennent parfois aussi importantes que les performances absolues.

Une bataille qui redessine l’industrie des semi-conducteurs

La Ascend 910C illustre une tendance plus profonde : la fragmentation progressive de l’écosystème mondial des semi-conducteurs. D’un côté, Nvidia continue de renforcer sa domination internationale grâce à CUDA et à ses GPU de nouvelle génération. De l’autre, Huawei construit méthodiquement un écosystème autonome capable de répondre aux besoins du marché chinois.

La véritable question n’est donc plus de savoir si Huawei peut égaler Nvidia aujourd’hui, mais à quelle vitesse son écosystème matériel et logiciel pourra gagner en maturité.

Car dans l’univers de l’intelligence artificielle, la puissance brute ne suffit plus. La prochaine bataille se jouera sur les plateformes, les outils et la capacité à créer un environnement complet capable d’attirer développeurs, entreprises et centres de recherche.

Et sur ce terrain, Huawei semble désormais vouloir jouer dans la cour des très grands.

Lire plus
Intelligence Artificielle

Anthropic coupe brutalement Fable 5 et Mythos 5 après une intervention du gouvernement américain

Anthropic coupe brutalement Fable 5 et Mythos 5 après une intervention du gouvernement américain

Quelques jours seulement après leur lancement, les nouveaux modèles d’IA d’Anthropic ont déjà disparu. L’entreprise a annoncé dans la nuit de vendredi à samedi la désactivation complète de Fable 5 et Mythos 5, invoquant une directive urgente du département américain du Commerce.

Une décision exceptionnelle qui relance le débat sur la sécurité des modèles d’IA avancés et le rôle croissant des autorités dans leur déploiement.

Une suspension imposée par Washington

Dans un message publié vendredi soir, Anthropic explique avoir reçu une directive gouvernementale américaine soumettant Fable 5 et Mythos 5 à de nouvelles restrictions d’exportation.

Selon l’entreprise, la manière la plus rapide de respecter cette obligation légale a été de couper immédiatement l’accès aux deux modèles pour l’ensemble des utilisateurs, y compris ceux situés aux États-Unis.

Les autres modèles Claude restent disponibles et ne sont pas concernés par cette mesure.

Un jailbreak au cœur de la controverse

D’après un responsable de l’administration américaine cité par Axios, les autorités s’inquiètent de l’existence d’un jailbreak permettant de contourner certaines protections intégrées à Fable 5.

Ces garde-fous étaient censés empêcher l’utilisation du modèle dans des domaines sensibles comme :

  • La cybersécurité offensive
  • La biologie
  • La chimie
  • La recherche de vulnérabilités avancées

L’administration aurait demandé une suspension temporaire afin de laisser le temps aux organismes de sécurité nationale de renforcer leurs mécanismes de protection face à ce type de risque.

Selon cette même source, le processus pourrait durer quelques semaines.

Anthropic conteste l’évaluation du risque

Anthropic ne partage toutefois pas l’analyse du gouvernement. L’entreprise affirme n’avoir reçu que des preuves verbales concernant un jailbreak très spécifique permettant au modèle d’examiner un code informatique à la recherche de failles logicielles.

Selon la société, les vulnérabilités identifiées jusqu’à présent restent relativement simples et limitées. Anthropic ajoute que des modèles concurrents, notamment OpenAI GPT-5.5, disposeraient de capacités comparables dans ce domaine.

Dans son communiqué, l’entreprise estime qu’appliquer un tel niveau d’exigence à l’ensemble du secteur reviendrait pratiquement à bloquer tout lancement futur de modèles de pointe.

Un précédent important pour l’industrie de l’IA

Cette affaire intervient dans un contexte politique particulièrement sensible. Plus tôt ce mois-ci, le président américain a signé un décret encourageant les laboratoires d’IA à participer à des programmes volontaires d’évaluation sécuritaire avant la mise sur le marché de nouveaux systèmes.

La suspension de Fable 5 et Mythos 5 pourrait ainsi constituer l’un des premiers cas concrets où les autorités interviennent directement après le lancement commercial d’un modèle d’intelligence artificielle.

Un signal fort pour l’avenir des modèles de pointe

Au-delà du cas Anthropic, l’épisode révèle une tension croissante entre innovation et sécurité nationale. Les laboratoires d’IA cherchent à accélérer le déploiement de modèles toujours plus puissants, tandis que les gouvernements redoutent leur potentiel d’utilisation abusive dans des domaines critiques.

Anthropic promet de fournir davantage d’explications dans les prochaines 24 heures. Mais une chose apparaît déjà clairement : à mesure que les modèles gagnent en capacités, les débats autour de leur contrôle deviennent presque aussi stratégiques que la technologie elle-même.

Lire plus
Intelligence Artificielle

OpenAI assouplit les limites de Codex avec des réinitialisations utilisables à la demande

OpenAI assouplit les limites de Codex avec des réinitialisations utilisables à la demande

Les utilisateurs intensifs d’IA connaissent bien le problème : lancer une longue session de travail, pousser un modèle dans ses retranchements, puis se heurter brutalement à une limite d’usage. Avec Codex, son assistant de programmation intégré à ChatGPT, OpenAI introduit désormais une solution plus flexible : des réinitialisations de limite que l’utilisateur peut conserver et déclencher au bon moment.

Une petite nouveauté en apparence, mais très utile pour les développeurs qui travaillent par longues sessions.

Des limites moins rigides

Jusqu’ici, les quotas de Codex se réinitialisaient selon un calendrier fixe. Si un développeur atteignait sa limite en plein milieu d’un projet ou d’une session nocturne, il devait simplement attendre.

OpenAI change cette logique avec les « réinitialisations des limites », des réinitialisations sauvegardées que l’utilisateur peut activer quand il en a réellement besoin.

Une réinitialisation offerte pour commencer

La fonction est déployée auprès des utilisateurs Codex des offres ChatGPT Go, Plus, Pro et Business. Pour lancer le système, OpenAI offre une réinitialisation bancaire gratuite aux utilisateurs éligibles.

L’entreprise teste aussi un programme de parrainage temporaire : pendant deux semaines, les abonnés Plus et Pro peuvent inviter jusqu’à trois amis à essayer Codex. Quand un invité envoie son premier message, les deux comptes reçoivent une nouvelle réinitialisation.

OpenAI n’a pas encore expliqué comment les utilisateurs pourront obtenir d’autres réinitialisations après cette période de test.

Mais, la voie semble évidente : vendre des réinitialisations ponctuelles ou des packs pourrait devenir une nouvelle source de revenus, surtout auprès des développeurs prêts à payer pour éviter une interruption de travail.

Un vrai gain pour les power users

Cette mise à jour ne rend pas Codex plus puissant, mais elle le rend plus pratique. En donnant aux utilisateurs le contrôle du moment où leur quota se recharge, OpenAI améliore l’expérience des développeurs les plus actifs.

Dans la guerre des assistants IA de programmation, ce type de détail peut faire une vraie différence.

Lire plus
Intelligence Artificielle

TacticAI : l’IA de Google DeepMind qui veut révolutionner les tactiques du football

TacticAI : l’IA de Google DeepMind qui veut révolutionner les tactiques du football

Les entraîneurs de football passent des heures à analyser les corners, les coups de pied arrêtés et les déplacements des joueurs à la recherche du moindre avantage compétitif. Avec TacticAI, Google DeepMind estime que l’intelligence artificielle peut accélérer ce processus et transformer la manière dont les équipes préparent leurs matchs.

Développé en collaboration avec le club anglais de Liverpool, TacticAI est un assistant tactique spécialisé dans le football capable d’analyser des situations de jeu, de prédire les mouvements futurs des joueurs et de proposer des ajustements stratégiques en quelques secondes.

Une IA conçue pour comprendre le football

Contrairement aux modèles d’IA généralistes, TacticAI a été développé spécifiquement pour l’analyse tactique du football.

Le système s’appuie sur des techniques de deep learning géométrique afin d’étudier les positions et les interactions entre joueurs lors des corners. À partir de ces données, il peut prédire le déroulement probable de l’action et suggérer de nouvelles configurations susceptibles d’améliorer les chances de succès.

HKivNzlXMAABlmI scaled

L’une de ses capacités les plus impressionnantes consiste à anticiper les trajectoires des joueurs jusqu’à huit secondes dans le futur en utilisant uniquement des données visuelles similaires à celles des retransmissions télévisées.

Liverpool FC a participé à la validation du système

Google DeepMind souligne que TacticAI n’a pas été testé uniquement dans un environnement de recherche. Le projet a été développé avec la participation active du FC Liverpool, dont les analystes et experts tactiques ont évalué les recommandations générées par l’intelligence artificielle.

Selon l’étude publiée dans la revue scientifique Nature Communications, les experts ont préféré les configurations proposées par TacticAI dans 90 % des cas face aux situations réellement observées lors des matchs.

Un résultat particulièrement notable, puisqu’il démontre que les suggestions de l’IA ne sont pas seulement statistiquement pertinentes, mais également crédibles aux yeux des professionnels du football.

HKiu5qEXYAA7DjL scaled

Les réseaux neuronaux graphiques au cœur du projet

Pour comprendre les dynamiques complexes d’un terrain de football, TacticAI utilise des réseaux neuronaux graphiques (Graph Neural Networks). Cette approche permet de représenter chaque joueur comme un nœud au sein d’un réseau dynamique où chaque déplacement influence les autres participants.

Grâce à cette modélisation, l’IA peut :

  • Identifier le joueur le plus susceptible de recevoir un corner.
  • Prédire la probabilité qu’un tir soit effectué.
  • Simuler des scénarios alternatifs réalistes.
  • Générer des ajustements tactiques cohérents avec les standards du football professionnel.

Les chercheurs indiquent que le modèle a surpassé les méthodes de référence existantes sur plusieurs indicateurs de prédiction.

Palmeiras devient le premier club à prolonger l’expérience

L’histoire de TacticAI ne s’arrête pas aux laboratoires de Google. DeepMind a récemment annoncé un partenariat avec le club brésilien Palmeiras, qui devient la première équipe à exploiter concrètement cette technologie pour simuler des situations de jeu et analyser les dynamiques du football en mouvement.

L’objectif est désormais d’étendre les capacités du système au-delà des coups de pied arrêtés afin de modéliser des phases de jeu ouvertes plus complexes.

Si ces expérimentations se révèlent concluantes, l’intelligence artificielle pourrait progressivement devenir un véritable assistant tactique aux côtés des entraîneurs.

Bien plus qu’un outil pour le football

Le potentiel de TacticAI dépasse largement le cadre sportif. Les modèles capables de comprendre et de prédire les mouvements coordonnés de plusieurs acteurs dans un environnement complexe pourraient trouver des applications dans de nombreux secteurs :

  • La robotique autonome.
  • Les systèmes de circulation intelligents.
  • La gestion logistique.
  • Les réseaux de transport.
  • Les simulations urbaines.

Autrement dit, les algorithmes utilisés aujourd’hui pour optimiser un corner pourraient demain contribuer à améliorer la circulation dans une ville ou coordonner des flottes de robots industriels.

Une nouvelle étape dans l’IA appliquée au sport

Avec TacticAI, Google DeepMind illustre une tendance de fond : l’intelligence artificielle ne se contente plus d’analyser le passé, elle commence à anticiper le futur.

Pour les clubs professionnels, cela ouvre la voie à une préparation tactique plus rapide, plus précise et potentiellement plus efficace. Pour Google, c’est également une démonstration de la capacité de ses modèles à comprendre des systèmes complexes où des dizaines d’acteurs interagissent simultanément.

Sur le terrain, TacticAI ressemble à un outil destiné à aider les entraîneurs à gagner des matchs. En réalité, il pourrait représenter un aperçu des futures IA capables d’anticiper et de coordonner des comportements complexes dans le monde réel.

Lire plus
Intelligence Artificielle

OpenAI et Visa préparent les achats autonomes via ChatGPT : vers une nouvelle ère du commerce IA

OpenAI et Visa préparent les achats autonomes via ChatGPT : vers une nouvelle ère du commerce IA

Après avoir appris à écrire, coder et raisonner, ChatGPT s’apprête à franchir une nouvelle étape : dépenser de l’argent. OpenAI vient d’annoncer un partenariat majeur avec Visa qui permettra à ses futurs agents IA d’effectuer des achats directement au nom des utilisateurs.

L’ambition est claire : faire de ChatGPT non plus un simple conseiller, mais un véritable intermédiaire commercial capable de rechercher, comparer, sélectionner et payer un produit sans intervention humaine constante. Une évolution qui pourrait redéfinir le commerce en ligne, mais qui soulève aussi de nombreuses questions sur la confiance, la responsabilité et le contrôle.

ChatGPT veut passer du conseil à l’action

Jusqu’à présent, les assistants IA excellaient surtout dans la recommandation. Demander à ChatGPT de trouver un casque audio à moins de 150 euros ou de comparer plusieurs modèles d’aspirateurs était déjà possible. En revanche, l’étape finale — le paiement — restait entre les mains de l’utilisateur.

Le partenariat avec Visa vise précisément à combler ce fossé.

Grâce à l’infrastructure de paiement du géant américain, les futurs agents IA d’OpenAI pourront effectuer des achats directement auprès de plus de 175 millions de commerçants acceptant Visa.

Dans un scénario typique, un utilisateur pourrait simplement demander : « Trouve-moi un casque sans fil avec réduction de bruit pour moins de 150 euros et commande le meilleur modèle. ». L’agent effectuerait alors la recherche, comparerait les offres disponibles et finaliserait l’achat automatiquement.

Une infrastructure construite autour de la confiance

OpenAI ne tente pas de réinventer le système financier. L’entreprise s’appuie sur l’expertise de Visa, qui traite déjà plus de 300 milliards de transactions chaque année.

La plateforme utilisera plusieurs couches de sécurité : des cartes virtuelles tokenisées, une authentification spécifique aux agents IA, une surveillance antifraude en temps réel, des limites de dépenses configurables et des restrictions par commerçant ou catégorie d’achat.

Les utilisateurs pourront ainsi définir leurs propres règles : plafond de dépenses, validation obligatoire au-delà d’un certain montant ou autorisation limitée à certains marchands.

Visa insiste sur le fait que l’humain restera décisionnaire. Du moins dans un premier temps.

OpenAI revient dans l’e-commerce après un premier échec

Cette annonce marque en réalité la deuxième tentative d’OpenAI dans le commerce conversationnel. Fin 2025, la société avait lancé Instant Checkout, une fonctionnalité permettant déjà à ChatGPT d’effectuer certains achats. L’initiative n’a toutefois jamais trouvé son public.

La principale raison était économique : OpenAI prélevait une commission de 4 % auprès des commerçants, un modèle que de nombreux distributeurs ont refusé d’adopter. Face à une faible adhésion du marché, Instant Checkout a été abandonné en mars dernier.

Cette fois, OpenAI change de stratégie. Au lieu de construire son propre réseau commercial, l’entreprise délègue les aspects les plus complexes — paiements, fraude, litiges et conformité — à Visa, dont c’est précisément le métier.

Une bataille stratégique entre géants de l’IA

Le partenariat ne concerne pas seulement OpenAI et Visa. Il s’inscrit dans une course beaucoup plus vaste visant à contrôler la prochaine génération du commerce numérique.

Visa travaille déjà avec plusieurs acteurs majeurs : Microsoft, Stripe, Shopify et Worldpay. De son côté, Mastercard développe sa propre plateforme Agent Pay. Google avance avec Universal Cart tandis qu’Amazon expérimente déjà plusieurs formes de commerce piloté par l’intelligence artificielle.

La bataille ne porte plus seulement sur la qualité des modèles. Elle concerne désormais le contrôle du moment le plus précieux de l’économie numérique : celui où un utilisateur décide d’acheter.

La grande inconnue : les consommateurs sont-ils prêts ? La technologie semble presque prête. La confiance, beaucoup moins. Le principal obstacle n’est pas technique, mais psychologique. Les consommateurs accepteront-ils réellement qu’une intelligence artificielle réalise des achats sans validation systématique ? Cette question devient encore plus complexe lorsqu’on évoque les erreurs potentielles. Qui sera responsable si un agent commande le mauvais produit ? Qui prendra en charge un remboursement en cas de litige ? Comment les banques traiteront-elles une fraude initiée par une IA agissant avec une autorisation légitime ?

Pour l’instant, OpenAI et Visa n’ont apporté aucune réponse détaillée sur ces scénarios. Aucune date de lancement officielle n’a non plus été annoncée.

Vers un futur où l’IA achète à notre place

Le véritable enjeu dépasse largement l’achat de quelques rouleaux d’essuie-tout ou d’un casque Bluetooth. Ce partenariat marque une évolution fondamentale du rôle des agents IA. Après avoir servi d’assistants conversationnels, ils deviennent progressivement des agents d’exécution capables d’agir directement dans le monde réel.

L’objectif final est évident : supprimer le maximum de friction entre une intention et son accomplissement.

Visa résume cette vision avec une question simple : après mille achats réussis, combien d’utilisateurs accepteront de ne plus valider chaque transaction individuellement ? C’est probablement là que se jouera l’avenir du commerce assisté par IA.

Car la prochaine révolution ne consistera peut-être pas à savoir quelle intelligence artificielle répond le mieux à une question, mais laquelle sera suffisamment digne de confiance pour dépenser votre argent à votre place.

Lire plus
Intelligence Artificielle

Anthropic recule sur Claude Fable 5 après la polémique des restrictions cachées

Anthropic recule sur Claude Fable 5 après la polémique des restrictions cachées

À peine lancé, Claude Fable 5 se retrouve déjà au cœur d’une controverse. Anthropic a reconnu avoir intégré des restrictions invisibles dans son nouveau modèle d’intelligence artificielle et présente désormais ses excuses à la communauté de la recherche.

Face aux critiques, l’entreprise a annoncé un changement majeur : les utilisateurs seront désormais informés lorsque certaines protections de sécurité entrent en action. Une décision qui soulève une question fondamentale pour toute l’industrie de l’IA : jusqu’où les laboratoires peuvent-ils contrôler leurs modèles sans compromettre la transparence ?

Des garde-fous invisibles qui ont déclenché la polémique

Claude Fable 5 est le premier modèle grand public issu de la nouvelle génération « Mythos » d’Anthropic, une famille d’IA que l’entreprise décrit depuis plusieurs mois comme suffisamment puissante pour nécessiter des mesures de sécurité renforcées.

L’un des mécanismes les plus controversés concernait la « distillation », une technique largement utilisée dans l’industrie pour entraîner des modèles plus petits à partir des réponses de modèles plus avancés.

Dans sa documentation technique, Anthropic révélait que Fable 5 pouvait détecter certaines tentatives de distillation et dégrader volontairement la qualité de ses réponses. Le problème : l’utilisateur n’était jamais informé que ses résultats avaient été altérés.

Autrement dit, un chercheur pouvait recevoir une réponse incomplète ou volontairement affaiblie sans savoir que le système avait activé une restriction.

Une transparence désormais assumée

Sous la pression de la communauté IA, Anthropic a finalement décidé de modifier cette approche. Désormais, lorsqu’un utilisateur déclenchera une protection liée à la distillation, sa requête sera automatiquement transférée vers Claude Opus 4.8, l’ancien modèle phare de l’entreprise. Surtout, une notification explicite indiquera que cette substitution a eu lieu.

Anthropic a confirmé que ce comportement sera visible à chaque activation des garde-fous.

Cette logique est déjà utilisée dans d’autres domaines jugés sensibles, notamment : la cybersécurité, la biologie, la chimie et certaines demandes à haut risque.

Dans ces cas, Claude Fable 5 bascule également vers Opus 4.8 ou refuse totalement la requête lorsque celle-ci tombe sous les politiques de sécurité plus strictes de l’entreprise.

Quand la sécurité devient un problème de confiance

Le véritable enjeu dépasse largement la seule question de la distillation. Pour de nombreux chercheurs, la valeur d’un modèle de pointe repose sur la prévisibilité de son comportement. Lorsqu’un système modifie discrètement ses réponses, il devient difficile d’évaluer ses performances réelles ou de reproduire des résultats scientifiques.

Cette critique a été particulièrement forte chez les spécialistes de l’évaluation des modèles IA, qui craignent que des protections invisibles faussent les benchmarks et les comparaisons entre systèmes.

Anthropic reconnaît désormais cette erreur.

Dans un message publié sur X, l’entreprise explique avoir privilégié une approche invisible afin de limiter les faux positifs et d’accélérer le déploiement du modèle. Selon la société, ce choix s’est révélé être le mauvais compromis.

Une bataille stratégique autour de la distillation

Derrière cette controverse se cache également une guerre technologique de plus en plus intense entre les grands laboratoires d’IA. Anthropic considère la distillation comme un risque stratégique majeur. La société affirme depuis longtemps que certaines entreprises utilisent les réponses de modèles avancés pour entraîner leurs propres systèmes à moindre coût.

L’entreprise a notamment déjà accusé certains concurrents chinois, dont DeepSeek, d’exploiter ce type de méthodes à grande échelle.

Dans sa documentation technique, Anthropic justifiait ses restrictions en expliquant que les modèles de nouvelle génération pouvaient accélérer le développement d’IA concurrentes.

Cette position illustre une tension croissante dans le secteur : les laboratoires souhaitent promouvoir l’innovation tout en protégeant leurs investissements colossaux en recherche et en infrastructure.

Le défi des modèles « trop puissants »

L’épisode Fable 5 révèle également les difficultés auxquelles sont confrontés les développeurs d’IA de nouvelle génération. Anthropic tente actuellement d’imposer une approche intermédiaire entre l’ouverture totale et le verrouillage complet de ses technologies.

Au lieu d’interdire systématiquement certaines requêtes, l’entreprise cherche à rediriger les demandes sensibles vers des modèles moins performants mais jugés plus sûrs.

Sur le papier, cette stratégie paraît équilibrée.

Dans la pratique, elle pose toutefois un problème de confiance : les utilisateurs doivent-ils accepter qu’un modèle modifie discrètement son comportement pour des raisons de sécurité ? La réponse de la communauté semble avoir été claire.

Un avertissement pour toute l’industrie

Le recul d’Anthropic pourrait avoir des conséquences bien au-delà de Claude Fable 5. Alors que les modèles deviennent plus puissants et que les questions de sécurité prennent une place centrale, les utilisateurs exigent désormais davantage de visibilité sur les mécanismes qui influencent les réponses des IA.

OpenAI, Google, Anthropic ou encore xAI devront probablement faire face au même défi dans les années à venir : protéger leurs systèmes sans transformer leurs garde-fous en boîtes noires.

Car à mesure que l’intelligence artificielle s’impose comme un outil de recherche, de développement et de prise de décision, la transparence devient presque aussi importante que les performances elles-mêmes.

 

Lire plus
Intelligence Artificielle

OpenAI envisage une baisse massive de ses prix de ChatGPT face à Anthropic et Google

OpenAI envisage une baisse massive de ses prix de ChatGPT face à Anthropic et Google

Après des mois de factures élevées pour les entreprises et les développeurs, OpenAI envisagerait de réduire fortement ses prix. Selon The Wall Street Journal, le créateur de ChatGPT étudie une baisse significative de ses tarifs par token afin de rester compétitif face à Anthropic, Google et la pression croissante du marché.

Cette décision pourrait marquer le début d’une véritable guerre des prix dans l’intelligence artificielle générative.

Les entreprises veulent payer moins cher

L’IA est devenue indispensable pour de nombreuses sociétés, mais son coût reste difficile à maîtriser. Entre les modèles de raisonnement, les agents de code, les longues fenêtres de contexte et les usages intensifs en entreprise, les dépenses peuvent rapidement exploser.

Sam Altman lui-même a reconnu que le coût de l’IA était devenu « un énorme problème » et que OpenAI devait aider ses clients à obtenir plus de valeur pour moins cher.

Screen 2026 06 11 at 14.40.24 scaled

Anthropic met OpenAI sous pression

La montée en puissance d’Anthropic complique la position d’OpenAI. Avec Claude Code, Anthropic a séduit de nombreux développeurs et renforcé sa présence dans les entreprises. OpenAI tente de répondre avec Codex, mais la concurrence sur les outils de programmation IA est désormais beaucoup plus intense.

Si Anthropic baisse ses prix, OpenAI ne veut pas se retrouver dans une position défensive.

Google joue déjà la carte du prix

Google accentue aussi la pression avec ses modèles Gemini, notamment les versions Flash, souvent moins coûteuses. Dans un marché où les performances se rapprochent progressivement, le prix devient un argument décisif.

Pour les entreprises, choisir une IA ne dépend plus seulement de la qualité du modèle, mais aussi du coût par tâche réellement accomplie.

Une guerre des prix risquée pour les géants de l’IA

Pour OpenAI et Anthropic, baisser les prix n’est pas sans danger. Les deux entreprises dépensent déjà des milliards en calcul, infrastructure et centres de données. Réduire les tarifs juste avant une potentielle introduction en Bourse pourrait inquiéter les investisseurs sur la rentabilité réelle du secteur.

Mais pour les utilisateurs, la dynamique est positive.

Les utilisateurs pourraient enfin respirer

Si OpenAI, Anthropic et Google entrent réellement dans une bataille tarifaire, les développeurs, startups et entreprises devraient voir leurs coûts IA diminuer. Après une phase dominée par la course aux performances, l’industrie entre dans une nouvelle étape : celle de l’efficacité économique.

Et pour une fois, la concurrence entre géants de l’IA pourrait directement bénéficier aux clients.

Lire plus
Intelligence Artificielle

ChatGPT, Gemini et Claude : pourquoi les parts de marché IA ne disent plus toute la vérité

ChatGPT, Gemini et Claude : pourquoi les parts de marché IA ne disent plus toute la vérité

Les derniers chiffres du marché des assistants IA semblent sans appel : ChatGPT reste largement en tête avec 54,7 % des visites web mondiales, tandis que Gemini atteint 27,4 % et Claude enregistre une croissance spectaculaire de 306 % sur un trimestre.

Pourtant, derrière ces statistiques impressionnantes se cache une réalité plus complexe : le trafic web n’est peut-être plus le meilleur indicateur pour mesurer l’influence réelle des intelligences artificielles.

À mesure que les assistants deviennent capables de répondre directement aux utilisateurs sans les envoyer vers des sites externes, les métriques héritées de l’ère du moteur de recherche commencent à perdre de leur pertinence.

ChatGPT reste leader, Gemini accélère, Claude explose

Selon les données compilées par Momentic à partir de Similarweb, ChatGPT conserve la première place avec 54,7 % des visites web parmi les principaux assistants IA mondiaux.

Mais, l’écart se réduit rapidement.

  • ChatGPT : 54,7 %
  • Gemini : 27,4 %
  • Claude : 8,2 %
  • DeepSeek : 4,1 %
  • Grok : 2,8 %

6a1f056d627e0fd4fec80d19 6a1f015abab4291f6c1586a8 ai chatbot share worldwide apr 2026

La progression de Gemini est particulièrement notable, tandis que Claude affiche la croissance la plus rapide du marché avec une hausse d’environ 306 % de son trafic entre janvier et avril 2026.

Aux États-Unis, Claude atteint même 12,5 % de part de marché web, dépassant largement sa moyenne mondiale.

Le problème : les visites Web ne racontent plus toute l’histoire

Le principal défaut de cette méthodologie est qu’elle repose sur une métrique héritée de l’époque des moteurs de recherche traditionnels. Or, les assistants IA sont justement conçus pour réduire le nombre de clics.

L’utilisateur pose une question. L’IA répond directement. Et dans de nombreux cas, aucun site web n’est visité.

Mesurer la popularité d’un assistant IA uniquement à travers les visites de son site devient donc de plus en plus comparable à mesurer l’audience d’une chaîne de télévision en comptant les personnes qui se rendent physiquement au studio.

Le signal existe, mais il ne reflète plus l’usage réel.

L’ère du « zéro clic » change tout

Depuis deux ans, l’industrie assiste à une montée en puissance du phénomène du « zero-click ». Les utilisateurs obtiennent leurs réponses directement dans l’interface de l’IA ou du moteur de recherche sans visiter de site externe.

Cette tendance est particulièrement visible chez Google. Les recherches enrichies par l’IA génèrent de moins en moins de clics vers les éditeurs traditionnels. Les réponses synthétiques remplacent progressivement la navigation classique entre les liens.

6a1f056d627e0fd4fec80d1e 6a1f015a4c8f0312002b6671 ai chatbot share trend 2026

La même logique s’applique aux assistants conversationnels. Plus un assistant est performant, moins l’utilisateur ressent le besoin de quitter l’interface.

Paradoxalement, le succès de ces plateformes réduit donc la pertinence du trafic web comme indicateur de performance.

Les assistants ne jouent pas tous selon les mêmes règles

Autre limite importante : tous les acteurs ne concentrent pas leur activité sur le web. ChatGPT, Claude, Gemini ou Copilot disposent de modèles de distribution très différents.

Une part importante de l’utilisation de :

  • OpenAI ChatGPT passe par les applications mobiles et les API ;
  • Anthropic Claude est fortement utilisé dans les environnements professionnels ;
  • Google Gemini est intégré à Android, Workspace et désormais à plusieurs services Apple ;
  • Microsoft Copilot est principalement consommé dans Windows et Microsoft 365.

Aucune de ces utilisations n’apparaît réellement dans les statistiques de trafic web. Ainsi, un assistant peut gagner massivement des utilisateurs tout en affichant une croissance limitée de ses visites sur navigateur.

La vraie bataille se joue désormais dans la distribution

La dynamique actuelle du marché montre que la distribution devient l’arme principale des géants de l’IA. Gemini bénéficie de l’écosystème Google : Android, Search, Workspace et désormais les nouvelles intégrations Apple Intelligence, tandis que Claude progresse grâce à son adoption croissante auprès des développeurs et des entreprises, et ChatGPT conserve une avance importante grâce à sa notoriété et à son immense base d’utilisateurs.

La compétition ne consiste plus seulement à attirer du trafic sur un site Web, mais à devenir l’assistant intégré par défaut dans les appareils, les systèmes d’exploitation et les logiciels du quotidien.

Screen 2026 06 10 at 21.57.34

Une métrique utile, mais insuffisante

Les chiffres de trafic publiés cette année restent intéressants pour observer les tendances du marché. Ils montrent clairement que l’avance historique de ChatGPT se réduit et que Gemini et Claude gagnent du terrain. Mais, ils ne doivent plus être interprétés comme un classement absolu de l’utilisation réelle des assistants IA.

À l’ère des réponses instantanées et des expériences sans clic, la métrique la plus importante n’est plus le nombre de visiteurs, mais la fréquence à laquelle une IA devient la réponse elle-même.

Et sur ce terrain, la bataille entre ChatGPT, Gemini et Claude ne fait que commencer.

Lire plus
Intelligence Artificielle

Google DiffusionGemma : le modèle IA open source qui génère du texte jusqu’à 4 fois plus vite

Google DiffusionGemma : le modèle IA open source qui génère du texte jusqu’à 4 fois plus vite

Avec DiffusionGemma, Google explore une nouvelle voie pour l’intelligence artificielle générative. Plutôt que de produire du texte mot par mot comme les grands modèles de langage traditionnels, ce nouveau modèle open source adopte une approche inspirée de la génération d’images par diffusion.

Résultat : une vitesse de génération spectaculaire et de nouvelles possibilités pour les développeurs.

Google DiffusionGemma : Une rupture avec les modèles de langage traditionnels

La quasi-totalité des modèles actuels, qu’il s’agisse de Gemini, ChatGPT ou Claude, reposent sur une architecture dite « autorégressive ». Chaque mot est généré séquentiellement, en fonction des précédents.

DiffusionGemma fonctionne différemment.

updated Intelligence vs Latency .width 1000.format webp

Le modèle commence par produire un bloc complet de texte composé de jetons aléatoires, puis affine progressivement l’ensemble du contenu grâce à plusieurs passes successives de « débruitage » (denoising). Une méthode directement inspirée des générateurs d’images comme Stable Diffusion ou Imagen.

L’avantage est majeur : jusqu’à 256 tokens peuvent être générés et corrigés simultanément, au lieu d’être créés un à un.

Un modèle conçu pour la vitesse

Google présente DiffusionGemma comme un modèle de 26 milliards de paramètres basé sur une architecture Mixture-of-Experts (MoE). En pratique, seuls 3,8 milliards de paramètres sont activés lors de l’inférence, ce qui améliore considérablement l’efficacité.

diffusiongemma benchmark bar l.width 1000.format webp

Les performances annoncées sont particulièrement impressionnantes :

  • Plus de 1 000 tokens par seconde sur un GPU NVIDIA H100
  • Environ 700 tokens par seconde sur une GeForce RTX 5090
  • Jusqu’à 2 000 tokens par seconde sur une station NVIDIA DGX
  • Une vitesse pouvant atteindre 4 fois celle des modèles autorégressifs comparables

Google et NVIDIA expliquent que cette architecture transforme un problème traditionnellement limité par la bande passante mémoire en une charge davantage orientée calcul, permettant une meilleure exploitation des GPU modernes et des Tensor Cores.

Des usages adaptés aux workflows complexes

Cette approche ouvre la porte à des scénarios particulièrement intéressants. Grâce à son attention bidirectionnelle, DiffusionGemma peut analyser simultanément l’ensemble du texte qu’il produit. Cela le rend particulièrement pertinent pour l’édition de texte en temps réel, le remplissage de code (code infilling), la correction de documents, les séquences biologiques et génétiques, les structures mathématiques complexes et les assistants IA locaux à faible latence.

sudoku before after11

Google cite notamment un projet de fine-tuning réalisé par Unsloth, où DiffusionGemma a été entraîné à résoudre des grilles de Sudoku, un exercice particulièrement difficile pour les modèles générant du texte de manière séquentielle.

Une IA pensée pour fonctionner localement

L’un des aspects les plus intéressants de DiffusionGemma concerne son déploiement. Une fois quantifié, le modèle peut fonctionner avec environ 18 Go de VRAM, ce qui le rend exploitable sur des cartes graphiques grand public haut de gamme comme les GeForce RTX 4090 et RTX 5090.

Google positionne ainsi DiffusionGemma comme un candidat sérieux pour les assistants IA locaux, les agents autonomes fonctionnant directement sur PC ou encore les workflows de développement sans dépendance au cloud.

Cette stratégie s’inscrit dans une tendance de fond du marché : réduire les coûts d’inférence tout en améliorant la confidentialité des données.

Open source et largement compatible

Distribué sous licence Apache 2.0, DiffusionGemma est disponible dès aujourd’hui avec un large écosystème logiciel :

Le modèle peut être téléchargé librement, testé via les API NVIDIA ou déployé localement sur des machines compatibles.

Une démonstration technologique plus qu’un remplaçant de Gemini

Google reste toutefois prudent. L’entreprise reconnaît que DiffusionGemma ne surpasse pas encore les modèles Gemma 4 en matière de qualité de génération pure. Le projet vise avant tout à explorer une nouvelle architecture capable de repousser les limites actuelles de la vitesse d’inférence.

Mais, l’enjeu dépasse largement ce modèle expérimental.

Alors que l’industrie cherche à rendre les assistants IA plus réactifs, plus autonomes et davantage capables de fonctionner localement, la génération par diffusion pourrait représenter l’une des pistes les plus prometteuses de la prochaine génération de modèles de langage.

En d’autres termes, DiffusionGemma n’est peut-être pas seulement une expérimentation. Il pourrait être un aperçu de ce que seront les IA conversationnelles de demain : plus rapides, plus flexibles et moins dépendantes du cloud.

Lire plus
Intelligence Artificielle

OpenAI préparerait déjà GPT-5.6 : une nouvelle étape dans la guerre des modèles IA

OpenAI préparerait déjà GPT-5.6 : une nouvelle étape dans la guerre des modèles IA

À peine quelques mois après le lancement de GPT-5.5, OpenAI semble prêt à accélérer encore le rythme. Selon plusieurs sources citées par The Information, l’entreprise pourrait dévoiler GPT-5.6 dès ce mois-ci, illustrant une fois de plus la cadence effrénée qui caractérise désormais l’industrie de l’intelligence artificielle.

Dans un marché où Anthropic, Google, Meta et xAI multiplient les annonces, le cycle de renouvellement des modèles IA ressemble de plus en plus à celui des smartphones haut de gamme : chaque avancée est rapidement suivie par une version encore plus performante.

GPT-5.6 attendu comme une évolution majeure

D’après le rapport, le directeur scientifique d’OpenAI, Jakub Pachocki, aurait indiqué aux équipes internes que GPT-5.6 constituerait une « amélioration significative » par rapport à GPT-5.5.

Même si OpenAI n’a encore communiqué aucun détail technique, plusieurs axes d’amélioration semblent probables.

GPT-5.5 avait déjà marqué un bond important en matière de compréhension contextuelle, de vitesse de traitement et d’interprétation des intentions utilisateur. GPT-5.6 pourrait pousser encore plus loin ces capacités, tout en renforçant l’efficacité énergétique des modèles et leurs mécanismes de sécurité.

Cette évolution intervient alors que les principaux acteurs du secteur cherchent à concilier deux objectifs parfois contradictoires : accroître la puissance des modèles tout en réduisant les coûts d’inférence, devenus un enjeu stratégique majeur.

Une concurrence qui s’intensifie

Le timing n’a rien d’anodin. Quelques jours seulement après la présentation de Claude Fable 5 par Anthropic, OpenAI semble vouloir reprendre l’initiative médiatique.

L’écosystème IA connaît actuellement l’une de ses périodes les plus compétitives depuis l’arrivée de ChatGPT fin 2022. Google accélère le développement de Gemini, Anthropic pousse ses modèles Mythos et Fable, tandis que de nouveaux acteurs asiatiques comme Xiaomi, Alibaba ou DeepSeek investissent massivement dans les modèles open source et les architectures de nouvelle génération.

Dans ce contexte, chaque lancement devient autant un événement technologique qu’un signal envoyé au marché.

ChatGPT pourrait également évoluer

Selon les mêmes informations, GPT-5.6 accompagnerait une refonte plus large de ChatGPT. OpenAI chercherait à simplifier son offre, devenue particulièrement complexe avec la multiplication des modèles spécialisés, des modes de raisonnement avancés et des fonctionnalités destinées aux entreprises.

L’objectif semble clair : rendre l’expérience utilisateur plus cohérente tout en exploitant les capacités accrues de ses nouveaux modèles.

Cette stratégie répond également à un défi majeur pour l’industrie : transformer les modèles IA les plus puissants en outils réellement utilisables au quotidien, sans que les utilisateurs aient à comprendre les subtilités techniques qui les différencient.

L’ombre d’une introduction en Bourse

Au-delà de GPT-5.6, une autre question anime la Silicon Valley : quand OpenAI entrera-t-il en Bourse ? Selon le rapport, l’entreprise aurait récemment déposé les documents nécessaires auprès de la SEC américaine en vue d’une future introduction.

Le PDG Sam Altman aurait informé ses collaborateurs qu’une IPO pourrait intervenir « dans l’année à venir », tout en précisant que ce calendrier restait flexible.

Une déclaration qui reflète la situation particulière d’OpenAI.

D’un côté, l’entreprise a besoin de financements colossaux pour soutenir son expansion, notamment la construction de nouveaux centres de données et l’investissement massif dans les infrastructures IA. De l’autre, OpenAI évolue dans un secteur où les avancées technologiques pourraient rapidement bouleverser les modèles économiques traditionnels.

Le pari de l’intelligence artificielle générale

L’élément le plus intéressant des discussions internes concerne toutefois l’avenir de l’IA elle-même. Selon les informations rapportées, Sam Altman estime que si les modèles atteignent un niveau où ils deviennent capables de concevoir eux-mêmes de nouvelles générations d’IA — un concept connu sous le nom de « recursive self-improvement » — les conséquences pourraient être profondes.

Dans un tel scénario, les priorités d’OpenAI pourraient évoluer. L’entreprise pourrait privilégier sa flexibilité stratégique plutôt que les contraintes associées à une société cotée.

Cette réflexion montre à quel point les dirigeants de l’industrie considèrent que les prochaines années pourraient marquer un tournant majeur dans le développement de l’intelligence artificielle.

Une course qui s’accélère

Qu’il soit lancé dans quelques semaines ou plus tard cette année, GPT-5.6 illustre une réalité devenue incontournable : la compétition entre les laboratoires d’IA s’accélère à un rythme inédit.

Chaque nouveau modèle repousse les limites de ce qui semblait impossible quelques mois auparavant. Mais cette course ne se joue plus uniquement sur la qualité des réponses. Elle concerne désormais la vitesse, les coûts, les infrastructures, la sécurité et, surtout, la capacité à transformer ces avancées en produits adoptés à grande échelle.

Pour OpenAI, GPT-5.6 pourrait ainsi représenter bien plus qu’une simple mise à jour. Il pourrait être la prochaine étape d’une stratégie visant à conserver son leadership dans un secteur où l’avance technologique ne dure parfois que quelques semaines.

Lire plus
Intelligence Artificielle

Claude Fable 5 : pourquoi la nouvelle IA cybersécurité d’Anthropic divise déjà les experts

Claude Fable 5 : pourquoi la nouvelle IA cybersécurité d’Anthropic divise déjà les experts

Anthropic voulait prouver qu’il était possible de démocratiser une IA de cybersécurité avancée sans ouvrir la porte aux abus. Avec Claude Fable 5, la société franchit une étape importante en rendant accessible au grand public une partie des capacités de sa technologie Mythos.

Mais à peine lancé, le modèle suscite déjà des critiques dans la communauté de la sécurité informatique.

Entre promesses impressionnantes et limitations controversées, Claude Fable 5 illustre parfaitement le dilemme auquel font face les laboratoires d’IA : comment fournir des outils puissants aux professionnels sans offrir les mêmes capacités aux acteurs malveillants ?

Claude Fable 5 : la version publique d’une IA née pour la cybersécurité

Depuis plusieurs mois, Anthropic met en avant les capacités de sa famille de modèles Mythos pour l’analyse de vulnérabilités, la recherche de failles logicielles et l’assistance aux équipes de sécurité.

Avec Claude Fable 5, l’entreprise propose désormais une version grand public de cette technologie. Selon Anthropic, le modèle surpasse non seulement les précédentes générations Claude, mais également plusieurs concurrents majeurs, comme GPT-5.5 d’OpenAI ou Gemini 3.1 Pro de Google sur des tâches liées au raisonnement, au développement logiciel et à la cybersécurité.

L’objectif est clair : permettre aux entreprises d’identifier plus rapidement les vulnérabilités, d’analyser des incidents complexes et d’accélérer le développement de correctifs.

Mais, cette puissance s’accompagne d’une surveillance étroite.

Des garde-fous omniprésents

La principale différence entre Claude Fable 5 et sa version plus avancée, Claude Mythos 5, ne réside pas dans les performances brutes mais dans les restrictions appliquées au modèle.

Dès qu’une requête est considérée comme potentiellement sensible — création de malware, analyse offensive, exploitation de vulnérabilités ou certaines tâches de sécurité avancées — Fable 5 bascule automatiquement vers Claude Opus 4.8, un modèle moins puissant et davantage encadré.

Mythos 5, lui, conserve l’intégralité de ses capacités. Mais, il reste réservé aux organisations approuvées dans le cadre du programme Project Glasswing, une initiative menée avec des partenaires stratégiques tels qu’Apple, Google, Microsoft et plusieurs agences gouvernementales américaines.

Anthropic présente cette architecture comme un compromis entre innovation et sécurité. Une partie du secteur n’est toutefois pas convaincue.

Les professionnels de la cybersécurité dénoncent une IA trop prudente

Plusieurs experts interrogés après le lancement estiment que les mécanismes de protection réduisent considérablement l’intérêt pratique du modèle.

Le problème ne serait pas seulement le blocage de requêtes offensives évidentes. Certains professionnels rapportent que de simples demandes liées à l’audit de code sécurisé ou à l’analyse de vulnérabilités défensives peuvent également déclencher une rétrogradation automatique vers Opus 4.8. Autrement dit, les utilisateurs censés bénéficier des capacités avancées de Fable 5 se retrouvent parfois privés de celles-ci précisément lorsqu’ils en auraient le plus besoin.

D’après plusieurs spécialistes, certains mots-clés ou formulations suffiraient à activer les filtres de sécurité, rendant l’expérience imprévisible dans des scénarios professionnels légitimes.

Anthropic reconnaît d’ailleurs que ses garde-fous ont été volontairement configurés de manière conservatrice afin de privilégier un lancement rapide et sécurisé.

Un risque réel que l’industrie ne peut ignorer

La prudence d’Anthropic n’est toutefois pas dénuée de fondement. Les modèles d’IA modernes sont désormais capables d’identifier des vulnérabilités complexes à une vitesse qui dépasse largement les méthodes traditionnelles. Cette capacité constitue un avantage considérable pour les équipes de défense, mais elle représente également un risque majeur si elle tombe entre de mauvaises mains.

L’industrie a déjà observé cette évolution. Microsoft a récemment indiqué avoir corrigé un nombre record de vulnérabilités lors de son cycle de mises à jour de juin 2026, notamment grâce à l’assistance de systèmes d’intelligence artificielle capables de détecter des failles qui auraient pu passer inaperçues.

Dans ce contexte, fournir librement des capacités offensives avancées pourrait accélérer l’apparition de nouvelles attaques de type « zero-day », laissant aux éditeurs peu de temps pour réagir.

Anthropic expérimente un nouveau modèle de diffusion

Au-delà du lancement de Fable 5 lui-même, c’est surtout la stratégie d’Anthropic qui attire l’attention. L’entreprise tente de créer une séparation entre les capacités générales destinées au marché professionnel et les fonctionnalités jugées trop sensibles pour être diffusées largement.

Cette approche pourrait devenir un modèle pour l’ensemble du secteur. Plutôt que de publier des systèmes totalement ouverts ou totalement verrouillés, les laboratoires d’IA pourraient multiplier les niveaux d’accès en fonction du profil de l’utilisateur, de son activité et de son niveau de vérification.

Reste à savoir si cette stratégie satisfera les professionnels de la cybersécurité, qui réclament des outils plus puissants, ou si elle finira par frustrer les utilisateurs légitimes autant que les attaquants qu’elle cherche à bloquer.

Une équation encore loin d’être résolue

Avec Fable 5, Anthropic démontre que les modèles d’IA spécialisés dans la cybersécurité entrent dans une nouvelle phase de maturité. Les performances annoncées sont impressionnantes et l’ambition technologique est réelle.

Mais ce lancement met également en lumière la question qui dominera probablement l’industrie dans les prochaines années : jusqu’où peut-on rendre une IA puissante accessible sans créer un risque disproportionné pour l’écosystème numérique ?

Pour l’instant, Anthropic a choisi la prudence. Les prochains mois diront si ce choix permet réellement de concilier innovation, sécurité et utilité professionnelle.

Lire plus
Intelligence Artificielle

Xiaomi lance MiMo Code, un assistant IA open source pour coder dans le terminal

Xiaomi lance MiMo Code, un assistant IA open source pour coder dans le terminal

Xiaomi poursuit son offensive dans l’intelligence artificielle générative. Après avoir lancé ses modèles MiMo, le groupe chinois dévoile MiMo Code V0.1.0, un assistant de programmation IA open source conçu pour fonctionner directement dans le terminal.

Son ambition est claire : aider les développeurs sur des projets longs sans perdre le fil, l’un des grands défauts des assistants de code actuels.

Un agent de codage open source sous licence MIT

MiMo Code repose sur le projet OpenCode et est publié sous licence MIT. Les développeurs peuvent donc l’utiliser, le modifier et l’intégrer librement dans leurs propres workflows.

L’outil inclut par défaut un accès gratuit à MiMo-V2.5, le dernier modèle multimodal de Xiaomi. Il peut aussi être connecté à d’autres modèles, comme DeepSeek, Kimi ou GLM.

Une mémoire persistante pour les longs projets

La fonction la plus intéressante est son système de mémoire persistante. La plupart des assistants IA dépendent uniquement de la fenêtre de contexte du modèle. Quand celle-ci se remplit, l’outil oublie progressivement les décisions précédentes.

MiMo Code contourne ce problème avec un sous-agent en arrière-plan chargé de résumer, organiser et stocker le contexte pendant que le développeur travaille.

Une commande automatique, /dream, s’exécute tous les sept jours pour nettoyer les anciennes sessions, fusionner les doublons, vérifier les chemins de fichiers et consolider la mémoire à long terme.

harness state machine scaled

Mode Compose : du brief au code complet

Autre nouveauté : le mode Compose. Activé avec la touche Tab, il permet de donner une intention générale plutôt qu’une instruction étape par étape. L’agent peut alors planifier, concevoir, coder, tester et relire le résultat.

Xiaomi affirme que cette approche peut produire des livrables de qualité industrielle. Une promesse ambitieuse, appuyée par des scores annoncés de 62 % sur SWE-Bench Pro et 73 % sur Terminal Bench 2.

benchmark scaled

Le terminal redevient le centre du développement IA

MiMo Code mise aussi sur la simplicité. Sur macOS et Linux, l’installation passe par une seule commande. Sur Windows, elle se fait via npm. Une fois installé, il suffit de taper mimo dans le terminal.

Screen 2026 06 11 at 06.58.58

L’assistant prend également en charge l’entrée vocale grâce à MiMo-V2.5-ASR, permettant de dicter des commandes ou de lancer des actions sans utiliser le clavier.

Screen 2026 06 11 at 07.00.47

Xiaomi veut exister dans l’IA développeur

Avec MiMo Code, Xiaomi ne se contente plus de publier des modèles. L’entreprise construit progressivement un écosystème complet autour de ses IA, allant du raisonnement au multimodal, jusqu’aux agents de développement.

Le vrai enjeu sera désormais l’adoption. Face à Claude Code, GitHub Copilot, Cursor ou Gemini Code Assist, Xiaomi devra prouver que MiMo Code tient ses promesses sur des projets réels.

Mais son approche open source, sa mémoire persistante et son accès gratuit à MiMo-V2.5 pourraient lui donner une vraie place auprès des développeurs curieux et des équipes cherchant plus de contrôle sur leurs outils IA.

Lire plus
Intelligence Artificielle

Samsung lance AI Transformation : 280 000 employés formés à l’IA d’ici 2026

Samsung lance AI Transformation : 280 000 employés formés à l’IA d’ici 2026

Après avoir intégré l’intelligence artificielle dans ses smartphones, téléviseurs et appareils électroménagers, Samsung veut désormais transformer son propre fonctionnement interne. Le géant sud-coréen vient d’annoncer une initiative de grande ampleur destinée à diffuser l’IA dans l’ensemble de ses activités et auprès de ses quelque 280 000 collaborateurs.

Baptisé AI Transformation (AX), ce programme marque l’une des plus importantes réorganisations internes de Samsung ces dernières années. L’objectif : faire de l’intelligence artificielle un outil quotidien pour tous les métiers du groupe, du développement logiciel à la production industrielle.

Une adoption de l’IA à l’échelle de tout le groupe

Annoncée le 9 juin 2026, l’initiative AX vise à intégrer l’IA dans l’ensemble des filiales de Samsung.

Contrairement aux précédentes stratégies centrées sur les produits destinés au grand public, cette nouvelle phase cible directement les opérations internes de l’entreprise. Samsung souhaite améliorer la productivité, accélérer la prise de décision et automatiser certaines tâches grâce à l’intelligence artificielle.

Pour y parvenir, les employés auront accès à plusieurs plateformes d’IA générative déjà largement utilisées dans l’industrie, notamment : Google Gemini, OpenAI ChatGPT et Anthropic Claude.

Ces outils pourront être utilisés dans de nombreux domaines, allant du développement logiciel au marketing, en passant par les opérations commerciales et les activités industrielles.

Former 280 000 employés à l’intelligence artificielle

L’un des volets les plus ambitieux du projet concerne la formation. Samsung prévoit de former l’ensemble de ses effectifs mondiaux à l’IA d’ici la fin de l’année 2026. Une démarche qui témoigne de l’importance stratégique accordée à ces technologies au sein du groupe.

La transformation commence par les dirigeants.

Environ 50 présidents de divisions participeront ce mois-ci à un AX Bootcamp de deux jours organisé par l’institut de formation interne de Samsung. Dans un second temps, près de 2 300 cadres supérieurs suivront des sessions de formation de trois jours, dont la première vague devrait être achevée avant la mi-août.

Cette approche vise à créer une culture de l’IA portée directement par le management avant d’être diffusée dans l’ensemble de l’organisation.

Une nouvelle vision stratégique pour l’ère de l’IA

Samsung devrait également profiter de ces formations pour présenter sa future AX Vision, une feuille de route destinée à définir le rôle de l’intelligence artificielle dans chacun de ses métiers.

Le groupe prévoit par ailleurs de créer des départements spécialisés dans l’IA au sein de ses différentes filiales. Ces équipes auront pour mission d’accompagner l’adoption des outils, de développer des compétences internes et d’identifier de nouveaux usages adaptés à chaque activité.

Cette stratégie s’inscrit dans une tendance plus large observée chez les géants technologiques, qui cherchent désormais à appliquer l’IA non seulement à leurs produits, mais aussi à leur fonctionnement quotidien.

Samsung accélère sa mutation interne

L’annonce intervient alors que la concurrence autour de l’intelligence artificielle s’intensifie. Tandis qu’Apple mise sur Apple Intelligence, que Microsoft généralise Copilot et que Google multiplie les intégrations de Gemini, Samsung entend désormais exploiter l’IA comme un levier de transformation organisationnelle.

Au-delà des smartphones Galaxy ou des téléviseurs connectés, le groupe semble vouloir faire de l’intelligence artificielle une compétence fondamentale pour l’ensemble de son écosystème.

Cette initiative pourrait devenir l’un des projets de modernisation interne les plus ambitieux du secteur technologique en 2026, illustrant une évolution majeure : l’IA n’est plus seulement un produit, elle devient progressivement une infrastructure de travail.

Lire plus
Intelligence Artificielle

Siri AI retardé en Europe : Apple accuse le DMA, Bruxelles renvoie la balle

Siri AI retardé en Europe : Apple accuse le DMA, Bruxelles renvoie la balle

Derrière l’annonce de Siri AI à la WWDC 2026 se cache déjà un bras de fer réglementaire. Alors qu’Apple promet sa plus grande évolution de l’assistant vocal depuis son lancement, les utilisateurs européens devront patienter. Et désormais, Apple et l’Union européenne se rejettent ouvertement la responsabilité de ce retard.

Lors de la WWDC 2026, Apple a présenté Siri AI comme la pierre angulaire de la nouvelle génération d’Apple Intelligence. Plus conversationnel, capable d’interagir avec les applications, de comprendre le contexte personnel de l’utilisateur et d’agir à travers l’écosystème Apple, l’assistant représente l’une des plus importantes évolutions logicielles de l’entreprise depuis plusieurs années.

Mais, cette révolution ne sera pas disponible immédiatement dans l’Union européenne.

Apple pointe du doigt le Digital Markets Act

Selon Apple, le principal obstacle est le Digital Markets Act (DMA), la réglementation européenne destinée à limiter le pouvoir des grandes plateformes technologiques.

La firme de Cupertino affirme avoir proposé un plan de transition de 18 mois permettant de déployer Siri AI tout en développant un système intermédiaire destiné à offrir aux assistants tiers un accès sécurisé aux mêmes capacités que Siri.

Apple estime que les exigences du DMA obligeraient à accorder à des services concurrents un accès extrêmement profond aux données personnelles des utilisateurs, notamment aux messages, aux informations contextuelles et à certaines fonctions système sensibles.

Greg Joswiak, directeur marketing mondial d’Apple, a résumé la position de l’entreprise :

Nous ne voulons lancer ces fonctionnalités que lorsque nous pouvons le faire en toute sécurité.

Pour Apple, la question est donc avant tout liée à la protection des données et à la sécurité des utilisateurs.

Bruxelles rejette l’argument de la sécurité

La réponse de la Commission européenne a été particulièrement directe. Thomas Regnier, porte-parole de la Commission, a déclaré que la décision de ne pas lancer Siri AI en Europe était exclusivement celle d’Apple.

Selon Bruxelles, le DMA n’empêche en aucun cas l’introduction de nouveaux produits ou services sur le marché européen. La Commission estime au contraire qu’Apple n’a simplement pas réussi à proposer une solution d’interopérabilité conforme aux exigences européennes.

Le porte-parole européen affirme également que Apple a demandé une exemption temporaire de 18 mois afin d’échapper à certaines obligations du DMA, une requête qui aurait été refusée. Autrement dit, là où Apple invoque la sécurité, Bruxelles évoque un manque de volonté d’ouverture.

Un enjeu majeur pour Apple

L’Europe représente environ 27 % du chiffre d’affaires mondial d’Apple. Il s’agit donc d’un marché stratégique que l’entreprise ne peut pas ignorer durablement.

Au-delà de Siri AI, Apple affirme que plusieurs fonctionnalités annoncées à la WWDC sont également affectées par les contraintes réglementaires européennes, notamment certaines fonctions d’iPhone Mirroring, la traduction en temps réel sur les AirPods, plusieurs nouveautés liées à Apple Plans et certaines intégrations avancées d’Apple Intelligence.

Cette situation illustre la tension croissante entre la vision d’Apple, fondée sur un contrôle étroit de son écosystème, et la stratégie européenne qui vise à favoriser l’interopérabilité et la concurrence.

Le véritable enjeu : qui contrôle l’intelligence artificielle sur l’iPhone ?

Derrière les débats sur la sécurité et la réglementation se cache une question plus stratégique. Le DMA cherche à empêcher qu’Apple conserve un monopole sur les fonctions avancées de l’iPhone. À terme, l’objectif européen est que des assistants comme Gemini, ChatGPT ou Claude puissent accéder à certaines capacités système aujourd’hui réservées à Siri.

Apple considère cette ouverture comme un risque potentiel pour la confidentialité. Les régulateurs européens y voient au contraire une condition nécessaire pour garantir la concurrence.

Cette opposition pourrait devenir l’un des dossiers technologiques les plus sensibles des prochaines années, alors que l’intelligence artificielle devient progressivement l’interface principale entre les utilisateurs et leurs appareils.

Une bataille qui dépasse Siri

Le conflit autour de Siri AI illustre parfaitement le nouvel équilibre des forces dans l’industrie technologique. Pendant des années, Apple a pu définir seule les règles de son écosystème. Aujourd’hui, les régulateurs européens souhaitent imposer davantage d’ouverture, même lorsque cela touche à des technologies aussi sensibles que l’IA générative.

Pour les utilisateurs européens, le résultat est pour l’instant simple : Siri AI n’a toujours pas de date de lancement sur iPhone et iPad dans l’Union européenne.

Et tant qu’Apple et Bruxelles ne trouveront pas un terrain d’entente, ce retard pourrait se prolonger bien au-delà du lancement d’iOS 27.

Lire plus