Après plusieurs semaines de suspension, Anthropic annonce le retour de ses modèles d’intelligence artificielle Claude Fable 5 et Claude Mythos 5. Cette reprise intervient à la suite de la levée des restrictions imposées par le gouvernement américain sur l’exportation de ces modèles avancés.

L’entreprise en profite également pour présenter de nouvelles mesures de sécurité, un projet de standard commun contre les jailbreaks IA et un renforcement de sa collaboration avec les autorités américaines.

Pourquoi Claude Fable 5 avait été suspendu ?

Le 12 juin, le gouvernement des États-Unis avait imposé des restrictions empêchant Anthropic de fournir ses modèles les plus avancés à des ressortissants étrangers, qu’ils se trouvent aux États-Unis ou à l’étranger.

Le problème était avant tout technique.

Anthropic ne disposait d’aucun moyen fiable permettant de vérifier en temps réel la nationalité de chaque utilisateur. Pour éviter toute violation des nouvelles règles, l’entreprise avait donc choisi de suspendre l’accès à Claude Fable 5 et Claude Mythos 5 pour l’ensemble de ses utilisateurs.

Ces deux modèles avaient pourtant été lancés seulement quelques jours plus tôt, le 9 juin.

Une faille découverte par Amazon

À l’origine de cette décision se trouve un rapport réalisé par des chercheurs d’Amazon. Ces derniers avaient identifié une méthode permettant de contourner certaines protections intégrées à Claude Fable 5.

Grâce à cette technique, le modèle pouvait notamment identifier certaines vulnérabilités logicielles, expliquer comment elles fonctionnent et générer, dans certains cas, un exemple de code illustrant une exploitation potentielle.

Cette découverte avait conduit les autorités américaines à intervenir rapidement.

Anthropic affirme que plusieurs modèles concurrents étaient concernés

Après avoir travaillé avec le gouvernement américain, Amazon et d’autres partenaires, Anthropic indique avoir constaté que cette capacité n’était pas propre à Claude Fable 5. Selon l’entreprise, plusieurs modèles concurrents étaient capables d’effectuer des tâches similaires, notamment Claude Opus 4.8, GPT-5.5 et Kimi K2.7.

Anthropic précise également que la technique utilisée ne permettait pas d’accéder aux capacités avancées de Claude Mythos 5, réservé aux applications de cybersécurité défensive.

De nouvelles protections contre les jailbreaks

Pour éviter qu’un scénario similaire ne se reproduise, Anthropic annonce avoir développé un nouveau système de classification de sécurité. Selon l’entreprise, celui-ci permet désormais de bloquer la méthode de contournement dans plus de 99 % des cas, et de rediriger automatiquement certaines requêtes sensibles vers Claude Opus 4.8, considéré comme mieux adapté à ce type de demandes.

Anthropic reconnaît toutefois que ces protections plus strictes pourront parfois empêcher certaines tâches légitimes de développement ou de débogage.

Les nouveaux mécanismes ont notamment été évalués par le Center for AI Standards and Innovation (CAISI) du Département américain du Commerce, qui les juge particulièrement robustes.

Une sécurité reposant sur plusieurs niveaux

Anthropic explique que Claude Fable 5 utilise désormais une stratégie dite de « défense en profondeur ». Cette approche combine plusieurs mécanismes complémentaires :

un entraînement spécifique du modèle pour refuser les demandes dangereuses
des classificateurs automatiques capables d’analyser les requêtes
des systèmes de détection des usages malveillants
une analyse rétrospective du comportement du modèle
plusieurs couches supplémentaires de sécurité

L’objectif est de limiter autant que possible les risques liés aux attaques par jailbreak, qui cherchent à contourner les garde-fous intégrés aux modèles d’IA.

Un futur standard pour évaluer les jailbreaks

Anthropic souhaite également aller plus loin. L’entreprise travaille avec Amazon, Microsoft, Google ainsi que d’autres partenaires du projet Glasswing afin de créer un cadre commun permettant d’évaluer la gravité des jailbreaks.

Quatre critères seraient retenus :

le gain réel de capacités obtenu
l’étendue des nouvelles capacités accessibles
la facilité avec laquelle l’attaque peut être exploitée
la facilité avec laquelle elle peut être reproduite

Selon Anthropic, ce référentiel pourrait permettre aux entreprises et aux gouvernements de mieux coordonner leurs réponses face aux vulnérabilités les plus critiques.

La société prévoit également de mettre en place une équipe de surveillance disponible 24 heures sur 24 ainsi qu’un programme HackerOne dédié aux signalements de failles concernant Claude Fable 5.

Une coopération renforcée avec le gouvernement américain

Anthropic indique avoir travaillé étroitement avec plusieurs agences fédérales américaines au cours des dernières semaines afin de préparer les nouvelles règles encadrant les IA de pointe.

L’entreprise s’engage notamment à fournir un accès anticipé à ses futurs modèles aux autorités, accélérer le partage d’informations sur les nouveaux jailbreaks, consacrer davantage de ressources à la recherche sur la sécurité des IA, et participer au nouveau centre américain chargé de coordonner les signalements de vulnérabilités liées aux modèles d’intelligence artificielle.

Anthropic estime également que les futures exigences de sécurité devraient être harmonisées et appliquées à l’ensemble des acteurs développant des modèles d’IA de nouvelle génération.

Claude Fable 5 est de nouveau disponible

Le retour de Claude Fable 5 est désormais effectif sur Claude.ai, Claude Platform, Claude Code et Claude Cowork. Les abonnés Pro, Max, Team ainsi que certains clients Enterprise pourront utiliser le modèle dans la limite de 50 % de leur quota hebdomadaire jusqu’au 7 juillet.

À partir de cette date, Anthropic basculera vers un système de consommation basé sur des crédits. L’entreprise prévoit également de rétablir rapidement l’accès via Amazon Web Services, Google Cloud et Microsoft Foundry.

De son côté, Claude Mythos 5 est de nouveau accessible à plusieurs organisations américaines autorisées, tandis qu’Anthropic poursuit ses discussions avec le gouvernement afin d’élargir progressivement cet accès à d’autres partenaires du projet Glasswing, aux États-Unis comme à l’international.

Faux Steam Machine à prix cassé ? Cette mini console SteamOS venue de Chine soulève de sérieux doutes

Instagram Edits s’enrichit avec des sous-titres bilingues, de nouveaux modèles et des effets sonores

Opera lance Paste Protect pour bloquer les attaques ClickFix avant qu’il ne soit trop tard

Xbox : Microsoft préparerait un système pour transformer vos jeux sur disque en versions numériques

Test de la HUAWEI Watch Fit 5 Pro : l’Apple Watch de ceux qui ne veulent pas d’Apple Watch

Test de la HUAWEI Watch GT Runner 2 : La montre qui veut détrôner Garmin

Test du DJI ROMO P : DJI réussit-il son premier robot aspirateur haut de gamme ?

Test de NotebookLM : L’application de Google est-elle le copilot IA rêvé ?

One UI 9.0 : Samsung teste déjà la mise à jour sur de nombreux smartphones Galaxy, y compris des modèles abordables

HONOR Magic V6 : le pliable ultra-fin arrive en France

iPhone 18 Pro Max : une batterie plus grande serait au programme, selon une nouvelle fuite

Ear (3a) : Nothing prépare ses nouveaux écouteurs magiques !