fermer
Intelligence Artificielle

Anthropic rétablit Claude Fable 5 et Mythos 5 après la levée des restrictions américaines

Anthropic rétablit Claude Fable 5 et Mythos 5 après la levée des restrictions américaines
Anthropic rétablit Claude Fable 5 et Mythos 5 après la levée des restrictions américaines

Après plusieurs semaines de suspension, Anthropic annonce le retour de ses modèles d’intelligence artificielle Claude Fable 5 et Claude Mythos 5. Cette reprise intervient à la suite de la levée des restrictions imposées par le gouvernement américain sur l’exportation de ces modèles avancés.

L’entreprise en profite également pour présenter de nouvelles mesures de sécurité, un projet de standard commun contre les jailbreaks IA et un renforcement de sa collaboration avec les autorités américaines.

Pourquoi Claude Fable 5 avait été suspendu ?

Le 12 juin, le gouvernement des États-Unis avait imposé des restrictions empêchant Anthropic de fournir ses modèles les plus avancés à des ressortissants étrangers, qu’ils se trouvent aux États-Unis ou à l’étranger.

Le problème était avant tout technique.

Anthropic ne disposait d’aucun moyen fiable permettant de vérifier en temps réel la nationalité de chaque utilisateur. Pour éviter toute violation des nouvelles règles, l’entreprise avait donc choisi de suspendre l’accès à Claude Fable 5 et Claude Mythos 5 pour l’ensemble de ses utilisateurs.

Ces deux modèles avaient pourtant été lancés seulement quelques jours plus tôt, le 9 juin.

Une faille découverte par Amazon

À l’origine de cette décision se trouve un rapport réalisé par des chercheurs d’Amazon. Ces derniers avaient identifié une méthode permettant de contourner certaines protections intégrées à Claude Fable 5.

Grâce à cette technique, le modèle pouvait notamment identifier certaines vulnérabilités logicielles, expliquer comment elles fonctionnent et générer, dans certains cas, un exemple de code illustrant une exploitation potentielle.

Cette découverte avait conduit les autorités américaines à intervenir rapidement.

Anthropic affirme que plusieurs modèles concurrents étaient concernés

Après avoir travaillé avec le gouvernement américain, Amazon et d’autres partenaires, Anthropic indique avoir constaté que cette capacité n’était pas propre à Claude Fable 5. Selon l’entreprise, plusieurs modèles concurrents étaient capables d’effectuer des tâches similaires, notamment Claude Opus 4.8, GPT-5.5 et Kimi K2.7.

Anthropic précise également que la technique utilisée ne permettait pas d’accéder aux capacités avancées de Claude Mythos 5, réservé aux applications de cybersécurité défensive.

De nouvelles protections contre les jailbreaks

0cf1fc27ba70725d56c623b27dc1f05228a303c2 3840x1732 1 scaled

Pour éviter qu’un scénario similaire ne se reproduise, Anthropic annonce avoir développé un nouveau système de classification de sécurité. Selon l’entreprise, celui-ci permet désormais de bloquer la méthode de contournement dans plus de 99 % des cas, et de rediriger automatiquement certaines requêtes sensibles vers Claude Opus 4.8, considéré comme mieux adapté à ce type de demandes.

Anthropic reconnaît toutefois que ces protections plus strictes pourront parfois empêcher certaines tâches légitimes de développement ou de débogage.

Les nouveaux mécanismes ont notamment été évalués par le Center for AI Standards and Innovation (CAISI) du Département américain du Commerce, qui les juge particulièrement robustes.

Une sécurité reposant sur plusieurs niveaux

Anthropic explique que Claude Fable 5 utilise désormais une stratégie dite de « défense en profondeur ». Cette approche combine plusieurs mécanismes complémentaires :

  • un entraînement spécifique du modèle pour refuser les demandes dangereuses
  • des classificateurs automatiques capables d’analyser les requêtes
  • des systèmes de détection des usages malveillants
  • une analyse rétrospective du comportement du modèle
  • plusieurs couches supplémentaires de sécurité

L’objectif est de limiter autant que possible les risques liés aux attaques par jailbreak, qui cherchent à contourner les garde-fous intégrés aux modèles d’IA.

Un futur standard pour évaluer les jailbreaks

Anthropic souhaite également aller plus loin. L’entreprise travaille avec Amazon, Microsoft, Google ainsi que d’autres partenaires du projet Glasswing afin de créer un cadre commun permettant d’évaluer la gravité des jailbreaks.

Quatre critères seraient retenus :

  • le gain réel de capacités obtenu
  • l’étendue des nouvelles capacités accessibles
  • la facilité avec laquelle l’attaque peut être exploitée
  • la facilité avec laquelle elle peut être reproduite

Selon Anthropic, ce référentiel pourrait permettre aux entreprises et aux gouvernements de mieux coordonner leurs réponses face aux vulnérabilités les plus critiques.

La société prévoit également de mettre en place une équipe de surveillance disponible 24 heures sur 24 ainsi qu’un programme HackerOne dédié aux signalements de failles concernant Claude Fable 5.

Une coopération renforcée avec le gouvernement américain

Anthropic indique avoir travaillé étroitement avec plusieurs agences fédérales américaines au cours des dernières semaines afin de préparer les nouvelles règles encadrant les IA de pointe.

L’entreprise s’engage notamment à fournir un accès anticipé à ses futurs modèles aux autorités, accélérer le partage d’informations sur les nouveaux jailbreaks, consacrer davantage de ressources à la recherche sur la sécurité des IA, et participer au nouveau centre américain chargé de coordonner les signalements de vulnérabilités liées aux modèles d’intelligence artificielle.

Anthropic estime également que les futures exigences de sécurité devraient être harmonisées et appliquées à l’ensemble des acteurs développant des modèles d’IA de nouvelle génération.

Claude Fable 5 est de nouveau disponible

Le retour de Claude Fable 5 est désormais effectif sur Claude.ai, Claude Platform, Claude Code et Claude Cowork. Les abonnés Pro, Max, Team ainsi que certains clients Enterprise pourront utiliser le modèle dans la limite de 50 % de leur quota hebdomadaire jusqu’au 7 juillet.

À partir de cette date, Anthropic basculera vers un système de consommation basé sur des crédits. L’entreprise prévoit également de rétablir rapidement l’accès via Amazon Web Services, Google Cloud et Microsoft Foundry.

De son côté, Claude Mythos 5 est de nouveau accessible à plusieurs organisations américaines autorisées, tandis qu’Anthropic poursuit ses discussions avec le gouvernement afin d’élargir progressivement cet accès à d’autres partenaires du projet Glasswing, aux États-Unis comme à l’international.

Tags : AnthropicClaudeFable 5Mythos 5
Yohann Poiron

The author Yohann Poiron

J’ai fondé le BlogNT en 2010. Autodidacte en matière de développement de sites en PHP, j’ai toujours poussé ma curiosité sur les sujets et les actualités du Web. Je suis actuellement engagé en tant qu’architecte interopérabilité.