Anthropic ne se contente plus de courir derrière la puissance des modèles : l’entreprise veut désormais peser sur l’équilibre même de la cybersécurité mondiale.
Avec Project Glasswing, la startup de San Francisco lance une initiative d’envergure qui associe un modèle inédit, Claude Mythos Preview, à une coalition de grands groupes technologiques et financiers pour détecter et corriger des failles critiques avant qu’elles ne tombent entre de mauvaises mains.
Une initiative qui dépasse largement le simple effet d’annonce
Anthropic présente son projet Glasswing comme un effort coordonné pour sécuriser les logiciels qui soutiennent les infrastructures les plus sensibles. Parmi les partenaires de lancement figurent notamment AWS, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, la Linux Foundation, Microsoft, Nvidia et Palo Alto Networks. L’entreprise indique aussi avoir étendu l’accès à plus de 40 autres organisations qui développent ou maintiennent des briques logicielles critiques, avec jusqu’à 100 millions de dollars de crédits d’usage pour Claude Mythos Preview et 4 millions de dollars de dons destinés à la sécurité open source.
Ce positionnement est important. Glasswing n’est pas lancé comme un simple produit de sécurité, mais comme une tentative de créer un avantage défensif temporaire, avant que des capacités comparables ne deviennent plus largement accessibles. Anthropic le dit presque sans détour : la progression de l’IA est telle que ce type de compétence cyber pourrait se diffuser en quelques mois, pas en plusieurs années.
Claude Mythos Preview, un modèle trop puissant pour une diffusion publique
Au centre du dispositif, on trouve Claude Mythos Preview, un modèle généraliste que Anthropic dit ne pas vouloir rendre disponible au grand public en raison de ses capacités en cybersécurité. Selon l’entreprise, le modèle a déjà permis d’identifier des milliers de vulnérabilités sévères, y compris dans tous les grands systèmes d’exploitation et tous les grands navigateurs web. Anthropic affirme aussi que Mythos a pu découvrir et, dans de nombreux cas, exploiter ces failles de manière largement autonome.
Les exemples avancés sont loin d’être anecdotiques. Anthropic cite une faille vieille de 27 ans dans OpenBSD, une vulnérabilité de 16 ans dans FFmpeg passée sous les radars de millions de tests automatisés, ainsi qu’une chaîne de failles dans le noyau Linux permettant une élévation de privilèges jusqu’au contrôle total de la machine. L’entreprise précise que ces cas ont été signalés puis corrigés.

Sur les benchmarks internes et publics qu’Anthropic met en avant, l’écart avec Claude Opus 4.6 est net : 83,1 % sur CyberGym contre 66,6 %, 93,9 % sur SWE-bench Verified contre 80,8 %, et 77,8 % sur SWE-bench Pro contre 53,4 %. Pris ensemble, ces chiffres soutiennent l’idée d’un vrai saut de génération, même s’ils viennent d’Anthropic et doivent donc être lus comme des résultats fournis par l’éditeur lui-même.

Le vrai défi n’est pas seulement de trouver les failles, mais de les absorber
C’est sans doute le point le plus délicat de tout le projet. Trouver des milliers de zero-days peut sembler impressionnant ; les divulguer de façon responsable sans submerger les mainteneurs est une autre histoire. Anthropic dit avoir mis en place un pipeline de tri, avec validation humaine des rapports les plus critiques avant transmission aux équipes concernées, ainsi qu’un rythme de disclosure censé s’adapter à la capacité réelle des projets à absorber les correctifs. Anthropic prévoit d’accompagner, quand c’est possible, les rapports de propositions de correctifs, tout en recommandant une revue humaine complète.
Cette prudence est essentielle, car l’initiative touche un angle mort bien connu de la sécurité moderne : l’open source critique repose souvent sur des équipes minuscules, voire des bénévoles. C’est d’ailleurs ce que souligne la Linux Foundation, qui voit dans Glasswing une manière potentielle de démocratiser un niveau d’expertise jusque-là réservé aux grandes entreprises dotées d’équipes sécurité substantielles.
Une annonce qui arrive au moment où Anthropic change d’échelle
Le contexte compte presque autant que le projet lui-même. La veille, Anthropic annonçait avoir dépassé les 30 milliards de dollars de run rate annuel, contre environ 9 milliards à la fin de 2025, avec plus de 1 000 clients entreprises dépensant chacun plus d’un million de dollars par an. Dans le même mouvement, la société a officialisé un nouvel accord avec Google et Broadcom pour plusieurs gigawatts de capacité TPU de nouvelle génération, attendus à partir de 2027.
Autrement dit, le projet Glasswing n’arrive pas dans une semaine ordinaire. Il s’inscrit dans une séquence où Anthropic cherche à montrer qu’elle n’est plus seulement un laboratoire ambitieux, mais une entreprise capable d’influencer simultanément l’infrastructure IA, le marché enterprise et désormais les doctrines de cybersécurité. C’est aussi ce qui donne à l’annonce une portée plus stratégique qu’un simple lancement de fonctionnalité.
Le paradoxe Anthropic : prêcher la sécurité en traînant encore quelques failles opérationnelles
Le projet n’échappe pas à une ironie assez visible. Ces dernières semaines, Anthropic a été bousculée par plusieurs incidents relayés dans la presse, notamment une fuite liée à un billet de blog brouillon et une erreur de packaging autour de Claude Code. L’existence même de Mythos avait commencé à circuler avant l’annonce officielle. Anthropic affirme que ces incidents relevaient d’erreurs humaines dans les outils de publication, non d’une compromission de son architecture de sécurité principale.
La distinction est techniquement importante, mais sur le plan réputationnel, elle ne suffira pas toujours. Lorsqu’une entreprise explique avoir construit un modèle capable de trouver et d’exploiter des vulnérabilités de très haut niveau, la moindre faiblesse opérationnelle prend immédiatement une dimension symbolique. Et dans ce dossier, la confiance est peut-être l’actif le plus critique de tous.
Anthropic essaie de fixer les règles avant que le marché ne les subisse
Le projet Glasswing raconte au fond une chose très simple : Anthropic estime que la bascule a déjà commencé. L’IA n’est plus seulement un outil d’assistance au code ; elle devient un acteur capable de changer la vitesse, l’échelle et la nature même de la découverte de vulnérabilités. Dans ce contexte, la vraie bataille ne consiste plus à savoir si ces capacités vont exister, mais qui les utilisera en premier de façon industrielle : les défenseurs ou les attaquants.
C’est ce qui rend l’initiative si intéressante. Anthropic fait un pari très précis : restreindre temporairement l’accès au modèle, l’orienter vers un cercle de partenaires jugés responsables, financer l’écosystème open source, puis partager dans les 90 jours les premiers enseignements publics. Ce n’est pas une garantie de succès, mais c’est une tentative de créer une doctrine avant que la prolifération technique n’impose la sienne.
La question n’est donc plus de savoir si l’IA va transformer la cybersécurité. Elle l’a déjà commencé. La vraie inconnue, désormais, est de savoir si les défenseurs ont assez d’avance pour que cette transformation reste gérable.



