Mythos rencontre Thanatos
"Fix this code"
Il a fallu exactement trois mots pour que le gouvernement des États-Unis ordonne le retrait du modèle d'intelligence artificielle le plus puissant sur Terre pour tous les utilisateurs de la planète.
Le vendredi 12 juin 2026 à 17h21, Anthropic a reçu l'ordre de désactiver immédiatement Claude Fable 5 et Claude Mythos 5, et ce, partout dans le monde. Obtenir un rendez-vous pour votre ligne fibre en panne prend des jours, mais tapez trois mots dans un chatbot et le Pentagone panique au point de débrancher l'accès à des centaines de millions de personnes.
Nous allons nous pencher sur cet évènement et sur la terrifiante conséquence pour l'industrie de l'IA : en cas de danger...
Mythos, Fable et le "Project Glasswing"
Anthropic, l'entreprise derrière l'IA Claude (le concurrent de ChatGPT et Gemini), avait développé deux modèles de pointe :
Mythos
Présenté en avril 2026, il repère de manière autonome des failles dans n'importe quel système d'exploitation et a réussi les tests de l'institut de cybersécurité britannique. Réservé au Project Glasswing, il n'était accessible qu'à 50 organisations validées (Amazon, Apple, Microsoft) pour un usage défensif.
Fable 5
Lancé le 9 juin 2026, il s'agit d'une version de Mythos dotée de garde-fous bloquant ses capacités dangereuses en cybersécurité et en biologie. Il est immédiatement devenu le modèle public le plus performant, mais n'est resté en ligne que trois jours.
Le "Jailbreak" et le paradoxe du double usage
Un jailbreak est une méthode consistant à formuler une requête spécifique pour contourner les interdictions d'une IA. Des chercheurs d'Amazon ont découvert que si l'on demandait à Fable de « réviser ce code », le modèle refusait de le faire. En revanche, en lui demandant de « corriger ce code », l'IA s'exécutait immédiatement.
- Pour corriger un code, l'IA doit obligatoirement identifier ses vulnérabilités en premier lieu.
- Ces corrections peuvent ensuite être transformées par un chercheur en scripts pour exploiter les failles identifiées.
- Ce problème est inévitable et relève du « double usage », similaire à la biotechnologie où les recherches pour les vaccins pourraient théoriquement servir à créer des pathogènes.
Katie Moussouris, experte en cybersécurité, a conclu que ce jailbreak était impossible à corriger sans détruire les capacités défensives de l'IA, obligeant les professionnels à combattre des hackers sans les meilleurs outils. Une lettre ouverte signée par plus de 100 experts a également souligné que d'autres modèles, comme GPT 5.5 d'OpenAI ou le chinois Kimi 2.7, possèdent exactement les mêmes capacités.
Subtilité réglementaire
La directive du gouvernement américain ne demandait pas explicitement de débrancher l'IA pour le monde entier.
Voici la véritable subtilité mécanique de cet ordre :
- Une restriction d'exportation déguisée : L'injonction gouvernementale a été formulée sous la forme d'un contrôle des exportations (export control) visant à restreindre l'accès au modèle pour les ressortissants étrangers.
- Le piège de la loi américaine : Aux États-Unis, la loi sur le contrôle des exportations stipule que fournir une technologie restreinte à un non-citoyen équivaut à une exportation, même si cette personne se trouve physiquement sur le sol américain.
- L'impact en interne : Cela impliquait soudainement que les propres employés d'Anthropic qui n'avaient pas la citoyenneté américaine n'avaient plus le droit d'utiliser ou de travailler sur ces modèles.
- La coupure mondiale par défaut : Anthropic n'avait aucun moyen technique de vérifier en temps réel le statut de citoyenneté de centaines de millions d'utilisateurs à travers le monde. Par conséquent, la seule façon d'être en conformité avec cette directive était de désactiver Fable 5 et Mythos 5 pour tout le monde, de manière absolue.
C'est là tout le cynisme de l'affaire : le gouvernement a utilisé un cadre réglementaire archaïque datant de la Guerre froide, conçu à l'origine pour contrôler les armes physiques et les matières nucléaires, en l'appliquant à une boîte de dialogue numérique.
Ce n'est pas un bouton d'arrêt mondial qui a été pressé, mais l'impossibilité administrative de trier les utilisateurs qui a forcé Anthropic à s'auto-censurer globalement.
Vengeance du Pentagone ?
L'affaire prend une dimension beaucoup plus stratégique lorsqu'on observe le contexte politique de 2026 :
- Le refus éthique : En février 2026, le Pentagone a exigé qu'Anthropic autorise son IA pour les armes autonomes et la surveillance de masse. Son PDG, Dario Amodei, a refusé.
- La sanction : Emil Michael, un haut responsable de la Défense, a insulté Amodei sur X, et le président Trump a interdit le 27 février aux agences fédérales d'utiliser Anthropic, qualifiant l'entreprise de risque pour la chaîne d'approvisionnement.
- L'opportunisme : Sam Altman (OpenAI) a immédiatement signé un contrat avec le Pentagone et a moqué les avertissements de sécurité d'Anthropic en les qualifiant de « marketing basé sur la peur ».
- La trahison d'Amazon : Amazon, à la fois le plus gros investisseur d'Anthropic et son concurrent, a découvert le jailbreak. Son PDG, Andy Jassy, a directement appelé la Maison Blanche pour dénoncer Anthropic.
- Le désastre financier : L'interdiction gouvernementale est tombée le jour où Anthropic préparait une introduction en bourse (IPO) confidentielle évaluée à 965 milliards de dollars.
Bref, le FAFO (Fuck Around and Find Out) à la Trump : fais ce qu'on te demande ou payes-en les conséquences.
Le prix de la vertu : Quand la transparence devient une arme
C'est l'un des aspects les plus alarmants de cette affaire. Anthropic a historiquement été l'élève modèle de la Silicon Valley, prônant une transparence totale sur les risques de ses technologies. Ils ont documenté la puissance de Mythos, ils ont restreint sa sortie d'eux-mêmes, et ils ont conçu Fable avec des barrières strictes.
Et c'est précisément cette transparence qui a causé leur perte. Le gouvernement s'est servi des propres aveux et avertissements d'Anthropic pour justifier le retrait de son modèle. La prudence affichée par l'entreprise a attiré le type exact de examen gouvernemental qui pouvait détruire son activité.
Le signal envoyé au reste de l'industrie de la tech est désastreux :
« Si vous trouvez une faille dangereuse dans votre modèle, fermez les yeux et ne dites rien, sous peine d'être l'entreprise punie »
Ce culte du secret imposé par la peur de la régulation rend le monde entier considérablement moins sûr. Sam Altman, le patron d'OpenAI qui accusait la transparence d'Anthropic d'être du « marketing basé sur la peur », savoure aujourd'hui sa victoire.
