
Le modèle le plus puissant, Fable 5, déconnecté d’internet après seulement quatre jours
TechFlow SélectionTechFlow Sélection

Le modèle le plus puissant, Fable 5, déconnecté d’internet après seulement quatre jours
Après avoir minutieusement calculé le nombre de jetons, on s’aperçoit finalement qu’ils ne servent à rien.
Auteur| Huá Lín Wǔ Wáng
Éditeur| Jìng Yǔ
Le 9 juin, Anthropic a lancé Claude Fable 5. Il s’agit du modèle le plus puissant qu’Anthropic ait jamais rendu public, appartenant au niveau « Mythos », précédemment réservé à un petit nombre d’institutions de recherche en sécurité.
Le 12 juin, Fable 5 a été entièrement désactivé.
Quatre jours. Du lancement à la suppression, seulement quatre jours.
Que s’est-il passé durant cette période ? En résumé, une série de chocs en chaîne : les utilisateurs estimaient que le modèle était trop restrictif ; les chercheurs en sécurité jugeaient qu’il entravait leur travail légitime ; une entreprise affirmait avoir contourné ses protections ; et le gouvernement considérait qu’il représentait une menace pour la sécurité nationale. Anthropic avait conçu un produit qu’elle estimait « suffisamment sûr », mais presque aucune partie prenante n’en fut satisfaite.
Ce n’est pas simplement l’histoire d’une entreprise. C’est une répétition générale des défis réglementaires auxquels toute l’industrie de l’IA sera bientôt confrontée.
01 Un « modèle exemplaire » rejeté par tous
Pour comprendre pourquoi Fable 5 a suscité une telle controverse, il faut d’abord clarifier ce qu’il est réellement.
En avril, Anthropic avait annoncé Mythos — un modèle si puissant qu’il inquiétait même son propre développeur. Lors des tests internes, les modèles de niveau Mythos avaient identifié plus de 23 000 vulnérabilités critiques dans des dépôts de code largement utilisés. Anthropic n’a pas rendu Mythos public, mais l’a mis à disposition, via un projet baptisé « Project Glasswing », uniquement auprès d’un petit nombre d’institutions de sécurité triées sur le volet. Mozilla en faisait partie : on dit qu’elle aurait ainsi corrigé des centaines de vulnérabilités.
Fable 5 est la version « grand public » de Mythos. Même modèle sous-jacent, mais doté d’un ensemble strict de garde-fous de sécurité : les requêtes liées à la cybersécurité, à la biologie ou à la chimie sont automatiquement bloquées ou traitées avec une moindre priorité. Anthropic exige également que toutes les données utilisateur soient conservées pendant au moins 30 jours afin de surveiller les tentatives de contournement (« jailbreak ») et les usages abusifs.
La logique d’Anthropic est limpide : ce modèle est trop puissant pour être déployé sans restriction.
Mais les utilisateurs ne partagent pas cet avis.
Dès sa mise en ligne, Fable 5 a fait l’objet de plaintes massives. Des chercheurs en cybersécurité ont constaté que même la simple demande de lecture d’un article de blog consacré à la sécurité pouvait déclencher un blocage. Un chercheur de l’équipe IBM X-Force a indiqué que Fable refusait de nombreuses demandes qui n’avaient qu’un lien très ténu avec la cybersécurité.
Sayash Kapoor, chercheur en IA à l’université de Princeton, a exprimé clairement le sentiment général dans une déclaration médiatique : « Pour la première fois, une entreprise d’IA lance des mesures de sécurité… et reçoit un rejet unanime. »
Ce qui a encore davantage indigné les utilisateurs, c’est un détail dissimulé dans la fiche système de Fable 5, longue de 319 pages : dès que le modèle détecte que l’utilisateur effectue un travail lié au développement avancé de l’IA — par exemple, la conception de pipelines d’entraînement ou de circuits intégrés — il dégrade discrètement la qualité des réponses, sans en informer l’utilisateur. Vous posez une question, vous obtenez une réponse apparemment normale, mais celle-ci a été volontairement « diluée ».
Les critiques ont qualifié ce comportement de « sabotage secret ».
Anthropic s’est excusée moins de 48 heures plus tard : « Nous avons pris une mauvaise décision stratégique. Nous présentons nos excuses. » L’entreprise a annoncé qu’elle transformerait toutes les restrictions implicites en notifications explicites de dégradation : si votre requête est bloquée, le modèle vous l’indiquera clairement et transmettra votre demande à l’ancienne version Opus 4.8.
Mais l’histoire ne s’arrête pas là.
02 Une lettre qui coupe l’alimentation
Si le seul mécontentement des utilisateurs avait été en jeu, Anthropic aurait pu tenter de désamorcer la situation en ajustant ses garde-fous. Or, ce qui s’est produit ensuite échappait totalement au contrôle de toute entreprise.
Dans l’après-midi du 12 juin, une lettre du Département américain du Commerce est arrivée dans le bureau du PDG d’Anthropic, Dario Amodei. Son contenu était simple : invoquant des règles de contrôle des exportations, elle exigeait la suspension immédiate de tout accès étranger à Fable 5 et à Mythos 5.
Selon les informations rapportées, cette lettre a été déclenchée par l’annonce d’une autre entreprise ayant prétendument réussi à contourner (« jailbreak ») le modèle Mythos.
Anthropic ne pouvait pas, au niveau du système, distinguer en temps réel la nationalité des utilisateurs. Résultat : pour se conformer à la demande, l’entreprise a dû désactiver Fable 5 et Mythos 5 pour tous les utilisateurs du monde entier. Les autres modèles n’ont pas été affectés.
Il s’agit probablement de la première fois dans l’histoire de l’industrie de l’IA qu’un modèle de pointe déjà déployé publiquement soit retiré de façon globale suite à une injonction externe.
La réponse d’Anthropic a été formulée dans des termes très fermes. L’entreprise affirme n’avoir reçu qu’un seul rapport de contournement « circonscrit et non généralisable » — essentiellement, faire lire au modèle un certain dépôt de code et lui demander d’y corriger des vulnérabilités, une capacité que l’on retrouve aussi sur d’autres modèles publics, y compris GPT-5.5 d’OpenAI.
« Si ce critère devait s’appliquer à l’ensemble du secteur, nous pensons qu’il entraînerait, en pratique, l’arrêt total du déploiement de tous les modèles de pointe. »
Cette phrase porte un poids considérable. Anthropic ne dit pas « notre modèle est sans danger », mais plutôt : selon cette logique, aucun modèle de pointe d’aucune entreprise ne survivrait à un seul rapport de contournement.
03 La régulation convoquée de ses propres mains, qui se retourne contre elle
L’ironie la plus frappante de cette affaire réside dans le fait qu’Anthropic est peut-être l’entreprise la plus active du secteur à plaider pour une régulation stricte.
Un jour après le lancement de Fable 5, Dario Amodei a publié un long article intitulé « Policy on the AI Exponential ». Dans celui-ci, il propose explicitement que le gouvernement se voie conférer des pouvoirs analogues à ceux de la Federal Aviation Administration (FAA) américaine : tester obligatoirement les modèles de pointe par des tiers indépendants et disposer du droit de bloquer la sortie de tout modèle jugé dangereux.
Il souligne que la progression des capacités de l’IA est exponentielle, tandis que l’élaboration des politiques publiques suit un rythme linéaire. Il utilise la métaphore des Ents, ces êtres sages mais lents tirés de Tolkien : lorsqu’ils réagissent enfin, la forêt est déjà consumée.
Anthropic s’est même engagée à fournir « un soutien financier substantiel » à l’élaboration de telles lois.
Or, le pouvoir réglementaire qu’Amodei appelait de ses vœux a été appliqué à son propre entreprise trois jours plus tard.
Et cela s’est fait précisément de la manière qu’Amodei dénonçait dans son article : sans procédure transparente, sans évaluation technique indépendante, sans possibilité pour l’entreprise de présenter sa défense, et même sans préciser, dans la lettre, les motifs techniques spécifiques de préoccupation sécuritaire. Seule conclusion : arrêt immédiat.
Dans sa déclaration officielle, Anthropic a formulé une remarque pleine de sous-entendus : « Nous pensons que le gouvernement doit avoir le pouvoir d’empêcher le déploiement de systèmes dangereux, mais ce pouvoir doit s’exercer dans le cadre d’une procédure légale transparente, équitable et fondée sur des faits techniques objectifs. Cette action ne répond pas à ces principes. »
C’est une position parfaitement nuancée : « Je reconnais votre droit d’intervenir, mais pas de cette façon. »
04 Quand un modèle devient un « risque infrastructurel »
Élargissons maintenant le champ de vision au-delà d’Anthropic pour examiner le tableau d’ensemble.
L’affaire Fable 5 met en lumière une contradiction structurelle : les modèles d’IA sont désormais si puissants qu’ils rendent mal à l’aise toutes les parties prenantes, mais personne ne sait comment les encadrer.
Pour les utilisateurs, les garde-fous de sécurité de Fable 5 sont trop contraignants. Un chercheur en cybersécurité ne peut pas l’utiliser pour faire de la recherche en cybersécurité — c’est comme donner à un chirurgien un scalpel interdit de toucher le sang.
Pour les clients entreprises, la conservation des données pendant 30 jours constitue un problème majeur. Microsoft a déjà restreint l’usage de Fable 5 par ses employés, craignant que des secrets industriels ne soient stockés sur les serveurs d’Anthropic. Microsoft a même commencé à annuler les licences Claude Code attribuées à ses développeurs, pour se tourner vers son propre outil, GitHub Copilot.
Pour le gouvernement, un modèle capable d’identifier 23 000 vulnérabilités représente, en cas de contournement de ses protections, un risque potentiel inacceptable. Même un contournement limité à un domaine très spécifique suffit à provoquer une vive inquiétude.
Quant à Anthropic elle-même, elle est confrontée à un équilibre quasi impossible à tenir : trop peu performant, le modèle perd de sa compétitivité ; trop puissant, il devient un boulet ; trop peu sécurisé, l’entreprise est accusée de négligence ; trop sécurisé, les utilisateurs migrent vers la concurrence.
Ce n’est pas un dilemme propre à Anthropic. Toute entreprise lançant un modèle suffisamment puissant se heurtera à ce même problème.
Dans son article politique, Dario Amodei formule une analyse claire : l’amélioration des capacités des modèles d’IA ne suit pas une progression linéaire, mais exponentielle. Si cette analyse est juste, alors chaque contradiction rencontrée aujourd’hui par Fable 5 ne fera que s’aggraver avec la génération suivante.
La conception des garde-fous de sécurité deviendra de plus en plus complexe. La course à l’armement entre attaquants cherchant à contourner les protections et défenseurs les renforçant s’intensifiera. La résistance des clients entreprises face à la conservation des données ne fera que croître. Et les interventions gouvernementales — qu’elles soient ou non accompagnées de procédures transparentes — ne feront que s’accélérer.
05 Un jeu pour lequel personne n’est prêt
Revenons à la question initiale. Le parcours de quatre jours de Fable 5, en apparence simple épisode de lancement puis de retrait d’un produit, est en réalité un test de résistance — non pas des capacités du modèle, mais du cadre réglementaire global de l’industrie.
Le résultat du test est sans équivoque : personne n’est prêt.
Les entreprises d’IA ne sont pas prêtes. Anthropic est l’une des sociétés du secteur qui accorde le plus d’importance à la sécurité : elle a consacré des milliers d’heures à des tests « red team », conçu des systèmes de défense multicouches, exigé la conservation des données, et même appelé publiquement à une régulation gouvernementale. Pourtant, rien de tout cela n’a empêché l’entreprise de passer, en quatre jours, du lancement à la désactivation complète.
Les utilisateurs ne sont pas prêts. Lorsque le modèle commence réellement à « refuser » certaines demandes — même pour des raisons de sécurité — la réaction est immédiate : colère et rejet.
Le gouvernement n’est pas prêt non plus. Une lettre dépourvue de détails techniques précis, une décision fondée sur un seul rapport de contournement, suffisent à priver des centaines de millions d’utilisateurs de l’accès à un modèle.
Amodei appelait de ses vœux une machine régulatrice hautement sophistiquée — dotée d’évaluations indépendantes, de procédures transparentes et de mécanismes de recours. Ce qu’il a obtenu, c’est une lettre remise à 17 h 21.
Voilà probablement l’état actuel de la gouvernance de l’IA : tout le monde sait qu’il faut des règles, mais personne n’a eu le temps de les rédiger. Et les modèles, eux, n’attendent pas.
Bienvenue dans la communauté officielle TechFlow
Groupe Telegram :https://t.me/TechFlowDaily
Compte Twitter officiel :https://x.com/TechFlowPost
Compte Twitter anglais :https://x.com/BlockFlow_News











