
Les trois moments critiques d’Anthropic : fuite de code, affrontement avec le gouvernement et instrumentalisation
TechFlow SélectionTechFlow Sélection

Les trois moments critiques d’Anthropic : fuite de code, affrontement avec le gouvernement et instrumentalisation
Cette entreprise, qui met en avant la « sécurité » comme argument de vente, transforme actuellement le discours sur la sécurité en un fossé défensif commercial, tandis que ce qu’elle cherche réellement à s’approprier, ce sont les données utilisateurs détenues par des sociétés telles que Microsoft.
Auteur : Ben Thompson
Traduction et adaptation : TechFlow
Introduction de TechFlow : Le nouveau modèle d’Anthropic, Fable, a été suspendu d’urgence par le gouvernement américain seulement deux mois après sa sortie. Bien que le motif officiel soit une « fuite de sécurité », ce qui se révèle en réalité, c’est une double confrontation : celle d’un laboratoire d’IA avec le gouvernement, mais aussi avec l’industrie du logiciel. Cette entreprise, dont la promesse centrale est la « sécurité », transforme précisément ce récit sécuritaire en une barrière commerciale défensive — tandis que son véritable objectif est de s’emparer des données utilisateurs détenues par Microsoft et autres.
Je comprends parfaitement la position des moqueurs : ils considèrent toujours les déclarations publiques d’Anthropic — notamment celles accompagnant le lancement de ses modèles — comme une stratégie marketing visant à semer la panique. Il y a deux mois, Anthropic annonçait le lancement de Mythos Preview, affirmant que ce modèle était trop dangereux pour être rendu public, notamment en raison de ses capacités exceptionnelles en cybersécurité. Puis, deux mois plus tard, l’entreprise publiait Fable : une version de Mythos dotée de multiples dispositifs de sécurité.
D’après mon expérience limitée, Fable est effectivement un modèle remarquable. Aujourd’hui, il devient presque impossible d’évaluer objectivement les modèles en dehors de leurs performances en programmation ; néanmoins, l’expérience subjective demeure pertinente. J’ai trouvé mon interaction avec Fable extraordinairement fluide et efficace ; comparé à lui, tous les autres modèles — y compris GPT 5.5 et Opus 4.8 — semblent soudainement rudimentaires et peu intelligents. Je n’ai éprouvé un tel sentiment que deux fois auparavant : lors de la sortie de GPT-4, puis de Grok 4 — deux modèles qui marquaient chacun l’avènement d’une nouvelle génération en termes d’échelle fondamentale et de complexité. Je pense que Fable provient d’un nouvel entraînement préliminaire : il est le premier représentant de cette nouvelle génération.
J’accepte donc pleinement l’idée que Fable/Mythos possède effectivement des capacités supérieures pour identifier et exploiter des vulnérabilités de sécurité, ce qui justifie largement la prudence affichée par Anthropic lors de son lancement. Toutefois, le problème posé par la publication publique d’un modèle réside dans le fait que les dispositifs de sécurité peuvent être contournés — or, cela s’est bel et bien produit peu après la mise à disposition de Fable.
Anthropic entre à nouveau en conflit avec le gouvernement américain
La suite des événements demeure floue. Dans un billet de blog, Anthropic écrit :
Le gouvernement américain, invoquant ses pouvoirs en matière de sécurité nationale, a émis une directive de contrôle des exportations suspendue immédiatement l’accès de tous les citoyens étrangers à Fable 5 et à Mythos 5, qu’ils se trouvent aux États-Unis ou à l’étranger — y compris les employés étrangers d’Anthropic. En pratique, cette mesure nous oblige à désactiver subitement l’accès à Fable 5 et à Mythos 5 pour tous nos clients, afin de garantir notre conformité. L’accès à tous les autres modèles d’Anthropic reste inchangé.
Nous avons reçu cette directive du gouvernement à 17 h 21 heure de l’Est des États-Unis ce jour. La lettre ne fournit aucun détail concret sur les motifs de préoccupation liés à la sécurité nationale. Nous comprenons que le gouvernement estime avoir identifié une méthode permettant de contourner ou de « jailbreaker » Fable 5. Nous avons examiné une démonstration utilisant cette technique spécifique pour détecter un petit nombre de vulnérabilités connues et relativement simples. Or, ces vulnérabilités semblent toutes assez basiques, et nous constatons qu’elles peuvent également être repérées par d’autres modèles accessibles au public, sans nécessiter de contournement.
Anthropic ajoute ensuite que les contournements non universels sont inévitables et limités en portée, et qu’aucune preuve n’existe d’un contournement universel. Le contournement signalé semble avoir été rapporté par Amazon — ce qui mérite attention, car Amazon est à la fois investisseur d’Anthropic et principal fournisseur de services d’inférence pour l’entreprise. Au moment où j’écris ces lignes, les dirigeants d’Anthropic sont à Washington D.C., tentant de résoudre ce conflit qu’ils qualifient de « malentendu », tandis que des responsables de la Maison Blanche suggèrent plutôt que la direction d’Anthropic fait preuve d’indifférence face à des préoccupations légitimes de sécurité nationale.
Étant donné le grand nombre de faits contestés, je n’ai guère de contribution à apporter à ce conflit actuel ; toutefois, je ne suis pas surpris qu’il se produise : j’ai déjà expliqué, dans mon article « Anthropic et l’alignement », que ce conflit entre le gouvernement américain et Anthropic était inévitable. À cet égard, ceux qui jugent que Mythos n’est pas encore suffisamment puissant pour justifier une intervention gouvernementale aussi radicale ont manqué l’essentiel : même s’il ne l’est pas encore aujourd’hui, le prochain le sera — ou celui d’après, d’autant plus que les modèles deviennent de plus en plus capables de créer leurs propres successeurs.
Cela soulève toutefois une autre question — une question qui semble confirmer le point de vue des moqueurs : si Mythos est si dangereux, pourquoi publier initialement Fable ? Pourquoi s’opposer ainsi au gouvernement en faisant précisément ce que l’on affirme vouloir éviter ? En réalité, je trouve le comportement d’Anthropic parfaitement compréhensible ; ce qui distingue l’entreprise, c’est la manière dont elle justifie ces actions — et ces justifications nourrissent à la fois les critiques des moqueurs et le charisme d’Anthropic.
La nécessité économique
Durant les premières années de l’IA, la plus grande partie de la valeur économique s’est concentrée sur la puissance de calcul, pour une raison évidente : l’offre ne parvenait pas à répondre à la demande, ce qui a entraîné une forte hausse des prix. Les principaux bénéficiaires ont été NVIDIA, TSMC et les fabricants de mémoire (SK Hynix, Samsung et Micron). Parallèlement, Anthropic et OpenAI ont accumulé des pertes de plusieurs dizaines de milliards de dollars pour développer des modèles de pointe, lesquels, une fois publiés, ont été « distillés » et banalisés par des modèles open source — principalement issus de Chine.
Cela illustre le scénario pessimiste pour les laboratoires : ils ne parviendront jamais à couvrir leurs coûts, car leur différenciation est éphémère et les alternatives gratuites deviennent « suffisamment bonnes » — une hypothèse que je juge raisonnable. Dans un monde où les modèles sont interchangeables, ceux-ci deviennent des marchandises, et la majeure partie de la valeur se déplace ailleurs. Aujourd’hui, c’est la puissance de calcul qui concentre cette valeur ; mais à mesure que celle-ci deviendra abondante, la position la plus précieuse de la chaîne de valeur retrouvera son statut historique : détenir le contact direct avec les utilisateurs.
Ainsi, les laboratoires de pointe sont économiquement contraints de se rapprocher des utilisateurs — une évidence qui me paraît claire depuis longtemps. Si vous détenez ce point de contact, vous bénéficiez d’un verrouillage réel ; et la meilleure façon d’y parvenir est de devenir la toile sur laquelle vos utilisateurs accomplissent l’ensemble de leurs tâches. Cela signifie donc que les laboratoires de pointe entrent progressivement en conflit avec les entreprises de logiciels : ces dernières détiennent traditionnellement le contact utilisateur, tandis que l’intérêt à long terme des laboratoires n’est pas simplement de devenir une entrée marchande pour les logiciels, mais bien de les remplacer directement.
Parallèlement, les entreprises de logiciels s’efforcent de faire exactement l’inverse. Satya Nadella, dans un article publié sur X, expose sa vision de la manière dont les entreprises devraient construire sur les modèles :
« Chaque entreprise doit développer ce que j’appelle son capital humain et son capital token. Le capital humain englobe les connaissances, le jugement, les relations, l’originalité et la capacité de reconnaissance des schémas de ses employés ; le capital token correspond aux capacités IA que l’entreprise développe et possède. Il est essentiel de noter que, à mesure que le capital token augmente, le capital humain ne perd pas de valeur — bien au contraire, il en gagne ! Je crois fermement que l’initiative humaine constituera le moteur de la croissance du capital token. Ce seront les humains qui fixeront des objectifs ambitieux, établiront des liens transversaux, tisseront des relations et identifieront les schémas les plus importants. Sans orientation humaine, votre puissance de calcul tournera à vide. »
Cela signifie que la véritable opportunité ne réside pas dans le choix du meilleur modèle, mais dans la construction, au-dessus de ce modèle, d’une boucle d’apprentissage permettant une croissance exponentielle conjointe du capital humain et du capital token. Vous pouvez externaliser une tâche, voire un emploi entier, mais jamais vous ne pourrez externaliser votre apprentissage. L’avenir des entreprises réside dans la capacité à faire croître de façon exponentielle cet apprentissage, partagé entre humains et IA. Cela exige une nouvelle approche architecturale, permettant à chaque entreprise de construire des systèmes d’agents intelligents qui s’améliorent continuellement dans le temps, tout en conservant le contrôle total sur sa propriété intellectuelle. Une entreprise devrait pouvoir remplacer un modèle « généraliste » sans perdre l’expertise métier intégrée à son système d’apprentissage — ce que j’appelle le « vieux sage » de l’entreprise. Ce test déterminera, dans l’ère à venir, votre autonomie et votre souveraineté.
Nadella ouvre cette vision par une mise en garde :
« Ce que nous ne voulons aucunement voir, c’est un monde où chaque entreprise de chaque secteur abandonne sa valeur à quelques modèles omnivores. Si toute la valeur est captée par un petit nombre de modèles, l’économie politique ne le tolérera pas. Une future IA qui viderait entièrement un secteur industriel ne recevrait pas l’aval social. »
Pensez à ce qui s’est produit durant la première phase de la mondialisation : des économies industrielles entières ont été vidées par l’externalisation. Certes, les chiffres du PIB semblaient encourageants, mais le chômage de masse était bien réel — et ses conséquences se font encore sentir aujourd’hui. Ne reproduisons pas ce schéma à l’ère de l’IA, en laissant quelques systèmes d’IA capter l’intégralité des retours économiques, tandis que des secteurs entiers découvrent que leurs savoir-faire sont, sous leurs yeux mêmes, banalisés.
Le problème de cette analogie, c’est qu’elle s’est effectivement réalisée : les économies industrielles ont bel et bien été vidées. Il se pourrait donc que cette analogie ne soit pas une mise en garde, mais une prophétie — ce qui explique pourquoi Nadella sonne l’alarme : Microsoft pourrait bien être l’une des victimes. De même, la nécessité économique des fabricants de modèles est précisément de réaliser cet objectif.
La nécessité des données
Ces modèles — y compris Mythos — ne sont pas encore arrivés à ce stade. Outre davantage de puissance de calcul, ils requièrent surtout davantage — et surtout de meilleures — données. L’amélioration des modèles repose de plus en plus sur l’apprentissage par renforcement ; certaines données peuvent être synthétisées, mais pour les laboratoires de pointe, le levier le plus puissant reste l’utilisation réelle dans le monde réel.
Je pense que c’est là la principale raison pour laquelle OpenAI et Anthropic proposent tous deux des abonnements fortement subventionnés. SemiAnalysis estime récemment qu’un abonnement à 200 dollars vous donne accès à des tokens Claude d’une valeur de 8 000 dollars et à des tokens Codex d’une valeur de 14 000 dollars. Bien entendu, ils se livrent tous deux une bataille pour conquérir la part de marché des utilisateurs et des développeurs, mais ils se disputent aussi l’accès aux données générées par l’usage réel, afin d’améliorer leurs modèles.
Anthropic a considérablement renforcé sa stratégie sur Fable, annonçant qu’elle conservera toutes les données d’utilisation pendant 30 jours — y compris pour les plans d’entreprise qui avaient précédemment bénéficié d’une garantie de zéro conservation de données. L’entreprise affirme ne pas utiliser ces données pour l’entraînement, mais elle ne met en place aucune garantie pour empêcher une utilisation future (par exemple, en stockant les données chez un tiers). Si cette modification de politique (lorsque Fable sera rétabli) ne provoque pas une fuite massive de clients, je doute sérieusement qu’il faille attendre longtemps avant qu’Anthropic n’utilise effectivement ces données : elles sont trop précieuses pour son objectif final.
Remarquez également le cercle vertueux qui accompagne ce déplacement vers le point de contact utilisateur : plus une entreprise utilise directement Claude ou Codex pour ses flux de travail, plus elle génère de données exploitables pour l’entraînement, ce qui rend son produit plus performant et utile, étend le nombre de flux de travail qu’il peut servir, et élargit ainsi son accès aux données.
Nadella insiste dans son article sur l’importance de ces données, mais considère naturellement qu’elles doivent rester indépendantes du modèle :
« Les entreprises doivent transformer leurs flux de travail, leurs connaissances sectorielles et leurs jugements accumulés en systèmes IA qui s’améliorent à chaque utilisation. Des évaluations privées doivent mesurer si le modèle améliore réellement les résultats critiques pour l’activité (et non seulement les benchmarks externes !). Un environnement privé d’apprentissage par renforcement doit permettre au modèle de s’affiner sur les trajectoires réelles au sein de l’organisation. Sa base de connaissances rend la mémoire institutionnelle interrogeable et l’utilisation des tokens plus efficace. »
Ce cycle devient la nouvelle propriété intellectuelle de l’entreprise. Je l’imagine comme une machine qui gravit une pente. Contrairement à la plupart des actifs, il produit des rendements composés. Chaque flux de travail amélioré génère un signal d’entraînement plus pertinent, accélérant ainsi l’accumulation de connaissances implicites propres à l’entreprise. Les entreprises qui construiront ce dispositif en premier disposeront d’un avantage difficilement reproductible, quelles que soient les futures capacités individuelles des modèles.
Ce cycle devient la nouvelle PI de l’entreprise. Je l’imagine comme une machine qui grimpe une pente. Contrairement à la plupart des actifs, elle produit des rendements composés. Chaque flux de travail amélioré génère un signal d’entraînement plus pertinent, accélérant ainsi l’accumulation de connaissances implicites propres à l’entreprise. Les entreprises qui construiront ce dispositif en premier disposeront d’un avantage difficilement reproductible, quelles que soient les futures capacités individuelles des modèles.
Toutefois, que se passera-t-il si les entreprises qui acceptent la politique de données d’Anthropic obtiennent dès aujourd’hui de meilleurs résultats ? Ou si les entreprises existantes résistent, créant ainsi une opportunité pour de nouvelles entreprises — ou pour les fabricants de modèles eux-mêmes — de les battre sur le marché ? Anthropic met bel et bien à l’épreuve la détermination appelée de ses vœux par Nadella.
La revendication du pouvoir
La politique de conservation des données associée à Fable/Mythos n’est pourtant pas la partie la plus controversée de ce lancement. En effet, Anthropic a annoncé, lors de la sortie, que si Fable était utilisé pour le développement de LLM, ses performances seraient discrètement réduites. La fiche technique du système précise :
« Nous avons également ajouté des dispositifs de sécurité liés au développement de LLM de pointe. Comme exposé dans la section 6.1 de notre rapport sur les risques de février 2026, nous craignons que l’accélération du rythme global du développement de l’IA comporte des risques, bien que nous n’ayons pas encore établi la gravité de ces risques. Plus précisément, notre inquiétude porte — comme nous l’avons alors écrit — sur « l’accélération du développement, par d’autres acteurs, de systèmes d’IA puissants présentant des risques similaires aux nôtres, mais dépourvus des dispositifs de sécurité correspondants ».
Compte tenu de la capacité récente des modèles à accélérer leur propre développement, nous avons mis en œuvre de nouvelles interventions limitant l’efficacité de Claude lorsqu’il est sollicité pour des tâches liées au développement de LLM de pointe (par exemple, la conception de pipelines d’entraînement préliminaire, d’infrastructures d’entraînement distribué ou d’accélérateurs ML). L’utilisation de Claude pour développer des modèles concurrents violait déjà nos conditions d’utilisation, mais l’application de ces dispositifs de sécurité permet d’empêcher précisément les acteurs les plus disposés à ignorer ces conditions. »
Contrairement aux interventions menées dans les domaines de la cybersécurité, de la biochimie ou des tentatives de distillation, ces dispositifs de sécurité sont invisibles pour l’utilisateur. Fable 5 ne dégradera pas vers un autre modèle. À la place, ces dispositifs limiteront son efficacité via des modifications de prompts, des redirections vectorielles ou des ajustements fins efficaces en paramètres (PEFT). Ces interventions n’affecteront pas la grande majorité des tâches de programmation. Nous estimons qu’elles concerneront environ 0,03 % du trafic, concentré dans moins de 0,1 % des organisations. Lorsqu’elles seront activées, nous anticipons que leur impact sur le comportement du modèle sera quasi imperceptible — hormis la limitation de son efficacité pour le développement de LLM de pointe. Claude continuera de répondre de manière utile aux demandes des utilisateurs. Nous poursuivrons, après ce lancement, l’amélioration continue de la précision de nos méthodes de détection.
Anthropic a retiré cette mesure — Fable transférera désormais les requêtes liées aux LLM vers Opus 4.8, en informant explicitement l’utilisateur de ce transfert — mais je trouve la politique initiale extrêmement révélatrice. D’un côté, je ne blâme pas Anthropic pour ne pas vouloir aider ses concurrents ; de l’autre, il est clair qu’Anthropic considère que personne d’autre qu’elle-même ne devrait construire des LLM de pointe.
Cette politique prend encore plus de relief du fait qu’elle a été instaurée seulement deux mois après la dispute d’Anthropic avec le Département de la Défense : ce dernier souhaite utiliser Claude pour toute fin licite, tandis qu’Anthropic souhaite imposer des restrictions plus strictes en matière de surveillance et d’armes autonomes. Cette mesure de dégradation illustre à la fois la capacité d’Anthropic à modifier discrètement ses modèles afin de faire triompher ses préférences politiques, et sa volonté explicite de le faire. Autrement dit, Anthropic valide, de façon proactive, l’une des principales inquiétudes exprimées par ses détracteurs quant à son rôle de risque systémique dans la chaîne d’approvisionnement.
Cependant, la conclusion plus large à tirer de cet épisode est que, selon Anthropic, elle seule devrait détenir le droit de décision ultime sur la manière dont Claude est utilisé. Et puisqu’elle estime que seul son propre laboratoire devrait développer des IA de pointe, elle considère implicitement qu’elle seule devrait détenir le droit de décision ultime sur l’IA dans son ensemble. Lorsque l’on combine cette conviction à ses déclarations sur la capacité de l’IA à réaliser l’ensemble des activités économiques, on comprend que la direction d’Anthropic aspire, en réalité, à exercer un pouvoir absolu sur tout et sur tous.
Le récit sécuritaire
Bien sûr, Anthropic ne formulerait jamais une telle affirmation aussi crûment ; à la place, le récit est centré sur la sécurité :
« Je prévois qu’Anthropic rendra de plus en plus accessible ses capacités modélaires aux utilisateurs finaux via des points d’accès de plus en plus spécifiques, adaptés à différents flux de travail — même si elle commence à restreindre son API. Cette substitution aux logiciels et cette restriction d’accès seront justifiées au nom de la sécurité, même si Anthropic agit ainsi pour satisfaire sa nécessité économique de se rapprocher des utilisateurs finaux. »
L’explication donnée par Anthropic pour sa modification majeure de politique de conservation des données est précisément la sécurité. Plus précisément, l’entreprise affirme que la conservation de toutes les données utilisateurs pendant 30 jours est nécessaire pour prévenir les contournements dont le gouvernement américain redoute l’occurrence. Je peux aisément imaginer un futur où des impératifs de sécurité la pousseront à utiliser également ces données pour l’entraînement, afin de mieux contrer les usages malveillants.
L’histoire fondatrice d’Anthropic repose sur la conviction de ses fondateurs qu’OpenAI ne prenait pas suffisamment au sérieux la sécurité ; l’entreprise estime qu’elle seule peut maîtriser l’IA, et que, parce qu’elle seule accorde une importance particulière à la sécurité, elle est fondée à chercher à contrôler tous les autres acteurs — y compris le gouvernement américain.
Le problème avec ces arguments sécuritaires, c’est qu’ils fonctionnent — parce qu’ils ne sont pas, pour Anthropic, de véritables arguments. L’entreprise croit sincèrement être la seule à prendre au sérieux la menace de l’intelligence superintelligente, et donc la seule à accorder une attention suffisante aux dangers qu’elle représente. Cela justifie, une décision après l’autre, une politique après l’autre, un affrontement après l’autre — qui, aux yeux des observateurs extérieurs, apparaissent comme une étrange combinaison de cynisme et de naïveté.
La comparaison avec OpenAI est frappante : je considère qu’une façon de comprendre comment et pourquoi OpenAI a perdu sa position dominante réside dans le fait que, durant les années suivant la sortie de ChatGPT, l’entreprise a été traversée par une guerre interne — un laboratoire de recherche soudain chargé de devenir, contre toute attente, une société technologique grand public. Dans son effort pour résoudre ce conflit, OpenAI a perdu une grande partie de ses talents au profit d’entreprises comme Anthropic.
En revanche, Anthropic bénéficie d’une cohérence parfaite entre ses talents, sa mission et son modèle économique. Elle peut vendre aux chercheurs la vision de la création d’un « dieu-machine », en cultivant l’aura d’un être humain préoccupé par les dangers de l’IA et suffisamment intelligent pour les affronter au nom de l’humanité ; et chaque changement de politique qui en découle tombe miraculeusement à point nommé pour servir ses intérêts commerciaux — une coïncidence magnifique.
Je respecte à la fois cette cohérence — et j’en ai peur. Je la respecte, car elle s’avère manifestement très efficace ; l’analogie la plus proche serait Apple, qui habille chaque action égoïste du prétexte de faire « ce qu’il y a de mieux pour l’utilisateur » — et qui, souvent, le fait effectivement. Anthropic suit le même chemin. Pourtant, j’en ai peur, car laisser des personnes convaincues d’être les seules à savoir ce qui est bon pour nous concevoir un smartphone que je peux accepter ou rejeter, c’est une chose ; mais leur laisser concevoir une intelligence superintelligente susceptible de rivaliser — voire de surpasser — le pouvoir des États-nations ou même des grandes entreprises, c’est infiniment plus inquiétant. L’histoire des esprits brillants persuadés de savoir ce dont l’humanité a besoin est sombre — précisément parce qu’ils se sont convaincus de la bonté de leurs intentions, ce qui leur a fourni une justification pour des actes qui, en réalité, n’étaient pas bons.
Bienvenue dans la communauté officielle TechFlow
Groupe Telegram :https://t.me/TechFlowDaily
Compte Twitter officiel :https://x.com/TechFlowPost
Compte Twitter anglais :https://x.com/BlockFlow_News













