
Anthropicの三重の瞬間:コード漏洩、政府との対立、および兵器化
TechFlow厳選深潮セレクト

Anthropicの三重の瞬間:コード漏洩、政府との対立、および兵器化
この「安全性」を売りにしている企業は、安全性というストーリーをビジネス上の護城河へと変貌させようとしており、実際にはマイクロソフトなどの企業が保有するユーザー・データを奪おうとしている。
著者:ベン・トンプソン
翻訳・編集:TechFlow
TechFlow 読者向け解説:Anthropic 社が新モデル「Fable」を発表してからわずか2か月後、米国政府が緊急にその提供を停止させました。表面的には「セキュリティの漏洩」が理由とされていますが、実際にはAI研究機関と米国政府、そしてソフトウェア業界との二重の対立が露呈しています。安全を売り物にするこの企業は、今や「安全性」という物語を自社の商業的護城河へと変貌させようとしており、その真の狙いはマイクロソフトなど大手企業が握るユーザー・データの獲得にあります。
私は、この件について皮肉な見方をする人々の立場を理解できます。彼らは、Anthropic 社が公表する声明——特にモデル発表時の主張——は、マーケティング目的で不安をあおるためのものだと考えています。2か月前、Anthropic 社は「Mythos Preview」のリリースを発表し、このモデルは極めて危険であるため公開できないと述べました。特にその強力なサイバーセキュリティ能力が懸念されていたのです。そして2か月後、同社は各種セキュリティガードレールを施した Mythos のバージョンとして「Fable」を正式に公開しました。
私の限られた利用経験から判断すると、Fable は確かに非常に優れたモデルです。現在ではプログラミング性能以外の客観的評価が困難になっていますが、主観的な体験は明確です。Fable とのインタラクションは極めて優れており、GPT-5.5 や Opus 4.8 を含む他のすべてのモデルが、小さく、無知に思えるほどです。これまでにこのような印象を受けたのは2度だけ——GPT-4 と Grok 4 のときでした。これら2つは、基盤モデルのスケールと複雑性において新たな世代を代表するものでした。Fable もまた、新しい事前学習に基づくものであり、まさにその新世代の第一号だと私は感じています。
そのため、Fable/Mythos がセキュリティ上の課題をより正確に検出し、悪用する能力を有しているという Anthropic 社の慎重な導入姿勢は、十分に納得できます。しかし、モデルを公開することの問題点は、ガードレールがバイパス(越獄)されうることにあります。実際に、公開直後にそうした事例が発生しました。
Anthropic が再び米国政府と対峙
その後の展開については、まだ不明確な点が多くあります。Anthropic 社はブログ記事において次のように述べています:
米国政府は国家安全保障上の権限を根拠に、輸出管理命令を発出し、Fable 5 および Mythos 5 への外国人(米国内・国外を問わず)のアクセスを全面的に一時停止しました。これには Anthropic 社の外国籍従業員も含まれます。この命令の実質的な効果として、当社は顧客全員に対し、Fable 5 および Mythos 5 の利用を即座に禁止せざるを得なくなり、法令遵守を確保しました。それ以外の Anthropic 社のすべてのモデルへのアクセスは影響を受けていません。
当社は米東部時間の本日午後5時21分に、この政府命令を受領しました。命令書には、国家安全保障上の懸念に関する具体的な詳細は一切記載されていません。政府は、Fable 5 をバイパスまたは「越獄」する方法をすでに発見したと考えていると当社は理解しています。当社は、特定の技術を用いてごく少数の既知の小さな脆弱性を特定するデモを調査しました。これらの脆弱性はいずれも比較的単純なものであり、当社が確認したところでは、他の公開済みモデルでも、バイパスなしで同様の脆弱性を検出できることが分かりました。
Anthropic 社はさらに、汎用的な越獄は避けられないものの、その範囲は限定的であり、汎用越獄の存在を裏付ける証拠はない、と主張しています。一方、今回発見された越獄はアマゾン社によって報告されたものであり、これは注目に値します。なぜならアマゾン社は Anthropic 社の投資家であると同時に、同社の推論サービスの主要なプロバイダーでもあるからです。本稿執筆時点では、Anthropic 社の幹部がワシントンD.C.にて、自社が「誤解」と主張する事案を解決しようとしており、一方でホワイトハウス当局は、同社経営陣が合法的な国家安全保障上の懸念に対して無関心であると示唆しています。
多くの事実が争われている状況において、現下の対立について私が追加できるコメントはほとんどありません。ただし、こうした対立が生じることは私にとって驚きではありません。「Anthropic とアライメント」の記事で、私は米国政府と Anthropic 社の間の衝突が避けられないことをすでに説明しています。この点に関して、Mythos がまだ政府の激しい介入を招くほど強力ではないと主張する人々は、本質を見誤っています。もし現時点でまだ十分に強力でないとしても、次のモデル、あるいはその次のモデルがそうなるでしょう。とりわけ、モデル自身が後継モデルの構築にますます有効になっていく今日においては、なおさらです。
しかし、これによりもう一つの問いが浮かび上がります——嘲りの声を正当化しそうな問いです。つまり、Mythos がそれほど危険だとするならば、そもそもなぜ Fable をリリースしたのか?なぜ自らが「実現したいこと」を政府と対立させてまで行おうとするのか?実際のところ、私は Anthropic 社の行動を十分に理解できます。同社の特異性は、こうした行動を正当化するやり方にあり、その正当化こそが、嘲りの声に燃料を与え、同時に Anthropic 社に魔力を与えているのです。
経済的必然性
AI の黎明期において、最も大きな経済的価値はコンピューティング・パワー(演算能力)へと流れました。その理由は明白です:需要を満たすのに十分な供給がなかったため、価格が高騰しました。最大の恩恵を受けたのは、NVIDIA、TSMC、そしてメモリメーカー(SKハイニックス、サムスン、マイクロン)です。一方、Anthropic 社および OpenAI 社は、最先端モデルの構築のために合計で数百億ドルの赤字を抱えており、こうしたモデルは一度公開されると、中国を中心とするオープンソース・モデルによる蒸留・商品化の対象となりました。
これは研究機関にとって悲観的なシナリオを示しています——すなわち、差別化要素が一時的であり、無料の代替品が「十分に良い」ものとなるため、コスト回収が永遠に不可能になるという状況です。これは合理的な見方だと思います。モデルが相互交換可能な世界においては、モデルそのものが商品となり、価値の大半は他の場所へと流れるのです。今はコンピューティング・パワーですが、時間が経てば、十分なコンピューティング・パワーが確保された段階では、バリューチェーンの中で最も価値のあるポジションは、常に最も価値のある場所——すなわちユーザーとの接点を保有する場所——となります。
したがって、最先端の研究機関には、ユーザーに近づくという経済的必然性があります。これは、私にとって長年にわたって明らかでした。ユーザーとの接点を保有すれば、意味のあるロッキング(囲い込み)が可能になります。そしてユーザーとの接点を獲得する最良の方法は、ユーザーが行うあらゆる作業の「キャンバス」になることです。これは、最先端の研究機関がソフトウェア企業と対立に向かっていることを意味します。すなわち、ユーザーとの接点はソフトウェア企業が握っており、最先端の研究機関の長期的な利益は、単にソフトウェア企業の商品としてのインプットになることではなく、ソフトウェア企業そのものを直接置き換えることにあります。
一方、ソフトウェア企業は正反対の方向へと動いています。サティア・ナデラ氏はX(旧Twitter)上で、企業がモデル上に何を構築すべきかというビジョンを次のように述べています:
各企業は、私が「人的資本」と「トークン資本」と呼ぶものを構築しなければなりません。人的資本とは、社員の知識、判断力、人脈、独創性、パターン認識能力などを指します。一方、トークン資本とは、企業が構築・所有するAIの能力のことです。重要なのは、トークン資本が拡大しても、人的資本の価値が低下することはないということです。むしろ、その価値はさらに高まるのです!私は、人的主体性こそがトークン資本の成長を牽引する原動力になると信じています。人間が野心的な目標を設定し、異なる分野のポイントを結びつけ、人脈を築き、最も重要なパターンを識別するのです。人間の指導がなければ、あなたのコンピューティング・パワーは空回りするだけです。
つまり、真のチャンスは「最高のモデルを選ぶこと」ではなく、「モデルの上に学習ループを構築し、人的資本とトークン資本を複利的に成長させること」にあるのです。タスクや仕事そのものを外部委託することはできても、学習そのものは決して外部委託できません。企業の未来は、人間とAIの間でこの学習を複利的に成長させることにあります。そのためには、各企業が時間をかけて改善されるエージェント・システムを構築できる新しいアーキテクチャ・アプローチが必要です。同時に、自社の知的財産を完全にコントロールしたままにする必要があります。企業は「汎用」モデルを自由に交換でき、それでも自社の学習システムに組み込まれた「ベテラン社員」の専門知識を失わないようにしなければなりません。これが、今後の時代におけるコントロールと主権を測る「試金石」なのです。
ナデラ氏は、このビジョンを次のような警告で始めています:
私たちが望まないのは、あらゆる業界のすべての企業が、少数の「すべてを飲み込む」モデルに価値を譲渡する世界です。もしすべての価値がほんの数個のモデルにのみ集中してしまうなら、政治経済体制はそれを容認しません。産業全体を空洞化させるようなAIの未来に対して、社会は許可を与えないでしょう。
グローバル化の第1フェーズがどう展開したかを思い出してみてください。工業経済全体がアウトソーシングによって空洞化しました。表面上はGDPの数字は良好に見えましたが、実際には大量の職を失った人々がおり、その影響は今も続いています。こうしたダイナミクスをAI時代に持ち込んではいけません。少数のAIシステムがすべての経済的利益を独占し、産業全体が、目の前で自社の知識が商品化されていくのをただ見守るしかないような状況を招いてはいけません。
この類似性の問題点は、グローバル化が実際に起こり、工業経済が実際に空洞化したという点にあります。つまり、これは警告ではなく予言なのかもしれません。だからこそ、ナデラ氏は警鐘を鳴らしているのです。マイクロソフト社自身が被害者になりうるからです。同様に、モデル製造業者の経済的必然性は、まさにこの状況を実現することにあります。
データの必然性
こうしたモデル——たとえ Mythos であっても——はまだその段階に達していません。それらが求めているのは、より多くのコンピューティング・パワーに加え、より多く、より質の高いデータです。モデルの改良は、ますます強化学習によって行われるようになっています。一部の強化学習は合成データによって生成されますが、最先端の研究機関にとって最も強力なレバレッジは、現実世界での使用です。
私は、OpenAI 社および Anthropic 社が大幅な割引付きサブスクリプション・プランを提供している主な理由は、ここにあると考えています。SemiAnalysis 社が最近推定したところによれば、200ドルのプランで、クラウド・トゥークン(Claude)の価値約8,000ドル分とコードックス・トゥークン(Codex)の価値約14,000ドル分が得られます。もちろん、両社ともユーザーおよび開発者の心をつかむために競争していますが、同時に、モデル改良のための実際の使用データへのアクセスをめぐる競争も繰り広げているのです。
Anthropic 社は Fable において、これまで「ゼロ・データ保持」を約束していた企業向けプランを含め、すべての利用データを30日間保持すると大幅に方針を強化しました。同社は、これらのデータをトレーニングには使わないとしていますが、将来的に使うことを防止するための保証措置(例えば第三者へのデータ保管)は一切設けていません。もし(Fable の復活時に)この方針変更が大量の顧客離反を引き起こさない場合、私は同社がデータをトレーニングに利用し始めるのは時間の問題だと疑っています。それは彼らの最終目標にとってあまりにも価値が高いからです。
また、ユーザーとの接点へと上昇していく好循環にも注目してください:クラウドやコードックスを直接使って完了するワークフローが増えるほど、各企業がトレーニングにフィードバックできるデータ量も増え、その結果、製品がより強力かつ有用になり、対応可能なワークフローの数が拡大し、データへのアクセスも拡大します。
ナデラ氏は、このデータの重要性を記事で強調していますが、当然ながら、それはモデルから独立したものであるべきだと考えています:
企業は、ワークフロー、ドメイン知識、蓄積された判断力を、利用するたびに向上するAIシステムへと転換する必要があります。プライベートな評価は、モデルが外部ベンチマークだけでなく、ビジネスにとって本当に重要な成果において実際に改善しているかどうかを捉えるべきです。プライベートな強化学習環境では、モデルが組織内の実際のトラジェクトリー上でより強くなるべきです。そのナレッジベースは、機関の記憶を検索可能にし、トークンの利用をより効率的にします。
このループこそが、企業の新たな知的財産(IP)となります。私はこれを「山登りマシン」と見なしています。ほとんどの資産とは異なり、これは複利的に成長します。改善された各ワークフローがより優れたトレーニング信号を生み出し、企業独自の暗黙知の蓄積を加速させます。この能力を早期に構築した企業は、将来登場するどんな新しい単一モデルの能力であれ、模倣困難な優位性を獲得します。
このループこそが、企業の新たな知的財産(IP)です。私はこれを「山登りマシン」と見なしています。ほとんどの資産とは異なり、これは複利的に成長します。改善された各ワークフローがより優れたトレーニング信号を生み出し、企業独自の暗黙知の蓄積を加速させます。この能力を早期に構築した企業は、将来登場するどんな新しい単一モデルの能力であれ、模倣困難な優位性を獲得します。
しかし、もし Anthropic 社のデータ方針に従う企業が、すでに今すぐより優れた結果を得られるのだとしたらどうでしょうか?あるいは、既存企業がこれに抵抗し、新興企業——あるいはモデル製造業者自身——が市場でこれらを凌駕する機会を残すことになったらどうでしょうか?Anthropic 社は、まさにナデラ氏が呼びかけた「決意」を試しているのです。
権力の要求
Fable/Mythos を巡るデータ保持方針は、実は発表内容の中で最も物議を醸している部分ではありません。それよりも、Anthropic 社は発表時に、Fable がLLM開発に使われる場合、そのパフォーマンスを静かに低下させると明言しました。システムカードには次のように記載されています:
我々は、最先端のLLM開発に関連する追加の保護措置も導入しました。2026年2月のリスク報告書第6.1節で述べた通り、我々はAI全体の進展速度を加速させるリスクを懸念しており、そのリスクの深刻さについては未だ不確実です。特に懸念しているのは——当該報告書で述べた通り——「我々のシステムと同程度のリスクを持つ強力なAIシステムを、他社のAI開発者が構築するスピードを加速させること、しかもそのシステムが必ずしも同等の保護措置を備えていない可能性があること」です。
最近のモデルが自らの開発を加速する能力を獲得したことを踏まえ、我々は新たな介入措置を実施し、クラウドが最先端のLLM開発を目的としたリクエスト(例:事前学習パイプラインの構築、分散型訓練インフラの構築、MLアクセラレータ設計など)に対して有効性を制限しました。クラウドを用いた競合モデルの開発は、既に当社の利用規約に違反していますが、保護措置を導入することで、こうした規約違反を最も積極的に行う行為者による加速を防ぐことができます。
サイバーセキュリティ、生化学、蒸留試行における介入とは異なり、これらの保護措置はユーザーには見えません。Fable 5 は別のモデルへとフォールバックしません。代わりに、プロンプトの修正、誘導ベクトル、パラメータ効率的ファインチューニング(PEFT)などの手法により、有効性が制限されます。これらの介入は、大多数のプログラミング作業には影響を与えません。我々の推定では、これらは全トラフィックの約0.03%に影響し、そのほとんどは0.1%未満の組織に集中します。これらの介入が適用された場合、最先端LLMの開発に対する有効性を制限すること以外に、モデルの挙動への影響はほとんどないと予想されます。クラウドは依然としてユーザーのリクエストに有益な形で応答します。本モデルのリリース後、我々は検出方法の精度をさらに向上させていきます。
Anthropic 社はこの変更を撤回しました——Fable はLLM関連のリクエストをOpus 4.8へと移管し、ユーザーにその移管を明示する——しかし、当初の政策は極めて示唆的だと私は考えます。一方で、Anthropic 社が競合他社を支援したくないという気持ちは、まったく理解できます。他方で、Anthropic 社が自分たち以外の誰も最先端LLMを開発してはならないと明確に考えていることは、極めて明らかです。
この政策がさらに注目すべきなのは、それがAnthropic 社と国防総省(米国国防部)との対立からわずか2か月後に発表された点です。国防総省は、クラウドをあらゆる合法的な用途に使用することを求めていますが、Anthropic 社は監視および自律型兵器への利用に対して、さらに厳格な制御を求めていました。こうした性能の低下措置は、Anthropic 社が自社の政策的優先事項を実現するために、モデルを静かに変更する能力と意志の双方を示すものです。言い換えれば、Anthropic 社は、批判者たちが最も懸念する「サプライチェーンリスク」の一つを、自ら実証しているのです。
しかし、この出来事から導き出されるより広い結論は、Anthropic 社が自社のモデルの使用方法について最終的な決定権を有すべきだと考えているという点にあります。彼らが最先端AIの開発を自分たちだけが行うべきだと考えている以上、AI全体についての最終的な決定権も自分たちが持つべきだと実質的に考えているのです。さらに、同社が「AIはすべての経済活動を遂行できる」という主張とこの認識を合わせて考えれば、Anthropic 社の経営陣が実際にはあらゆるものとすべての人々に対する支配権を求めており、それが明らかになります。
セキュリティ・ナラティブ
もちろん、Anthropic 社はこんな直截的な表現を決して使いません。代わりに、話は「セキュリティ」を軸に展開されます:
私は、Anthropic 社が今後ますます、APIの利用制限を開始する一方で、さまざまなワークフローに特化したエンドポイントを通じて、エンドユーザーに直接モデルの機能を提供していくだろうと予想しています。こうしたソフトウェアの代替とアクセス制限は、セキュリティという名目で行われるでしょう。これは、Anthropic 社がエンドユーザーに近づこうとする経済的必然性を満たすための手段です。
Anthropic 社がデータ保持方針を大幅に変更した理由も、セキュリティです。具体的には、同社は、米国政府が懸念する越獄行為を防止するために、すべてのユーザー・データを30日間保持することが必要であると主張しています。私は、セキュリティ上の要因が、こうしたデータを悪用防止のためのトレーニングにも使用せざるを得ない状況を生み出す未来を容易に想像できます。
Anthropic 社の起源物語は、創業者たちの信念——すなわち、OpenAI 社がセキュリティを十分に真剣に受け止めていないという信念——に深く根ざしています。同社は、AIをコントロールできるのは自分たちだけであると考えており、また自分たちだけがセキュリティを真剣に重んじているため、米国政府を含むすべての人々をコントロールしようとする正当性があると信じています。
こうしたセキュリティを理由とする主張の問題点は、それらが「理由」ではないという点にあります。すなわち、Anthropic 社にとっては、それらは単なる「理由」ではなく、真実なのです。同社は、超知能(スーパーエイジェント)を真に信じているのは自分たちだけであり、したがって危険を十分に重んじているのも自分たちだけであると、本気で信じているのです。これは、次から次へと続く意思決定、次から次へと続く政策、そして次から次へと続く対立を正当化する根拠となっていますが、外部の人々にとっては、それは皮肉と無邪気さの奇妙な混合物のように見えるのです。
OpenAI 社との対比は極めて明確です。ChatGPT のリリース以降の数年間、OpenAI 社がいかにして、そしてなぜリードポジションを失ったのかを理解する一つの方法は、同社が内部で戦闘状態にあったという点にあります。かつての研究機関が、突然、予期せぬ消費者向けテクノロジー企業になるという重責を負わされたのです。OpenAI 社がこの葛藤を解決する過程で、Anthropic 社などの企業へと多くの人材を流出させました。
一方、Anthropic 社は、人材、ミッション、事業の間に完璧な一致を実現しています。同社は研究者に対して、「機械の神」を創造するというビジョンを売り込み、危険を重んじ、かつ人類を代表してその危険に対処するほど賢い人物としてのオーラを纏っています。そして、こうしたビジョンから生じるすべての政策変更が、偶然にも事業にとって有利に働くという、世界で最も美しい偶然が生まれているのです。
私は、この一致を尊重すると同時に、それを恐れています。尊重するのは、それが明らかに非常に効果的だからです。最も近い類似例はアップル社でしょう。同社は、常に「ユーザーのための正しいことをする」という名目で、自己中心的な行動をすべて包装してきました——そして実際、しばしばそうしてきたのです。Anthropic 社も同様です。しかし、私が恐れているのは、自分が最もよく知っていると確信している人々に、私が受け入れるか拒否するかを選べるスマートフォンを構築させることは一つの話です。しかし、国家レベルの権力を匹敵あるいは凌駕する可能性のある、あるいは単に大企業の規模に匹敵する超知能を構築させることは、はるかに深刻な問題です。人間が何を必要とするかを自分たちが最もよく知っていると確信する聡明な人々の歴史は、汚れたものであり、彼らが自分の意図は善であると自らを説得したことで、実際にはそうでない行動を正当化してきたからです。
TechFlow公式コミュニティへようこそ
Telegram購読グループ:https://t.me/TechFlowDaily
Twitter公式アカウント:https://x.com/TechFlowPost
Twitter英語アカウント:https://x.com/BlockFlow_News













