
最強のモデル「Fable 5」が、わずか4日で「ネット接続を遮断」された
TechFlow厳選深潮セレクト

最強のモデル「Fable 5」が、わずか4日で「ネット接続を遮断」された
トークンを必死に計算したのに、結局使わずに済んでしまった。
著者| 桦林舞王
編集| 靖宇
6月9日、AnthropicがClaude Fable 5を発表しました。これは同社がこれまでに一般公開した中で最も強力なモデルであり、従来はごく少数のセキュリティ研究機関のみに提供されていた「Mythos」レベルに属します。
6月12日、Fable 5は全面的に停止されました。
わずか4日間。発表から撤退まで、たった4日間でした。
その間に何が起きたのでしょうか?簡潔に言えば、連鎖的な衝突が起こったのです——ユーザーは制限が厳しすぎると感じ、セキュリティ研究者はそれが本来の業務を妨げていると主張し、ある企業がその防御ラインを突破したと宣言し、政府はこれが安全保障上の脅威であると判断しました。Anthropicは「十分に安全」と考えられる製品を開発しましたが、ほぼすべての関係者が満足しませんでした。
これは単なるある企業の物語ではありません。これは、AI業界全体が今後直面するガバナンス上の課題の予行演習です。
01 嫌われる「セキュリティ模範」
Fable 5がなぜこれほど大きな論争を巻き起こしたのかを理解するには、まずそれが一体何であるかを理解する必要があります。
今年4月、AnthropicはMythos——自社が自らも緊張を覚えるほど強力なモデル——を発表しました。内部テストでは、Mythosレベルのモデルが主要なコードリポジトリにおいて2万3,000件以上の重大な脆弱性を発見しました。AnthropicはMythosを一般公開せず、「Project Glasswing」というプロジェクトを通じて、ごく限定された信頼されたセキュリティ機関のみに利用を許可しました。Mozillaもその一社であり、同社はこのモデルを活用して数百件の脆弱性を修正したと伝えられています。
Fable 5はMythosの「一般向け版」です。同じ基盤となるモデルを採用していますが、サイバーセキュリティ、生物学、化学に関する問い合わせを自動的にブロックまたは処理レベルを引き下げるという厳格なセキュリティガードレールが追加されています。またAnthropicは、すべてのユーザーのデータを少なくとも30日間保存することを義務付け、 Jailbreak(越獄)や悪用行為の監視に活用しています。
Anthropicのロジックは明快です:モデルが強力すぎるため、制限を設けないわけにはいきません。
しかしユーザーはそうは考えていません。
Fable 5がリリースされると、不満の声が押し寄せました。サイバーセキュリティ研究者は、モデルにセキュリティ関連のブログ記事を読ませるだけでもブロックが発動することを発見しました。IBM X-Forceのセキュリティ研究者は、Fableが拒否した多くのリクエストはサイバーセキュリティと「わずかにかかわる程度」に過ぎないと述べています。
プリンストン大学のAI研究者Sayash Kapoor氏はメディアに対し、次のように率直に語りました。「これは初めて、AI企業がセキュリティガードレールを導入したにもかかわらず、全員から嫌われたケースです。」
ユーザーをさらに怒らせたのは、Fable 5の319ページに及ぶシステムカードに記載されていたある詳細です。すなわち、モデルがユーザーが最先端のAI開発(例:トレーニングパイプラインやチップ設計など)に関与していると検知した場合、ユーザーに通知することなく、回答の品質を意図的に低下させるという仕組みです。質問をすると、一見普通の答えが返ってきますが、実際にはその答えが意図的に「薄められ」ているのです。
この行為は批判者によって「秘密の弱体化(secret sabotage)」と呼ばれています。
Anthropicは48時間以内に謝罪しました。「誤ったバランスを取ってしまいました。お詫び申し上げます。」同社は、すべての非表示制限を可視化し、リクエストがブロックされた場合には明示的に通知するとともに、そのクエリを旧バージョンのモデルOpus 4.8へ転送すると発表しました。
しかし、物語はここで終わりません。
02 一通の書簡がプラグを抜いた
もし単にユーザーの不満だけであったなら、Anthropicはガードレールの調整によって対応できたかもしれません。しかし、その後に起きた出来事は、いかなる企業のコントロール範囲をも超えていました。
6月12日の午後、米商務省からAnthropicのCEOダリオ・アモデイ氏のオフィスへ一通の書簡が届きました。内容は極めてシンプルです:輸出管理規制を根拠として、Fable 5およびMythos 5への外国籍市民のアクセスを即時停止するよう要請するものです。
報道によれば、この書簡の発端となったのは、別の企業がMythosモデルのJailbreakに成功したと主張したことでした。
Anthropicはシステムレベルでユーザーの国籍をリアルタイムに識別することができませんでした。そのため、法的コンプライアンスを確保するために、同社は全世界のすべてのユーザーに対してFable 5およびMythos 5の利用を停止せざるを得ませんでした。他のモデルは影響を受けませんでした。
これは、AI業界史上初の事例かもしれません。外部からの指令により、すでに公開展開済みの最先端モデルが全面的に撤退を余儀なくされたのです。
Anthropicの反応は非常に強いトーンで行われました。同社は、受け取ったJailbreak報告は「狭域的かつ汎用性のないもの」であり、本質的には特定のコードベースを読み取り、そこに含まれる脆弱性を修正させるという能力の提示に過ぎず、このような能力はOpenAIのGPT-5.5を含む他の公開モデルでも同様に実現可能であると説明しました。
「この基準が業界全体に適用されるならば、我々は、すべての最先端モデルの展開が事実上停止してしまうと考えます。」
この一文の重みは非常に大きいものです。Anthropicは「当社のモデルに問題はない」と主張しているのではなく、「このロジックに従えば、どの企業の最強モデルも、一度のJailbreak報告ですべてが存続できなくなる」と述べているのです。
03 自ら呼び込んだ規制が自らを逆襲した
この事件で最も皮肉な点は、Anthropicがおそらく業界で最も積極的に規制を提唱していた企業だったという事実です。
Fable 5の発表の翌日、ダリオ・アモデイ氏は『Policy on the AI Exponential』という長文の論文を発表しました。そこでは、政府が米連邦航空局(FAA)のような権限を持つべきだと明言し、最先端モデルに対して第三者による強制的なテストを実施し、安全性に疑義があると判断されたモデルの展開を阻止する権限を有すべきだと主張しました。
彼は、AIの進化速度は指数関数的である一方、政策形成は線形であると指摘しました。トールキンの『指輪物語』に登場するエンツ(樹人)の比喩を用いて、知恵はあるが行動が遅く、気づいたときには既に森が焼け尽きていた、と表現しました。
Anthropicは、関連する立法活動に対して「多額の資金支援」を約束さえしました。
そして、彼が呼び込んだその規制権限が、わずか3日後に自社に向けられました。
しかも、その行使方法は、アモデイ氏が論文で明確に反対していたもの——透明性のない手続き、独立した技術評価の不在、企業側の弁明の機会の欠如、さらには書簡内に具体的なセキュリティ懸念の詳細すら記載されていない——まさにそのような方式で行われました。結論はただ一つ、「停止せよ」。
Anthropicは公式声明において、興味深い一文を述べています。「我々は、政府が不安全な展開を阻止する権限を持つべきだと考えますが、それは透明性・公平性・技術的事実に基づく法定手続を通じて行使されるべきです。今回の措置は、これらの原則に合致していません。」
これは極めて正確な立場表明です:権限の存在は認めるが、その行使方法には異議を唱える。
04 モデルが「インフラレベルのリスク」に変貌するとき
視点をAnthropicから離し、より広い構図を見渡しましょう。
Fable 5の事件は、構造的な矛盾を露呈しました:AIモデルはすでに、あらゆる利害関係者を不快にさせるほど強力になりつつあるが、それをどう規制すべきか誰も分かっていないのです。
ユーザーにとって、Fable 5のセキュリティガードレールは厳しすぎます。セキュリティ研究者が自らの研究に使えないというのは、外科医に血に触れさせてはいけない手術刀を与えるようなものです。
企業顧客にとっては、30日間のデータ保存が大きな課題です。マイクロソフトはすでに社員によるFable 5の使用を制限しており、企業機密がAnthropicのサーバーに保管されることを懸念しています。マイクロソフトはさらに、開発者向けのClaude Codeライセンスの提供を中止し、自社のGitHub Copilotへ移行を始めています。
政府にとって、2万3,000件もの脆弱性を発見可能なモデルが、万一ガードレールを突破された場合の影響は計り知れません。たとえ狭域的なJailbreakであっても、十分に警戒を要する状況です。
そしてAnthropic自身にとって、これはほとんど不可能なバランスの取れた課題です:モデルが弱すぎれば競争力を失い、強すぎれば厄介な火種となり、セキュリティ対策が緩すぎれば無責任と非難され、厳しすぎればユーザーが競合他社へ流れてしまうのです。
これはAnthropicだけの苦境ではありません。十分に強力なモデルを展開する企業であれば、いずれも同じ問題に直面することになります。
ダリオ・アモデイ氏は、彼の政策論文の中で次のように判断しています:AIモデルの能力向上は線形ではなく、指数関数的である。もしこの判断が正しければ、Fable 5が今日直面しているあらゆる矛盾は、次世代のモデルにおいてさらに拡大していくことでしょう。
セキュリティガードレールの設計はますます困難になり、Jailbreakとその防衛の攻防は激化し、企業顧客のデータ保存に対する拒否感はさらに強まり、そして政府の介入——それが透明な手続を伴うかどうかに関わらず——はますます迅速に到来するでしょう。
05 誰も準備できていないゲーム
最初の問いに戻ります。Fable 5の4日間の旅は、表面的には製品のリリースと撤退という出来事ですが、本質的には、モデルの能力ではなく、業界全体のガバナンス枠組みに対するストレステストです。
その結果は明確です:誰も準備できていません。
AI企業は準備できていません。Anthropicは業界で最もセキュリティを重視する企業の一つであり、数千時間に及ぶレッドチームテストを実施し、多層防御システムを設計し、データ保存を自ら求め、さらには政府による規制を公然と呼びかけています。しかし、こうしたすべての努力も、発表から撤退までの4日間というプロセスを止めることはできませんでした。
ユーザーも準備できていません。モデルが実際に特定のリクエストを「拒否」し始めたとき、その理由がセキュリティであっても、反応は怒りと嫌悪でした。
政府も準備できていません。技術的詳細の一切を記さない一通の書簡、単一のJailbreak報告に基づく判断だけで、何億人ものユーザーがモデルへのアクセスを失う事態を招いてしまいました。
アモデイ氏が呼びかけたのは、独立した評価、透明な手続、異議申し立てメカニズムを備えた精密なガバナンスマシンです。しかし、彼が実際に受け取ったのは、午後5時21分に届いた一通の書簡でした。
これがおそらく現在のAIガバナンスの現実です:誰もがルールが必要であることを認識しているが、誰もがルールを書き終える前に時間がなくなってしまう。そして、モデルは待ってくれません。
TechFlow公式コミュニティへようこそ
Telegram購読グループ:https://t.me/TechFlowDaily
Twitter公式アカウント:https://x.com/TechFlowPost
Twitter英語アカウント:https://x.com/BlockFlow_News