
実測:Claude史上最強モデル「Fable 5」——一般ユーザーは使用に注意
TechFlow厳選深潮セレクト

実測:Claude史上最強モデル「Fable 5」——一般ユーザーは使用に注意
トークン課金時代へようこそ。
著者:APPSO
一般ユーザーにとって最も悪い知らせがついにやってきた。
さきほど、Anthropic が Claude Fable 5 および Claude Mythos 5 のリリースを正式発表した。
このうち、Fable 5 は Anthropic 初の、一般公開向け Mythos クラスモデルであり、Mythos 5 は少数のサイバーセキュリティ防御機関、重要インフラ提供事業者、および今後「信頼アクセス計画(Trusted Access Program)」に参加するバイオメディカル研究者に限定して提供される。
ただ、あまり注目されていない点だが、公式説明によれば、Fable 5 は現時点から6月22日まで、Pro・Max・Team および席数課金制 Enterprise プランに含まれており、追加料金は一切発生しない。しかし、6月23日以降はこれらのサブスクリプションプランから除外され、引き続き利用するには usage credits(使用クレジット)を消費することになる。
言い換えれば、これまでのように「月額料金一括払い」で世界最強のAIをフル活用できた時代は、もはや終わりを迎える可能性がある。ユーザーが今後検討すべき課題は、単なるサブスクリプション価格だけではなく、1回のAPI呼び出し、あるいは長時間実行されるタスクごとに実際に消費されるトークン数という、より本質的なコストである。
ようこそ、「トークン課金時代」へ。
Claude Fable 5が神格化登場——だがそれは同時に、最も手厳しい「トークン・アサシン」でもある
Anthropic は Fable および Mythos という名称についても説明している。Fable はラテン語の「fabula(語られる小さな物語)」に由来し、ギリシャ語の「Mythos」とほぼ同義である。
一見すると2つの別個のモデルのように思われるが、実際には同一の基盤モデルの2つのバリエーションに近い。Fable 5 は現在一般公開されており、より厳格なセキュリティ制限が適用されている。
一方、Mythos 5 は現時点で「Project Glasswing」計画を通じて、限定されたサイバーセキュリティ防御機関および重要インフラパートナーのみに提供されている。
Anthropic の公式ブログによると、Fable 5 は現時点で一般利用可能なモデルの中で、最も能力の高いものであり、ソフトウェア工学、知識労働、視覚理解、科学研究などの分野で顕著な向上が見られる。タスクが長く、複雑になるほど、従来のClaudeモデルとの差はさらに拡大する。
Fable 5 の意義は、Mythosクラスの能力が初めて一般ユーザーに大規模に開放された点にある。以下のベンチマークテストのスコアグラフは、まさに「圧倒的リード」を示している。
ただし、モデル名そのものが一部で議論を呼んでいる。元OpenAI Codex責任者であるTibo氏は、AnthropicがOpenAIが検討していたが採用しなかった「Fable」という名称を採用したと皮肉る投稿を行った。
能力面では、ソフトウェア工学が公式が特に強調する分野の一つである。
Anthropic によると、Stripe社が早期テストでFable 5に、5,000万行に及ぶRubyコードベースの移行タスクを実行させたところ、エンジニアチームが手作業で行う場合、2か月以上かかる作業が、Fable 5では1日で完了したという。
Cognition社のFrontierCodeテストでも、Fable 5は複雑な本番レベルのコードタスクにおいて他を圧倒する性能を発揮した。この評価は単純なコーディング問題ではなく、困難なプログラミング課題を解決し、高品質な本番用コードベースを生成できるかどうかを重視している。
Anthropic はまた、Fable 5が従来のClaudeモデルよりもトークン使用量が少ないとも主張している。とはいえ、これはあくまで「聞き流す程度」の話だ。過去のClaude新モデル発表時にも同様の主張が繰り返されてきたが、結果的にはいずれも「トークン・アサシン」として、インターネット上に数多くの笑いを提供してきた。
知識労働分野では、Fable 5はHebbia社の金融分野ベンチマークテストで最高得点を記録し、文書推論、図表理解、複雑な問題分析といった項目で特に向上が見られた。IMC社のトレーディング分析テストでも、事実検索、概念推論、原因分析、期待値分析において優れたパフォーマンスを発揮した。
視覚能力も今回の発表の重点の一つである。Anthropic によると、Fable 5は複雑な科学図表から正確な数値を抽出でき、またウェブページのスクリーンショットからアプリケーションのソースコードを再構築することも可能だという。
公式が提示したもう一つの直感的な事例として、Fable 5が『ポケットモンスター ファイアレッド』のゲーム画面のみを入力として、マップ情報やナビゲーションツール、ゲーム状態データなどを一切使わずに、ゲームをクリアしたというものがある。これに対し、従来のClaudeモデルでは同様のタスクを遂行するために、より複雑な補助システムが必要だった。
長文コンテキストおよび記憶能力も向上している。Anthropic は『Slay the Spire(スレイ・ザ・スパイア)』のテストで、モデルに永続化ファイルメモリを提供した場合、Fable 5のパフォーマンス向上幅はOpus 4.8の3倍に達し、最終章に到達する頻度も3倍になったと報告している。
生命科学分野については、より慎重な扱いが求められる。Anthropic によると、内部のタンパク質設計専門家がMythos 5を用いて、一部の創薬プロセスを約10倍のスピードで加速させているという。
ある事例では、Mythos 5がタンパク質設計およびバイオインフォマティクスツールを活用し、人手による支援なしに、科学者が通常行う一連のプロセス(結合部位の選定、設計ツールの起動、失敗結果の処理など)をすべて自動実行した。14個のタンパク質標的のうち、9個について、今後の研究に値する候補化合物が得られた。
生命科学およびサイバーセキュリティ分野における能力向上は、AnthropicがMythosクラスの完全な能力を一般に解放しない理由を裏付けている。
Fable 5が一般公開されるにあたり、Anthropicは新たなセキュリティ分類器を導入した。ユーザーのリクエストがサイバーセキュリティ、生物学、化学、またはモデル蒸留など高リスク領域に該当する場合、システムは自動的にClaude Opus 4.8に切り替え、ユーザーにモデル変更を通知する。
Anthropic によると、初期データではFable 5の会話の95%以上がこの切り替えをトリガーしないという。通常のライティング、プログラミング、分析、デザイン、データ処理などのタスクについては、ほとんどの場合Fable 5自体が使用可能だが、高リスク領域に踏み込むと、モデルの能力は制限される。
中でも最も厳格な制限が設けられているのがサイバーセキュリティ分野である。Anthropicは、Mythosクラスのモデルがソフトウェアの脆弱性を発見・悪用する能力に長けており、偵察、脆弱性発見、横方向移動など、エージェント型攻撃の各段階をカバーできると認めている。こうした能力の悪用を防ぐため、Fable 5のサイバーセキュリティ分類器は非常に広範な対象をカバーしている。
生物学および化学分野についても同様の判断が下されている。Anthropicは、モデルがすでに実際の科学研究タスクを遂行できる水準に達しており、従来のように生物兵器関連の質問を少数のみ遮断するだけでは不十分だと考えている。そのため、Fable 5は現時点では、大多数の生物学・化学関連リクエストに対して、Opus 4.8へのフォールバック処理を行う。
さらに興味深いことに、AnthropicはFable 5に、最先端の大規模言語モデル開発を対象とした「隠された保護機能」を追加している。
これは、Claudeが事前学習パイプラインの構築、分散学習インフラストラクチャの設計、あるいはMLアクセラレータの設計などのタスクを支援することを制限するもので、モデル自身が他の組織による次世代最先端モデルの訓練を加速させるのを防ぐ目的がある。
Opus 4.8への切り替えを伴うセキュリティ制限とは異なり、この種の保護機能はユーザーに直接通知されることはない。代わりに、プロンプトの改変、steering vectors(ステアリング・ベクトル)、PEFT(Parameter-Efficient Fine-Tuning)などの手法を用いて、関連タスクにおけるFable 5の性能を意図的に低下させる。既にこうした影響を受けたユーザーによる実証談も報告されている。
現時点において、Claude Fable 5は全世界のユーザーに公開済みである。開発者はClaude API経由で「claude-fable-5」を呼び出すことができる。Claude APIおよび従量課金制Enterpriseプランは、リリース日から即時利用可能となっている。
Fable 5およびMythos 5の価格は同一で、入力トークン100万トークンあたり10米ドル、出力トークン100万トークンあたり50米ドルである。Anthropicによれば、これはClaude Mythos Previewの価格の半分以下だが、高負荷・長時間タスクにとっては依然として高額である。
AIがついに「6本の指」を数えきった
公式ブログよりも、実際の動作テストの方がFable 5の真の進化を如実に示す。私の実測によれば、Fable 5はすでに「6本の指」を正しく認識できるようになった。
ちょうど大学入試センター試験(高考)が終了したタイミングでもあり、全国統一試験(第1回)の国語作文課題をFable 5に解かせてみた。全体としての文体や表現は非常に滑らかで、「ありふれた」文章とは程遠い。
より具体的な比較については、@Hypergent氏による実測が参考になる。小惑星可視化タスクでは、Fable 5は単なるデータ抽出にとどまらず、軌道軌跡とホバリング詳細を含むインタラクティブな表示を独自に設計し、パフォーマンスを維持しつつ、情報伝達力を向上させている。
フィットネス・リゾートの計画タスクでは、Fable 5はGPT-Image-2およびNano Bananaを活用し、実際の運用ロジックに即した施設配置案を生成。単に建物を並べるだけでなく、エリア間の接続性、機能分布、人流動線といった要素を総合的に考慮している。
Fable 5は天文学的現象と可視化表現を融合し、太陽フレアがオーロラに与える影響をシミュレーションで可視化できるが、Opus 4.8ではそもそも正常に読み込みさえできなかった。
元Tesla AI部門責任者・OpenAI共同創業者のAndrej Karpathy氏(現Anthropic所属)の評価は、開発者の実感をよりよく表している。
ただし、デザインの審美性に関しては、現時点では依然として人間がわずかに優位である。
ウォートン・スクール教授のEthan Mollick氏による実測は、Fable 5の変化をさらに深く浮き彫りにする。Mollick氏は早期アクセス権を得て、ゲーム、地図、研究ツールなど複雑なタスクを中心にテストを実施した。
中でも代表的なのは等時線地図プロジェクトである。Mollick氏はFable 5に対し、実際の交通データに基づくインタラクティブな地図を作成し、一定時間内に到達可能な都市範囲を可視化するよう指示した。モデルはその後、複数のAgentを駆使して航空便、鉄道、道路のデータを収集し、コードの作成・テストを同時に行い、フィードバックに基づいて結果を継続的に修正した。
Mollick氏はまた、Fable 5に「Concord」という研究ツールの開発も依頼した。モデルはまず19ページに及ぶ設計ドキュメントを生成し、その後9時間半にわたって連続作業を行い、オープンな研究データを分析し、人間とAIの判断結果を較正するためのソフトウェアを完成させた。
一方で、実測では明確な課題も浮き彫りになった。Mollick氏は、Fable 5は依然として誤りや抜け漏れを起こすため、人手による検査・補完が不可欠だと指摘している。また、長時間タスクによるトークン消費は極めて大きく、Fable 5の価格はOpus 4.8よりも明らかに高いため、実際の業務環境への投入時には、コストが最大の現実的課題となる可能性があると述べている。
高負荷・長時間タスクの能力は、最終的にすべて使用コストに反映される。20ドルのProプランユーザーである私ですら、ごく簡単な数回のタスク実行だけでクォータを消費してしまった。
また、Claudeクライアント上でもFable 5が「6月22日まで含む(included until June 22)」と表示されている通り、前述の通りAnthropicのスケジュールでは、無償提供期間終了後、Fable 5は一部のサブスクリプションプランから除外され、引き続き利用するにはusage creditsの消費が必要となる。
かつてユーザーは、それほど高くない月額料金を支払うだけで、世界で最も優れたAI群を大幅に利用できた。サブスクリプション制は実際のコストを曖昧にし、個人ユーザーが特定の瞬間、ある大企業とほぼ同じスタートラインに立つことを可能にしてきた。
トークン課金制が到来すれば、すべてが一変する。
AIは、月額制に近いサービスから、使用量に応じて消費される「生産資材」へと姿を変える。最強のモデルも、より高価で、より細かく計量される生産ツールへと変貌しつつあるのだ。
コストをあまり気にしない人もいるだろう。例えば、Fable 5に24時間連続のロングチェインタスクを実行させ、5,000万行のコードを再構築したり、完全なアプリケーションを独立して開発したり、研究プロジェクトを継続的に実行したり、結果を何度もテスト・修正したりするといった使い方が可能だ。
しかし、より多くの一般ユーザーは、毎回のAPI呼び出し前に無意識にこう問いかけ始めるだろう。「この質問にトークンを使う価値はあるか?」「このタスクを最強モデルに任せる価値はあるか?」「この試行が失敗した後、もう一度やり直す価値はあるか?」
最も悪い知らせとはまさにこれである。AIは決して弱くなっていない。むしろ、人類の知的労働の多くを、これまでにない速さで独自に遂行できるほど、驚異的に強くなっているのだ。
同時に、こうした能力を手に入れるための「入場券」の価格は、着実に上昇している。大規模言語モデルによって縮まっていた、一般ユーザーと先端生産性との間の情報格差は、高額なトークン課金によって再び広がる可能性がある。
Anthropicがそうであるように、今後OpenAIなど他のメーカーも同様の道を歩むことは避けられない。最先端モデルが強くなればなるほど、学習・推論コストは増大し、とりわけ両社は現在上場を目指しており、資本市場に対して「より強いモデルを訓練できる」だけでなく、「その能力を継続的な収益に転換できる」ことを証明する必要がある。
したがって、Fable 5のリリースは単なるモデルアップグレードではなく、AIサブスクリプション体制を根本から再構築するための予告編にすぎない。もしAIの「恩恵の窓口期間」がカウントダウンを始めているとすれば、これほど悪いニュースはないだろう。
TechFlow公式コミュニティへようこそ
Telegram購読グループ:https://t.me/TechFlowDaily
Twitter公式アカウント:https://x.com/TechFlowPost
Twitter英語アカウント:https://x.com/BlockFlow_News














