
AI推論市場の全体像を徹底分析:暗号資産プロジェクトはいかに突破口を見出すか?
TechFlow厳選深潮セレクト

AI推論市場の全体像を徹底分析:暗号資産プロジェクトはいかに突破口を見出すか?
推論こそがAIの最終戦場であり、従来のクラウド大手企業と分散型ネットワークとの対決——プライバシー、検証、エージェント経済において、果たしてどちらが主導権を握るのか?
執筆:0xSammy(Khala Research)
翻訳:AIdidiaoJP、Foresight News
現在のAI推論市場は、もはや単一のクラウドサービス市場ではなく、むしろ「リスク」を巡るチェス盤のような様相を呈しています。各プロバイダーはそれぞれ異なる領域を争っています。超大規模クラウド事業者は企業向け市場という「大陸」を支配し、ルーターは貿易路を制御し、分散型ネットワークはオープンなフロンティアで激しく戦いを繰り広げています。
前回のAIサイクルの核はモデル訓練でしたが、今や推論段階こそが莫大な経済的価値を秘めていることが明確になりつつあります。「inference(推論)」という言葉を初めて耳にする方もいらっしゃるかもしれません。では、そもそも推論とは何でしょうか?
訓練はAIモデルを創出しますが、推論とは、ユーザーがモデルに質問したりタスクを指示したりした際に、モデルがその答えを生成するプロセスです。
AI推論市場の概要
訓練が注目を集めるのは、驚異的な出力を可能にする基盤となるからです。しかし実際には、現在の経済的利益の大部分は推論が占めています——すべてのプロンプト、エージェントによるループ処理、画像生成、取引実行、ツール呼び出し、コード編集といった操作は、どこかのサーバー上で実行されなければなりません。
ルーターこそが真のボトルネックです
この「リスク」のチェス盤において、最も価値のある領土は、しばしば軍隊の次なる動きを決定する狭いボトルネックです。推論市場においても、ルーターはまさに同じ役割を果たします。それは需要と供給の間に位置し、各リクエストをどこへ向けるか、どのプロバイダーが報酬を得るかを決定します。
その代表例の一つがOpenRouterであり、先週だけで同プロトコルは4700兆トークンを処理しました。
こうした経済活動は、今後数兆ものエージェントが本格的に稼働し始めるにつれ、減速する気配すら見せていません。
では、完全な推論市場を構築するには何が必要でしょうか?その主要な要素は以下の通りです:
- トークンが会計単位として定着しつつある
- OpenRouterが急速にコアの取引所レイヤーとなりつつあり、先週のLLMマーケットにおける利用トークン量は4700兆に達しました。
- 専門的な供給側:Fireworks、Together、Replicate、Baseten、Groqおよび各大手超大規模クラウド事業者
- 暗号資産ベースのAIネットワーク:Chutes、Akash、io.net、Nosana、Targon、Venice、NuNetなどは、許諾不要の基盤インフラを構築中です。
これらすべてのプロバイダーを同一市場で競合していると考えてはいけません——実際にはそうではありません。
従来のプロバイダーは、信頼性・開発者体験・企業向け調達プロセスを販売しています。
一方、暗号資産ベースのAIネットワークは、より低コストの供給・オープンアクセス・プライバシー保護・検証可能性・新たなインセンティブメカニズムを売りにしています。
最近、Anthropic社が米国外ユーザーによるMythosモデル(Fable 5)の利用を禁止した事件は、最前線の閉じられたモデルへの過度な依存がもたらすリスクを再認識させる契機となりました。
興味深いことに、両世界は徐々に重なり始めています——特にプライバシー保護・機密計算・エージェント原生型支払い(VeniceおよびTargonがこの分野で目立っています)においてです。
AIコンピューティング能力市場をどう見るか
市場をよりよく理解するには、伝統的勢力と暗号資産ベース勢力という二つの陣営に分けて捉えるのが有効です:
伝統的側は信頼性・開発者体験・企業調達を販売しています。
暗号資産ネットワークは、オープンアクセス・より低コストの供給・プライバシー保護・検証可能性・新規のインセンティブ制度を通じて、グローバルなシームレスな資本調整を競っています。
なぜ推論こそが真のAI市場なのか
モデル層は依然として重要ですが、その品質は予想を上回るスピードで均質化しています。オープンソースモデルは、最先端モデルの90〜95%の品質を達成しながら、コストはわずか10%(例:Z.aiのGLM-5.2)で済みます。
オープンソースモデルは継続的に進化し、中国の研究室が価格をさらに押し下げています。最先端モデルは依然としてプレミアム価格を維持できますが、その下層ではトークン価格競争が非常に激化しています。
これがルーティング層が極めて重要になる理由です:同一のオープンソースモデルが、5つの異なるプロバイダーによって5種類の異なる価格で提供される場合、開発者は永遠に特定のエンドポイントをハードコードしたくありません。彼らにはルーターが必要なのです。
ルーターは価格・遅延・プライバシー・信頼性などの多様な要因に基づいて選択できます。
ルーターはすべてのプロバイダーの上位レイヤーに位置し、混沌とした状況をクリーンで統一されたインターフェースに変換します。
これこそがOpenRouterが成功している点であり、ベンチャーキャピタルが最近のBラウンドでこのルーティング機会を掴むために1億1300万ドルを投資した理由でもあります。
OpenRouterは急速に市場のインターフェースへと成長しており、「1つの鍵で数百の、複数のプロバイダーにまたがるモデルにアクセスできる」プラットフォームとなっています。真の価値はモデルリストにあるのではなく、同一のリクエストをそのタスクに最も適したプロバイダーへルーティングできることにあります。
これはエネルギー市場に似ています:ユーザーは電力を供給する発電所がどこかなど気にせず、ただ電気が点灯し、料金が妥当で、システムが安定していることを求めます。
AIユーザーも今後ますますこのような思考をするようになります——どのGPUクラスターがこのトークンを処理したかなど関係なく、応答が迅速・安価・プライベート・信頼できるかどうかだけが重要です。
従来の推論プロバイダー
従来の側は、以下の4つのタイプに分化しています:
i) 超大規模クラウド事業者(Hyperscalers):AWS、Google、Microsoft
彼らは「堅固な大陸」を支配しています。彼らが勝利するのは常に最も安いからではなく、企業向け調達・コンプライアンス・ID管理・セキュリティ・請求書処理などのインフラを既に掌握しているためです。この陣地に対する正面攻撃はコストが極めて高いのです。
彼らは企業の信頼によって勝ち抜きます。大企業が購入するのは単なるトークンではなく、コンプライアンス・セキュリティ・調達の容易さ、そして問題発生時の責任の所在です。
ii) ルーティング市場:OpenRouterおよび各種AIゲートウェイ
ルーターはモデルプロバイダーの上位レイヤーに位置し、各リクエストを最適なオプションへ送信します。モデルの優位性は毎週変化しており、単一モデルをハードコードすることはますます脆弱になっています。AIには、暗号資産分野と同様のアグリゲーターが必要です。
iii) 最適化されたオープンソースモデルサービス:Together、Fireworks、Baseten、Groq
これらは単なる安価なAPIではなく、速度・バッチ処理・スケーリング・ファインチューニング・カスタムエンドポイント・本番環境対応を重視したパフォーマンスインフラ企業です。
iv) モデルマーケット:ReplicateおよびHugging Faceのようなプラットフォーム
推論はチャットだけではありません。画像・動画・音声・埋め込み表現・ロボットモデル・シミュレーション・マルチモーダルエージェントなど、さまざまな用途にモデルの実行が必要です。マーケットプレイスは、ニッチな長尾モデル需要を簡単に満たせるようにします。
暗号資産ベースのAI推論プロバイダー
分散型ネットワークは「ゲリラ領土」です
暗号資産ベースの推論ネットワークは、AWSの主戦場でより多くの資金を投入して勝負しようとはしません。彼らは新しい戦線を開拓します:検閲なしのモデル・より安価なGPU供給・プライベートな推論・エージェント原生型支払い・超大規模クラウド事業者レベルの信頼性を必要としないワークロードです。
暗号資産側は単に「分散型コンピューティング能力」という曖昧な用語で片付けられがちですが、少なくとも5つの異なる方向性があります:
- サーバーレス推論ネットワーク
- 分散型GPUマーケット
- 機密計算ネットワーク
- プライベートAIアプリケーションおよびゲートウェイ
- オーケストレーションレイヤー
これらは一括りにして分析すべきではありません。
i) Chutes:暗号資産原生の推論
@chutes_aiは、単なるGPUマーケットではなく、分散型推論プラットフォームとして理解するのが最適です。
その核心は、開発者がGPUをレンタルしたりインフラを管理したりすることを望んでいないという点にあります。彼らが求めるのは、ただ正しく動作するエンドポイントです。Chutesは、分散型GPU供給をバックエンドに使いながら、馴染みやすいAPIでオープンソースモデルを提供します。
重要な課題は、トップレベルの使用量を、支払いを伴う反復的な需要へと転換できるかです。安価なトークンは有用ですが、その前提は、開発者がその稼働時間・遅延・信頼性を信頼していることです。
同プロジェクトの1兆トークンあたりの収益は継続的に上昇しており、持続可能な収益性/実現可能性のポテンシャルを示しています。
ii) Akash:GPUオークションレイヤー
@akashnetは分散型クラウドマーケットです。
ユーザーが必要なコンピューティング能力を定義し、プロバイダーがそれを入札で提供します。ワークロードはリース契約のもとで実行されます。これは直接的な推論ルーターというより、コンピューティング能力のマーケットに近いものです。
これは価格感度が高く、インフラの不安定性を容認でき、かつAWS/Azure/Google Cloudとの深いつながりを必要としないワークロードに最も適しています。費用はトークン価格とある程度相関し、上昇傾向にあります。
iii) io.net:分散型GPUクラウド
@ionetは、分散型GPUクラウドプロバイダーにより近い存在です。
その主な売りは、より低コストかつ迅速な設定で分散型GPU供給にアクセスできることで、長期のクラウド契約や超大規模クラウド事業者の価格設定を受け入れたくないAIチームにとって理想的です。
課題は実行にあります:ハードウェア検証・信頼性・スケジューリング・サポート・一貫したパフォーマンスの確保です。基本的なGPUアクセスには価値がありますが、より高利益のレイヤーは依然としてルーティング・推論管理・オーケストレーションです。
io.netは過去30日間で突出したパフォーマンスを記録し、年間収益は1230万ドルに達しています。
iv) Targon:機密計算
@TargonCompute(@manifoldlabsが開発)は、AIワークロード向けの機密計算に特化しています。
その解決すべき課題は明白です:多くのユーザーは、未知の第三者が運用するインフラ上で、機密性の高いプロンプト・モデル・データを実行することを望んでいません。
Targonは、信頼実行環境(TEE)、暗号化仮想マシン、リモート証明、機密GPUインフラを活用して、保護された実行環境を提供します。簡単に言えば、ワークロードが安全な環境で実行されていることを証明し、運用者がアクセス可能な情報を最小限に抑えます。
これは金融・医療・企業向けAIなど、プライベートな推論が特に重要となる分野において極めて関連性が高いです。機密計算は魔法ではなく、信頼をハードウェア・ファームウェア・証明システムへと移転させます。
昨年度、同プロトコルは年間収益1040万ドルを報告し、Intelと共同で「信頼できないハードウェア上の分散型コンピューティング能力」に関する研究論文を発表しました。
v) Darkbloom:アイドルMacでのプライベート推論
Darkbloom(@eigenlabsが開発)は異なるアプローチを取ります。
大規模モデルをランダムなGPUに分割する代わりに、アイドル状態のApple Silicon搭載Macをプライベート推論ネットワークへと変換します。Mac上でモデルがローカル実行され、リクエストは暗号化されて検証済みプロバイダーへルーティングされます。
その売りはプライバシーとコストであり、最先端モデルのパフォーマンス最大化ではありません。
これは非常に有用です。「ノードが完全なモデルを保持していない」という事実は、自動的にプロンプトがプライベートであることを保証しません。Darkbloomはプライバシー問題をより明確にターゲットにしていますが、それでも供給規模・パフォーマンス・開発者からの信頼の獲得を証明する必要があります。
現在、ネットワークには300台のマシンが登録され、20億トークンおよび100万回のリクエストを処理しています。
vi) Venice:消費者向けプライベート推論
@AskVeniceは、Akashやio.netなどのネットワークとは異なる位置にあります。それは主にGPUマーケットではなく、むしろプライベートAIアプリケーションおよび推論ゲートウェイに近い存在です。
同ゲートウェイのスループットは、1日あたり850億トークンに達しています(@ErikVoorheesのデータ)。
大多数のユーザーは、プライバシーを尊重し、強力なモデルにアクセスでき、大量のデータ収集を行わないAI製品を求めています。
Veniceはインフラの概念を消費者向け体験に包み込み、プライベートなプロンプト・オープンソースモデル・検閲なしアクセス・API機能・VVVおよびDIEMによるトークン化されたコンピューティング能力を提供します。
特にDIEMコンポーネントは興味深く、より広範なエージェント経済の概念を示唆しています:1日あたり1ドル相当のコンピューティング能力へのアクセスを提供します。市場はこの概念に対して既に妥当な価格を付けています。
もしエージェントが継続的に推論にアクセスする必要があるなら、コンピューティング能力のクレジットはエージェント原生資産のように振る舞い始め、その周辺に二次市場が形成される可能性があります。
人間が定期的にクレジットカードを刷るのを待つエージェントよりも、直接コンピューティング能力の権利を所有・消費できるエージェントの方が実用的です。
これは、より深い暗号資産ベースAIの主張を浮き彫りにしています:エージェントは最終的に資金・アイデンティティ・メモリ・コンピューティング能力へのアクセスを必要とし、暗号資産システムはこれらのリソースをプログラム可能にするフレームワークを提供します。
Veniceは、OpenRouterとモデルの広さで直接競争するのではなく、プライバシー・アクセス・トークン化されたコンピューティング能力を競っています。これは正当なニッチですが、鍵となる問いは、「プライベートAI製品」に対する需要が、現在の物語サイクルを超えてトークンモデルを支えるほど大きくなるかどうかです。私の判断では、AIの普及とともに、プライバシーに関する物語はますます強くなるでしょう。
vii) NuNet:分散型コンピューティング能力のオーケストレーション
@nunet_globalはしばしば分散型コンピューティング能力プロジェクトに分類されますが、より有用な枠組みは「オーケストレーション」です。
オーケストレーションとは、ワークロードを最も適したコンピューティング能力リソースにマッチさせ、異なるマシン・環境・ロケーション間で実行を調整することです。
AIが集中型クラウドインフラを越えて拡大するにつれ、これはますます重要になります。
将来のAIシステムは、クラウドGPU・エッジデバイス・オンプレミスサーバー・ロボット・スマートフォン・センサー・分散型プロバイダーのネットワークなど、多様な環境で実行される可能性があります。
倉庫内のロボットは地域をまたぐAPI応答を待つことができません。ドローンは常に完璧な接続を前提にできません。野外のロボットはネットワークが不安定な状況でもローカルで推論を実行する必要があります。
そのため、オーケストレーションは独立した、かつ意義あるカテゴリへと成長しています。
NuNetの課題は、この調整問題を、十分な供給・需要・開発者採用を伴う機能する経済ネットワークへと転換できるかどうかです。
viii) OpenServ:純粋な推論ではなく、エージェントのオーケストレーション
@openservaiは、分散型推論ネットワークというより、エージェント向けインフラおよびオーケストレーションプラットフォームとして理解するのが最適です。
これは重要です。なぜなら、エージェントは今後最も明確な推論需要源の一つだからです。通常のチャットボットはモデルを1回呼び出すだけですが、エージェントはモデルを何度も呼び出します:推論→ツール使用→出力確認→別のモデル呼び出し→アクション実行→ループの繰り返しです。
これは膨大な推論需要を生み出し、すでに暗号資産コミュニティ内で注目を集めています。
したがって、OpenServは需要側から、供給側ではなく推論市場に関連しています。もし同プラットフォームが、エージェントの構築・展開・調整に役立つ場所になれば、自然と下位レイヤーとして、異なるプロバイダーへ推論をルーティングする層にもなり得ます。
鍵となる問いは、OpenServが真のエージェント実行層になれるか、それとも単なるトークン付きのエージェントマーケットに留まるかです。
チームとの複数回のやり取りの結果、私はそれが後者に留まらないと判断しています。同プロジェクトの推論フレームワークはいくつかの顕著なベンチマーク結果を示しており、ロードマップには独自のプロプライエタリモデルも含まれています。
もしOpenServがエージェント化された運用ワークフローを掌握できれば、推論はプラットフォームの入力となり、主要な製品ではなくなります。
エージェント化された世界において、最も価値のあるレイヤーは、エージェントが大量の継続的な時間とリソースを費やす場所です。
ix) Dolphin AI:製品主導の分散型推論
@dphnAIの興味深い点は、GPUマーケットではなく、まずモデル需要からスタートしたことです。
Dolphinモデルファミリーは、検閲なしのオープンソースモデルとしての評判を確立しており、これによりネットワークの存在意義が明確になっています。
これは重要です。なぜなら、多くの分散型推論プロジェクトが供給先行で進んでいるからです。「我々にはGPUがある。誰か買いませんか?」
Dolphinは逆のアプローチを取ります:すでに人々が使いたいと思っているモデル群から出発し、その需要を基盤として分散型推論ネットワークを構築します。
そのアーキテクチャはしばしばpeer-to-pool(ピア・トゥ・プール)と呼ばれます:GPU所有者は容量を特定のモデルプールへ寄与し、個々の買い手が特定ノードを直接レンタルするわけではありません。リクエストはプールへルーティングされ、利用可能なノードが処理します。
これは信頼性の低い消費者向け供給に適した設計です。誰かがアイドル中のゲーム用GPUを提供しても、ずっとオンラインでいるとは限りません。プール方式のモデルは、こうした変動を1対1のレンタル市場よりも自然に吸収できます。
さらに興味深いのは検証です。Dolphinはライブウェイト証明(live-weight proofs)を推進しています。簡単に言うと、サービス提供中に実際に読み込まれているモデルの重みが、ノードが実行すると主張しているモデルと一致しているかをチェックします。
これは極めて重要です。なぜなら、不正行為は分散型推論において最も難しい課題の一つだからです。ノードは高価なモデルを実行していると主張しながら、実際にはより小さく・より安価・あるいは量子化されたモデルを秘密裏に提供する可能性があります。ネットワークがこれを検出できなければ、市場全体の信頼性が失われてしまいます。
x) c0mpute:エージェント向けの分散型推論
@c0mputeAIは注目に値します。なぜなら、分散型推論において最も困難な課題の一つ——オープンインターネット上で分散されたGPUを跨いで大規模モデルを実行すること——に挑戦しようとしているからです。
Shardエンジンは、巨大な1台のサーバーに全モデルを収容するのではなく、モデルを複数のマシンに分割します。これは、通常のホスティングルートでは扱いきれないほど巨大または制限された最先端規模のオープンソースモデルに特に重要です。
@virtuals_ioのリンクは需要側の観点から見て鍵となります。Virtualsはエージェント経済を構築しており、エージェントは推論の重度ユーザーです:計画立案・ツール呼び出し・取引実行・結果確認・ループ処理。これにより、安価でオープンかつ検閲耐性のある推論に対する需要が生まれます。
ただし、現時点ではまだ初期段階です。c0mputeは実際の負荷下でのパフォーマンス・ノードの信頼性・検証・プロンプトのプライバシー保護を証明する必要があります。
しかし、方向性は重要です:GPUマーケットはコンピューティング能力へのアクセスを販売します;c0mputeはモデル自体の分散を目指しています。
従来型 vs 暗号資産ベース推論
両者は共存し、それぞれ明確で理解すべき独特のメリットを持っています。
注目すべきポイント
有償トークン処理量
市場は、収益を生まない「原始的」トークン処理統計への関心を減らすべきです。無料層の活動や補助金による利用は、派手な数字を作り出せても、実際の製品・市場適合性を証明できません。
有償推論需要こそが鍵となる指標です——これはより持続可能であり、長期的な実現可能性を支えます。
ii) GPU1台あたりの収益
分散型コンピューティング能力ネットワークは、GPUがネットワーク内での稼得額が外部より高くなった場合にのみ持続可能です。もし報酬がプロバイダー参加の主な動機であれば、インセンティブが低下すれば供給は消失します。GPUプロバイダーは機会費用を計算します。
iii) ルーター統合:流通
流通はインフラ自体よりも重要であることが多いです。
OpenRouterの統合・コーディングされたエージェント・ウォレット・支払いエンドポイント・開発者ツール・消費者向けアプリケーションなどは、潜在的な需要源です。
支払いエンドポイントとは、ソフトウェアがAPI経由で直接サービスに対し支払いを行うことができるチャネルです。
iv) 検証
GPUの不正行為・虚偽の容量申告・信頼性の低いプロバイダーは、依然として現実のリスクです。
ネットワークには、堅牢なハードウェア検証・暗号化トラフィック・評判システム・悪意ある行動に対する意味のあるペナルティが必要です。
v) プライバシー保証
プライベートな推論は、暗号資産ベースAIにおいて最も強い機会の一つですが、保証は実際のものでなければなりません。プライバシーを謳うのは簡単ですが、セキュアな実行・ローカル優先のアーキテクチャ・データ最小化・監査可能なインフラを実現するのははるかに困難です。
vi) トークンによる価値捕捉
最も強力なトークンモデルは、需要をリアルタイムの推論利用に直接結びつけます。これは、買戻し・焼却・ステーキング要件・コンピューティング能力の権利・収益連動型メカニズムなどを含む可能性があります。
漠然としたAI物語だけでは、長期的には十分とは言えません。
主要な結論
終局は需要の支配
「リスク」のチェス盤において、断片的な領土を占有するだけでは不十分です。あなたには連結された領域・増援ルート・持続的な補給ラインが必要です。
推論市場でも同様です。勝者は需要・ルーティング・検証・決済を掌握します。GPUそのものだけを所有していても不十分です。
推論市場は、AIを金融システムに似たものへと変貌させます:
- 生成される各トークンにはコストが伴い、
- 各エンドポイントには利益が伴い、
- 各エージェントループは需要を創出し、
- 各ルーターはマーケットメイカーのように振る舞い、
- 各GPUネットワークは供給源となります……
従来のプロバイダーは現在、開発者体験および企業向け信頼層を支配しています。
一方、暗号資産ベースAIネットワークは、許諾不要の供給・プライベートな推論・検証可能なコンピューティング能力・トークン化されたアクセス・KYC不要のエージェント原生型支払いという、もう一つのフロンティアを探索しています。
短期的には、最も分散化されたネットワークが勝者になる可能性は低く、むしろ分散型推論を「普通で信頼できる」ものに感じさせるネットワークが勝者となるでしょう——高速なエンドポイント・充実したドキュメンテーション・高い稼働率・透明な価格設定・検証済みの供給・実際の有償需要を実現するネットワークです。
Chutesは、Bittensorが支援するコンピューティング能力を単なるGPU物語ではなく、機能する推論市場へと変換しつつある点で、引き続き注目すべきプロジェクトの一つです。Eigen Labsの「Darkbloom」も同様です。
Akashおよびio.netは供給側の挑戦者を代表し、Targonは機密計算の主張を代表し、VeniceはプライベートAI需要層を代表し、NuNetはより分散化されたコンピューティング能力の未来におけるオーケストレーションを代表しています。
より広範な主張:
「AIモデルはますます商品化していくかもしれませんが、推論市場は必ずしも同じ道を辿らないでしょう。」
最大の価値は、タスクをルーティングし・検証し・決済し・需要を捕捉する実体に帰属します。
まさにここに、次の暗号資産ベースAIの機会が出現する可能性があります……少なくとも物理的なAIが社会で十分な役割を果たすようになるまでは。
TechFlow公式コミュニティへようこそ
Telegram購読グループ:https://t.me/TechFlowDaily
Twitter公式アカウント:https://x.com/TechFlowPost
Twitter英語アカウント:https://x.com/BlockFlow_News












