
トークン経済学の新モデルを一文で理解する
TechFlow厳選深潮セレクト

トークン経済学の新モデルを一文で理解する
大規模言語モデル(LLM)ベンダーと開発者をつなぐトークン流通の中間層が台頭しており、真の利益は推論の高速化、企業向け統合、および実際のユースケースへの展開に隠されている。
執筆:趙穎
出典:Wall Street Insights
AIアプリケーションの商用化は、ソフトウェア販売や会員制サービスから、トークン(Token)のAPI呼び出し能力の販売へと拡大しつつある。ここでいう「トークン」とは、大規模言語モデル(LLM)が情報を処理する際の最小単位であり、モデルのAPI利用料金の算定・精算・消費の基盤でもある。呼び出し量の増加に伴い、トークンそのものが一種の「在庫」として調達・ルーティング・分割・転売されるようになってきている。
華源証券のアナリスト・陳良棟氏は、最近発表したメディア業界特集レポートにおいて、この変化の核心を次のように要約している。「トークン運営は新たなミドルレイヤー市場を形成しつつあり、すなわちトークンの流通・販売モデルを探求し、上流の大規模モデルメーカーと下流の開発者・企業・個人ユーザーを結びつけるものである。本質的には、グローバルなトークンの卸売から小売に至るネットワークにおける流動性インフラである。」
このビジネスが登場した背景はそれほど複雑ではない。一方では、中国国内のトークン呼び出し量が急速に拡大しており、2024年初めの1日平均呼び出し量は1,000億トークンであったが、2025年末には100兆トークンへ、さらに2026年3月には140兆トークンを突破した。他方では、国産大規模モデルの性能が飛躍的に向上し、一部のベンチマークおよび実際の呼び出し量においてすでに世界トップクラスに達している。需要が拡大し、モデル数も増えた一方で、取引を実際の障壁となっているのは、支払い・ネットワーク接続・APIインターフェース・コンプライアンス・チャネル・具体的なユースケースへの適用といった課題である。
ただし、トークン流通事業を単純に「API利用枠の転売」と理解するのは誤りである。最も薄い利益は転売による価格差(マージン)から得られるが、より厚みのある収益は、推論加速・統一APIインターフェース・企業向けプロンプトエンジニアリング・エージェント(Agent)オーケストレーション・モデル選定・業務システムとの統合などから生じる。また、参入障壁がそれほど高くないため、この市場におけるリスクも同様に明確である:競争の激化、前払い資金の負担および不良債権、そして上流のモデルメーカーによるポリシー変更などが、ミドルレイヤーの利益を圧迫する要因となる。
トークンにはすでに「卸売業者」と「小売業者」が存在する
トークン流通の基本的なチェーンには、以下の3種類の関係者が関わっている。
上流はモデル提供側であり、ByteDanceのSeedanceシリーズ、AlibabaのQwenシリーズ、智譜(Zhipu)のGLMシリーズ、月之暗面(Moonshot)のKimiシリーズ、DeepSeekシリーズなどが含まれ、これらがトークンの供給元である。
中流は代理プラットフォームであり、上流のモデルリソースを受託し、最終ユーザーへ再販する役割を担う。単に利用枠を転売するだけではなく、異なるモデルのAPIプロトコルを統一されたAPI形式に変換し、下流ユーザーが1つのAPIキーで複数のモデルを呼び出せるようにすることも重要な仕事である。
下流はトークンを実際に消費するユーザーであり、個人ユーザー、開発者、企業顧客、あるいは下位の流通業者も含まれる。
このミドルレイヤーの価値は主に以下の点に集中している:中国国内での直結によりネットワーク接続のハードルを低減;1つのコードベースで複数のモデルに対応可能;個人および法人向けの支払い対応;大量調達によりコストをさらに引き下げ可能;GPT、Claude、DeepSeek、Kimiなど多様なモデルを1つのプラットフォームで統合し、開発者の反復的なAPI連携作業を削減できる。
したがって、トークン流通事業は見かけ上は軽資産型であり、自社で大規模モデルを訓練したり、大規模なサーバークラスターを保有したりする必要はない。代わりに、そのコアアセットはAPI中継・スケジューリングシステム、上流のモデルリソース、チャネルパートナーおよび顧客、そしてサービス提供能力となる。
呼び出し量の爆発的増加が、このビジネスを支える最も直接的な燃料
トークン運営モデルが成立するためには、まず十分な消費量が必要である。
中国の1日平均トークン呼び出し量は、わずか2年間で1,000億トークンから140兆トークン以上へと、1,000倍以上に増加した。この呼び出し量の拡大は、さまざまな垂直領域向けエージェント(Agent)の実用化に起因するとともに、企業が生成AIをより多くの業務プロセスに組み込む動きにも由来する。
IDCのデータはさらに大胆な予測を示している:中国企業が活用するアクティブなAIエージェントの数は、2031年までに3.5億を超えると予測されており、年平均成長率(CAGR)は135%を超える。また、エージェントのタスク密度および複雑度が高まることに伴い、エージェントによるトークン消費量の年平均増加率は30倍以上に達する可能性がある。
実行型エージェントにおいてすでにこうした変化が観測されている。OpenClawは、OpenRouterプラットフォーム上で2026年2月2日~3月16日の週に0.81テラトークン(T)から4.97テラトークン(T)へと週間トークン消費量を増加させ、全体に占めるシェアも8.31%から24.36%へと上昇した。
トークンが大規模な消耗品となった場合、それを巡る調達・価格設定・ルーティング・精算といったプロセスは自然と階層化される。モデル提供者は必ずしもすべての顧客に直接サービスを提供せず、終端ユーザーも各モデルごとに個別に接続することを望まない。こうしたギャップこそが、ミドルレイヤーに存在意義を与える。
国産モデルのコストパフォーマンスが、トークンの海外展開への入り口を開く
国産大規模モデルの性能向上は、トークン流通事業が中国国内からクロスボーダーへと拡大する鍵となる要因である。
SuperCLUEのデータによると、ByteDanceの豆包(DouBao)、DeepSeekシリーズなどの国産モデルの総合評価スコアはすでに70点を超え、GPT-5.4やGeminiなどの海外トップクラスモデルとの差は縮小している。また、通義千問(Qwen)、Kimi、智譜GLMなども明確な順位付けを形成している。
OpenRouterのデータによれば、2026年5月10日までの1週間の呼び出し量ランキングにおいて、騰訊(Tencent)のHy3 preview(無料版)が首位を占めた。上位5位・10位・20位のうち、国産大規模モデルはそれぞれ2件・6件・9件を占めており、中国製モデルの存在感が顕著である。
さらに象徴的な変化は2026年第1四半期に起こった。2月9日~15日の1週間、中国製モデルのOpenRouter上での呼び出し量は4.12兆トークンに達し、同時期の米国製モデルの2.94兆トークンを初めて上回った。さらに2月16日~22日には、中国製モデルの週間呼び出し量は5.16兆トークンへと増加。プラットフォーム上の呼び出し量トップ5のモデルのうち、MiniMax M2.5、Kimi K2.5、智譜GLM-5、DeepSeek V3.2の4モデルが中国メーカー製であり、トップ5全体の呼び出し量の85.7%を占めた。
価格面での優位性も顕著である。MiniMax M2.5およびGLM-5の入力価格は100万トークンあたり0.3米ドルであり、Claude Opus 4.6は5米ドルである。出力価格については、MiniMax M2.5が1.1米ドル、GLM-5が2.55米ドル、Claude Opus 4.6が25米ドルである。国産モデルは、AIエージェントやコード開発など、トークン消費量が特に多いユースケースにおいて、そのコストパフォーマンスの差がさらに拡大する。
グローバルなAIリソースの不均衡により、ルーティングプラットフォームが「中継ステーション」に
トークン流通事業は価格問題のみならず、リソースのミスマッチ解消にも寄与する。
海外のトップクラス大規模モデルは、地域によるアクセス制限・コンプライアンス規制・支払い手段のハードルなどの影響を受け、中国大陸の開発者を含む一部のユーザーに直接届かない場合がある。一方で、国産の優れた大規模モデルが海外へ進出する際にも、現地適応・チャネル構築・ユーザー獲得といった課題に直面する。
こうした不均衡は、クロスボーダーでのトークン流通・集約ルーティング・階層化流通の需要を生み出した。
OpenRouterはすでに典型的な事例である。同プラットフォームの処理トークン量は、2025年の週平均5~7兆トークンから、2026年4月には週平均20兆トークンを超えた。2026年の年間収入は5,000万米ドルを超え、2025年10月に公表された1,000万米ドル超の年間収入と比較して約5倍の成長を遂げている。
中国国内にも同様のプラットフォームが存在する。例えば「硅基流动(SiliconFlow)」は、ワンストップ型の大規模モデルクラウドサービスプラットフォームであり、独自開発の推論エンジンを活用して効率的な推論加速を実現するとともに、企業向けの大規模モデルサービスを提供している。2025年12月時点での登録ユーザー数は900万人を超え、企業ユーザーは1万人以上、公開中のモデル数は150以上に達している。
さらには米国の政治関連資本もこの分野に参入している。2026年5月5日、トランプ氏およびその一族と密接な関係を持つ暗号資産企業WLFIは、WorldClawと提携して「WorldRouter」を立ち上げた。これはClaude、GPT、Geminiなど300以上のモデルを統合し、USD1で決済可能で、公式公開料金より約30%低い価格設定となっている。
真の利益は、必ずしも「転売差益」にあるわけではない
トークン流通事業には、以下の3つの収益化手法がある。
第1に、転売による差益である。プラットフォームは上流のモデルメーカーからAPI利用枠をまとめて調達し、下流の顧客に対して加算価格で販売する。OpenRouterがサプライヤー原価に約5.5%のプレミアムを上乗せするという方式が、このモデルの代表例である。
第2に、技術付加価値による収益である。プラットフォームは自社開発の推論加速エンジンを活用して1トークンあたりの実行コストを削減し、販売価格を公式価格と同等またはそれ以下に抑えた上で、計算資源の効率性差によって粗利を得る。硅基流动のSiliconLLMおよびOneDiff技術は、言語モデルの推論速度を10倍、テキストから画像生成(文生図)の効率を3倍に向上させ、大規模モデルAPIの呼び出しコストを業界平均の10分の1水準まで引き下げている。
第3に、企業向けの追加価値サービスである。企業がAIを導入する際のコストはトークン単価だけではなく、プロンプトエンジニアリング、複数モデルの選定、業務システムとの統合、ワークフロー編成、運用・スケジューリング、従業員のAIスキル育成など、さまざまな隠れたコストを含む。トークン単価が低下すれば、これらの隠れたコストがむしろ収益化のポイントになりやすくなる。
硅基流动の企業向けMaaS(Model-as-a-Service)プラットフォームはまさにこの方向性を体現したものであり、企業ユーザーに対し、モデルの学習・最適化、デプロイ・推論、アプリケーション開発支援という3層の機能を提供。データ処理、モデルのファインチューニング、プロンプトエンジニアリング、RAG(Retrieval-Augmented Generation)などをカバーし、エネルギー・金融・政府などの業界向けに標準化されたAPI形式で提供している。
マーケティング、ショートドラマ、ゲーム、ECはトークン消費が活発なシーン
トークン流通事業が収益を上げるためには、最終的にリアルなユースケースに落とし込む必要がある。
生成AIアプリケーションは、医療・ヘルスケア、交通、工業製造などの分野へと浸透を進めるとともに、企業の意思決定支援や戦略経営などのコアプロセスにも参画し始めている。しかし、多くの企業はAI導入の基盤が未整備であり、データ資産の蓄積が不足し、計算資源への投資も限定的であるため、AI能力を自社で直接展開することは容易ではない。
これに対し、マーケティング・広告会社は既に顧客とユースケースを多数保有しており、ショートドラマ・マンガドラマ・ゲーム・ECなどの分野でトークン消費のニーズがより直接的かつ持続的である。こうした企業にとっての機会は、単にモデル能力を転売することではなく、トークンを顧客のコンテンツ生成・配信・素材制作・動画化などのプロセスに組み込むことにある。
投資の注目ポイントも以下の2つの軸で展開している:
1つ目は、優れたモデル能力を有する企業であり、Alibaba、Tencent Holdings、Kuaishou、Kunlun Tech、Zhipu、MiniMaxなどが該当する。
2つ目は、強力なトークン活用シーンおよび優れた顧客基盤を有する企業であり、特に海外顧客リソースとマーケティングシーンを有し、AIマーケティングおよびAI動画化分野に積極的に投資する企業が挙げられ、Yidian Tianxia(E-Point Global)、BlueFocus(ブルーフォーカス)などが該当する。
リスクも明確:参入障壁が低く、前払い資金が必要で、上流企業の判断が支配的
トークン流通事業のビジネスモデルは軽量だが、天然のモア(護城河)はそれほど深くない。
第1のリスクは業界内競争である。流通事業の技術的参入障壁は比較的低く、資金・顧客・チャネルの優位性を持つ大手代理店が参入すれば、迅速に同様のモデルを模倣し、利益空間を圧迫する可能性がある。
第2のリスクは前払い資金の負担と不良債権である。流通業者は下流顧客に対して通常月払いや四半期払いを採用するが、上流のモデルメーカーからAPI利用枠を調達する際には前払い資金を要する。トークン消費量が大きくなればなるほど、前払い資金の負担は重くなり、顧客からの支払い遅延が発生すれば、不良債権リスクも同時に拡大する。
第3のリスクは上流のモデルメーカーによるポリシー変更である。大規模モデルメーカーはAPI価格および接続ルールを握っており、価格改定や第三者への接続制限などのポリシー変更を実施する可能性がある。ミドルレイヤーにとっては、これが最もコントロールが難しい要素である。
TechFlow公式コミュニティへようこそ
Telegram購読グループ:https://t.me/TechFlowDaily
Twitter公式アカウント:https://x.com/TechFlowPost
Twitter英語アカウント:https://x.com/BlockFlow_News














