
CZがなぜより優れたAI構築を目指すVanaを注目しているのか、一文で解説する。
TechFlow厳選深潮セレクト

CZがなぜより優れたAI構築を目指すVanaを注目しているのか、一文で解説する。
VanaがどのようにAIエコシステムの重要なインフラストラクチャとなったかを明らかにする。
著者:Biteye コア貢献者 Jesse
編集:Biteye コア貢献者 Crush
* 全文約6000字、予想読了時間12分
1か月前、YZi LabsはVanaへの投資を発表し、バイナンス創業者CZが顧問として参加することを明らかにした。これにより、VanaはAIデータ分野におけるリーダー的地位を確立した。それから4日後に行われたVanaとのAMAで、CZは「データこそがAIの核心的な燃料である」と述べ、公共データはすでに枯渇しており、一方でプライベートデータはまだ未開拓であると指摘。Vanaのプロダクトマーケットフィット(PMF)およびユーザー成長のポテンシャルに高い期待を示した。
なぜYZi LabsやCoinbase Ventures、Paradigmといった機関が次々とVanaに投資するのか?また、なぜCZはVanaの将来性を高く評価するのか?
本レポートでは、AIが直面するデータ上の課題、Vanaのコアバリュー、実際の応用シナリオ、そしてその将来の成長軌道について体系的に分析することで、VanaがいかにしてAIエコシステムのキーネットワークインフラとなり得るのかを明らかにする。

01 AIとデータのジレンマ:閉鎖的壁の突破
Pitchbookのデータによると、2025年第1四半期に米国のAI業界は近いところまでで200億ドル近くの投資を獲得した。2024年時点で、AIスタートアップは全世界のベンチャーキャピタル出資の3分の1を占め、累計で1315億ドルに達している。このうち、新興スタートアップの約4分の1がAI分野に特化している。Statistaのデータもまた、この爆発的成長を裏付けている――AI・機械学習分野へのVC出資金額は2011年の6.7億ドルから2020年には360億ドルへと増加し、50倍以上もの拡大を見せた。この現象は明確に、AIが賢い資本とトップクラスの起業家たちの共通選択肢となっていることを示している。
しかし、AIの根本構造——「データ+モデル+コンピューティングパワー」——は構造的ボトルネックに直面している。AIモデルの性能を左右する最大の要因は、計算資源の優位性でもアルゴリズムのブレイクスルーでもなく、むしろトレーニングデータセットの質と規模にある。現在、大規模言語モデル(LLM)は訓練データの枯渇という臨界点に達しつつある。MetaのLlama 3はおよそ15兆トークン規模のデータで学習されており、これは既に公開インターネット上での高品質データのほぼすべてを消費しつくしている状態だ。確かに公開インターネットのデータ量は膨大だが、それは氷山の一角にすぎない。多くの人々が見落としている重要な事実は、高価値データの大部分が認証アクセスが必要なプライベートシステム内に閉じ込められているということだ。公開インターネット上のデータは、全データ量の0.1%未満しか占めていない。この問題はAI業界単体では解決不可能であり、ブロックチェーン技術によってデータの生産関係を再構築し、新たなインセンティブメカニズムを構築することで、高品質データの大規模な創出を促進する必要がある。
他方、今日の大多数のデータはWeb2テック企業の閉鎖的エコシステムに掌握されている。AIの発展は「データウォール」の課題に直面しており、その壁が存在するのは、これらの企業がデータが持つ巨大な価値をよく理解しているからだ。高品質なAIモデルは極めて高い経済的リターンをもたらす。例えばOpenAIの年間収益はすでに約34億ドルに達している。優れたAIモデルを構築するには大量のデータが必要であり、その取得にはしばしば高額なコストがかかる。
たとえばRedditは毎年データ販売で約2億ドルの利益を得ており、PhotoBucketの画像データは1枚あたり1〜2ドルで販売されている。Appleのニュースデータ取引は5000万ドル規模に及ぶ。データの所有権は、単なるプライバシーの好みから重大な経済問題へと変化している。AIモデルが経済の大部分を駆動する世界において、データの所有権は未来のAIモデルに対する株式保有に等しい。
データの商業化がますます一般的になる中で、データへのアクセス難易度も同時に高まっている。多くのプラットフォームは、外部開発者のアクセス制限を目的として利用規約やAPIポリシーを改定している。たとえばRedditやStack Overflowは相次いでAPIルールを変更し、データ取得を困難にしている。この傾向は拡大しており、重要なデータを持つプラットフォームは徐々にクローズド化に向かっている。
しかし、依然としてこれらデータに自由にアクセスできる存在がいる。それはユーザー自身である。多くの人は気づいていないが、法的には彼ら自身のデータに対して完全な所有権を持っている。駐車場に車を停める場合、駐車場管理者が勝手にその車を処分できないように、ソーシャルメディアプラットフォーム上に保存されたデータも依然としてユーザー自身のものなのである。
ユーザーがアカウント登録時に「プラットフォームに私のデータを使用させることを許可する」という項目にチェックを入れることは、あくまでプラットフォームがサービス運営のためにデータを利用できるよう一定の権限を与える行為であり、データの所有権を放棄したわけではない。
実際、ユーザーはいつでも自分のデータをエクスポート申請できる。プラットフォームが開発者向けAPIに厳しい制限をかけていたとしても、個人ユーザーは依然として合法的に自分に属するデータを取得できる。たとえばInstagramでは、ユーザーが自身のアカウントデータをエクスポートできるようになっており、投稿した写真やコメントだけでなく、AIが生成したマーケティングタグさえも含まれている。23andMeでは、ユーザーは自分の遺伝子データのエクスポートを申請でき、プラットフォームがそれを積極的に案内しない場合や手続きが分かりにくい場合でも同様である。
世界的に見ても、ユーザーがデータを容易に回収できるようにするための関連法規が着実に整備されつつある。データ価値がますます顕在化する今日、ユーザーは個人データに対する所有権を十分に認識し、その権利を積極的に行使する必要がある。
02 VANAのコアコンセプト
テック企業は貴重なデータ資産を守るために閉鎖的システムを構築している。VANAのミッションは、こうした閉鎖的エコシステム内のデータを解放し、ユーザーのもとに返還することで、データ自律性を実現することにある。
言い換えれば、各ユーザーは異なるプラットフォームから自身のデータを抽出し、既存のどのプラットフォームよりも高品質でパーソナライズされたデータセットを再構築できるようになる。
VANAフレームワークは以下の2つの基本概念に基づいている:
-
ノンカストディアルデータ(Non-Custodial Data):これは、ユーザーが暗号資産をデジタルウォレットで管理するのと同じように、自身のデータに対するアクセス権を直接管理できるという意味である。VANAエコシステム内では、ユーザーはウォレットを通じてデータの使用方法を制御できる。取引に署名することで、ユーザーはアプリケーションにデータへのアクセスを許可し、その用途を決定できるため、データの自律性と安全性が確保される。
-
貢献の証明(Proof of Contribution):個々のデータポイントの価値は限定的だが、多数のユーザーのデータが集合すると、全体の価値は指数関数的に増大する。貢献の証明メカニズムは、データプールの高品質基準を維持しつつ、データ提供者に価値還元のチャンネルを提供することを目的として設計されている。
開発者がデータアクセス料を支払うとき、データ提供者はその貢献度に応じてガバナンストークンを受け取る。この仕組みにより、データ提供者はデータ活用から継続的に経済的リターンを得られるだけでなく、データ使用ルールの策定や意思決定に直接参加する実質的なガバナンス権も得られる。
高品質なデータ貢献をインセンティブ化するこのメカニズムは、データ市場の価格形成と運用効率を再構築し、分散型データ経済の基礎を築いている。
03 VANAのエコアプリケーション
3.1 DataDAO
DataDAOはVANAエコシステム内における分散型データ市場であり、ユーザーがデータを寄付・トークン化・活用できる場を提供する。ユーザーはデータの種類(フィットネスデータ、研究データなど)に応じて適切なデータマイニングプールを選択して貢献できる。寄付されたデータは、Vanaの「貢献の証明」メカニズムによって品質と価値が検証され、貢献者に公正な報酬が保証される。
検証済みのデータはデジタル資産としてトークン化され、取引やAIトレーニングに利用可能となるが、貢献者はその使用制御権を保持し続ける。データが使われるたびに、貢献者はトークン報酬とガバナンス権を得ることで、経済的利益を得るとともにデータプールの発展方向に影響を与えることができる。複数のデータ源を集約することで、DataDAOは流動性のあるデータ市場を創出し、Vanaエコシステム内でのデータの安全かつ効率的な流通を実現している。
DataDAOの中核は「データ流動性プール(DLP)」であり、これは検証済みデータと紐づけられたトークンから成るデータセットである。DLPはDataDAOメンバーによって管理され、ガバナンス権も保有している。各DLPは明確なデータ構造と貢献基準を定義しており、たとえばSleep.comは睡眠データDAOとして明確なデータスキーマを構築し、すべてのオンチェーンデータが構造化され利用可能であることを保証している。データの価値は規模だけでなく、構造と可用性にも大きく依存している。
DataDAOはデータの真正性と有効性を非常に重視している。現在の大多数のDataDAOは、信頼できる実行環境(TEE)上でPythonコードを実行してデータを検証し、プライバシーを保護しながら品質を保証している。たとえばAmazon DataDAOはブラウザ拡張機能を利用してデータ品質の証明を生成している。すべてのDataDAOは自らの「貢献の証明」を公開しており、ユーザーはデータ品質の保証レベルを明確に把握できる。
VANAエコ内で上位16位までのDLPには追加のインセンティブが与えられており、ユーザーは高品質なデータを提供することで収益を得られる。報酬はデータアクセス量、品質、コスト削減などの指標に基づいて分配される。現在、Reddit DataDAOが最も規模が大きく、約14万人のユーザーを集め、ユーザー共有のAIモデルのトレーニングに成功している。DLPLabsが立ち上げたDataDAOでは、運転手がDIMO_Networkアカウントを接続し、データを共有することで自動車関連のAIイノベーション推進に貢献し、報酬を得ることができる。23andWEは23andMeの買収を目指しており、遺伝子データが不正に販売されるのを防ぐことを目的としている。
DataDAOは、個人ユーザーが自身のデータを管理し、トークン化を通じて収益を得るまったく新しいデータ管理方式を代表している。このエコシステムは急速に発展しており、データガバナンスおよびAIトレーニングにおいて、よりオープンで民主的な可能性を切り開いている。
3.2 DataFi
データ流動性プールの基盤の上に、DeFiが徐々にデータトークン領域へと適用され始めている。データ流動性プールはエコシステムの基礎層に相当し、その上にデータトークンを基盤としたさまざまなDeFiアプリケーションが構築可能となる。
現在、データDeFiエコシステム内にはすでに初期段階のアプリケーションがいくつか登場している。たとえば、分散型取引所@VanaDataDexや@flur_protocolでは、ユーザーがデータトークンを交換したり、特定のデータトークンの市場動向を追跡したりできる。これらのプラットフォームの出現により、データ資産の自由な流通が促進され、データ市場がさらに活性化している。
注目すべき点は、現時点での多くのDLP報酬メカニズムが、報酬をDLP財務庫に積み立てる形に留まっており、データトークンの燃焼や需給調整を行っていないことだ。しかし、VRC-13アップデートの導入により、この仕組みに変化が訪れている。新しいモデルでは、より市場志向のアプローチが採用され、VANA報酬を通じてデータのトークン化を促進し、その後DEXプールに注入することでデータトークンの取引を活性化し、DeFiエコシステム全体を刺激する。
今後、DeFi分野で実現可能な機能——貸出、ステーキング、流動性マイニング、さらには保険に至るまで——がデータトークン市場に導入され、まったく新しい応用シナリオが生まれることが予想される。
従来のWeb2産業の観点からは、石油先物を購入して価格変動リスクを回避する企業のように、データ市場ではデータ先物が発展し、ユーザーが将来のデータセット価格を事前に固定することで、取得コストの不確実性を低減できる可能性がある。
一部の取引会社はすでにデータを新たな資産クラスとして位置づけ、市場価値の評価方法を研究している。特定のデータトークンの価値評価、使用販売の可能性、ライフサイクルなどは、データトークンの価格と市場流動性に直接影響を与え、ここには依然として大きなイノベーションの余地がある。
3.3 より簡便なデータアクセス
現時点ではメインネット上でのデータセットアクセスは依然として煩雑である。ユーザーは目的、支払い金額、計画コードなどを詳細に記載したリクエストを提出し、承認を得た後にのみアクセス権を取得できる。透明性と規範性は保たれるが、操作の摩擦が大きくなる。
効率性向上のため、Vanaはより高速なデータアクセス方法を開発中であり、自動APIアクセスを通じて複数のDataDAOから直接データを取得可能にする。たとえば将来的には、睡眠データとCoinbaseまたはBinanceの取引データを統合し、特定プロジェクト保有者の睡眠状況を分析することで、新たな市場インサイトを発見できるようになる。
さらに、Vanaはデータアクセス権を獲得するために、データトークンとVANAを80対20の比率でバーンするという新たな提案を進めている。
Vanaはまた、データアクセスプロセスを大幅に簡素化する新しいデータ照会インターフェースを開発している。ユーザーはウォレットでログインして本人確認を行い、デジタル署名を生成することでアクセス権を証明できる。データ流動性プールがデータ形式を記録しているため、ユーザーはデータ構造を明確に把握し、SQLクエリを使って必要な情報を取得できる。この過程で、ユーザーは最初に一部の合成データをテスト用に受け取り、クエリの正確性を確認できる。実データに関わる場合は、すべての計算処理がTEE内で行われ、データの安全性が確保される。この仕組みは「データの二重利用問題」(つまり、ユーザーがデータを購入後に無断で再販すること)を効果的に防止し、データの経済的価値を保護し、データ市場の持続可能な発展を支える。
04 Vanaの価値分析
データは急速にデジタル時代のコア資産になりつつある。データの収集・保存技術はすでに十分成熟しているが、真の課題は、データの品質を適切に評価し、価値を最大化しつつ、プライバシーと安全を両立させることにある。Vanaは革新的なインセンティブメカニズムによってこの難題を巧みに解決している。ユーザーはVanaトークンをステーキングすることで高価値のDataDAOを支援でき、それに応じた報酬を得るという好循環が生まれる。
4.1 「データウォール」の制約を突破
AIの発展は「データウォール」に到達している——高品質な公開データリソースは枯渇しつつある。将来のAIのブレークスルーは、個人の健康記録、スマートデバイスの使用データ、テスラの走行映像といった潜在的なトレーニングリソースとしての高品質プライベートデータをいかに効果的に取得・活用するかにかかっている。
データ価値には逆説がある。データは秘匿性があるからこそ価値を持ち、広く入手可能になると商品化され価値が下がってしまう。AIモデルが現在商品化の過程にあるように、長期的な競争優位性は特定分野で卓越した性能を発揮するユニークなデータセットの掌握から生まれる。データが一度公開されれば、価格競争が即座に始まり、価値は急速に低下する。
VanaのDataDAOはTEEを活用することで、高品質なプライベートデータの価値移転を実現しつつ、情報のプライバシーも守っている。このブレークスルーにより、価値あるデータ資産の範囲が限られた公開データから、はるかに広いプライベートデータ領域へと拡大され、AI発展に新たな可能性が開かれた。
4.2 データ価値のユニークな曲線
データ価値には特殊な曲線的特性がある:単一のデータポイントの価値はほとんど無視できるが、データ量が臨界質量に達すると、その価値は指数関数的に増加する。この特性ゆえに、データの金融化は大きな課題に直面する——つまり、集団的なデータが形成されて初めて、各参加者に有意なリターンがもたらされるのである。
VanaのDataDAOメカニズムは、このジレンマを解決する革新的な道筋を提供している。同種データを束ねることで、DataDAOは貢献者に集団的な交渉力(collective bargaining power)を与える。たとえばテスラの所有者が全員でDataDAOを通じて走行データを集中収集・共有すれば、どの需要側に対しても強力な価格設定権を持つことができる。一方、各所有者が個別にデータを販売し有料化しようとすれば、価格競争が避けられず、買い手は最低価格を受け入れる少数の販売者から十分なサンプルを取得するだけで済んでしまう。
構造化され検証済みの高品質データセット(例:検証済みのテスラ走行データ)は市場で極めて高い価値を持つ。Vanaが提供する組織的枠組みによって、この価値が十分に実現される。
4.3 跨プラットフォームデータ統合のブレークスルー
DataDAOの最大の強みは、今日の閉鎖的エコシステムではほぼ不可能な、跨プラットフォームのデータ統合を実現できる点にある。研究者が同一ユーザーのFacebookメッセージ、iMessage記録、Googleドキュメント内容にアクセスしたい場合、従来の方法ではFacebook、Apple、Googleのすべてが協力してデータを共有する必要がある。しかし、これらのプラットフォームにはユーザーのデータを統合するインセンティブがない(これはデータの壁を弱体化させる可能性があるため)、また規制上の障壁もあり、実現は困難である。
DataDAOはユーザー主導のデータ統合モデルによって、この障害を巧妙に回避し、跨プラットフォームデータの価値を解放することで、AIトレーニングや研究に前例のない可能性をもたらしている。
4.4 新たな経済参加モデル
Vanaのビジョンは純粋な技術革新を超えており、全く新しい経済参加モデルを創造しようとしている。このモデルでは、ユーザーは従来の資本を持たなくてもデジタル経済に参加できる。彼らはすでに最も貴重な資源——個人データ——を持っているからだ。ユーザーは資金を持ち込む必要はなく、データを共有するだけでよい。これがユーザーの資本なのである。DataDAOはWeb3ユーザーに、個人のユニークなデータに基づく受動的収入の手段を提供し、デジタル経済への参入障壁を下げている。
4.5 AI収益分配の再構築
このモデルは、AI進歩の収益分配構造を根本から再構築する可能性を秘めている。価値がもはや大手テック企業に集中するのではなく、Vanaはデータ所有権とガバナンスメカニズムを通じて、幅広い人々がAI経済に参加できるようにする。初期の兆候として、テストネット上にはすでに300以上のDataDAOが開発中であり、強い共鳴を呼び起こしていることが示されている。
将来3〜5年を見据えると、1億人のユーザーがデータを貢献する完全にユーザー自治型のAIモデルが誕生するかもしれない。その性能は、現在の最先端の中央集権型AIモデルを上回る可能性すらある。このようなモデルは完全にユーザーが所有しており、ユーザーの関与感が強く、ユーザーとの結びつきもより深くなるだろう。データ主権により、ユーザーは倫理にかなったモデルを意図的に支援し、非倫理的企業によるデータ利用を拒否できる。
分散型AIは、少数企業が主導するのではなく、社会全体でAIが何を学び、何を信じるべきかを共同で決定する、より民主的な枠組みを提供する。ユーザーのデータ所有権は経済的権益だけでなく、AIモデルの行動に対する実質的な統制権——たとえばモデルの発言検閲といった重要な問題への対処能力——も含んでいる。
05 まとめ
ビジネス面において、Vanaはデータの集約からAIモデルのトレーニング、データ販売までをカバーする完全なデータ価値チェーンの構築を目指している。現在のデータ市場は少数のプラットフォームとデータブローカーに独占されており、Vanaはこの市場の非効率性を解決し、より公正なデータ取引エコシステムを創出しようとしている。
Vanaは単なる新しいプラットフォームではない——それはデータ所有権とAI発展のあり方そのものの根本的転換を象徴している。集団的な価値創造に参加しつつもデータの主権を保持できるようにすることで、Vanaはより公正で革新的なAIの未来を築きつつある。
現在のAI市場は概念的な過熱が目立つが、Vanaは業界の核心的課題に真正面から取り組む革新的な仕組みによって、AIの将来の発展を形作るキープレーヤーとなる可能性を秘めている。
TechFlow公式コミュニティへようこそ
Telegram購読グループ:https://t.me/TechFlowDaily
Twitter公式アカウント:https://x.com/TechFlowPost
Twitter英語アカウント:https://x.com/BlockFlow_News














