エージェント時代：AIとCryptoの対立と共生

2024.11.27

共有先

TechFlow厳選深潮セレクト

エージェント時代：AIとCryptoの対立と共生

将来、エージェントは全く新しい形態で非中央集権的な力と連携し、デジタル世界を形成していく。

2024.11.27 - 10:29:49

AICrypto

Web3業界の深掘り報道に専念し潮流を洞察

将来、エージェントは全く新しい形態で非中央集権的な力と連携し、デジタル世界を形成していく。

執筆：Zeke、YBB Capitalリサーチャー

一、注目力の新鮮さ志向から始まる物語

過去一年間、アプリケーション層のストーリーが途絶え、インフラの爆発的発展に追いつかなかったため、暗号分野は次第に「注目力資源」を巡るゲームへと変貌していった。Silly DragonからGoat、Pump.funからClankerまで、注目力に対する飽きっぽさがこの争いをますます内面化させている。最も陳腐な「視線を引いて収益化する」モデルから始まり、やがて注目力を求める者と供給する者が一致するプラットフォーム型へと急速に進化し、さらにシリコンベースの生命体が新たなコンテンツ供給者として登場した。Memeコインという千差万別の媒体の中でも、ついに個人投資家とVCが共通認識を持てる存在が現れた――それがAIエージェントである。

注目力は最終的にゼロサムゲームだが、投機は確かに物事の野生的な成長を促すことができる。我々はUNIに関する記事の中で、ブロックチェーンの前回の黄金時代の幕開けについて振り返ったことがある。DeFiが急成長したきっかけはCompound Financeが始めたLPマイニング時代にさかのぼる。当時、APYが数千％、あるいは数万％にも達する様々なマイニングプールを行き来することが、チェーン上での最も原始的なゲームだった。最終的には多くのプールが崩壊し、散乱した状態となったが、それでも大量のゴールドラッシュがブロックチェーンに前例のない流動性を残した。その結果、DeFiは純粋な投機を超えて成熟した分野となり、支払い、取引、裁定、ステーキングなど、さまざまな側面でユーザーの金融ニーズを満たすようになった。現在のAIエージェントもまさにこのような野生的段階にある。我々が探求しているのは、CryptoがどのようにAIとより良く融合できるかであり、最終的にアプリケーション層が新たな高みに到達することである。

二、エージェントはどうやって自律するのか

前回の記事では、AI Memeの起源である「Truth Terminal」とAIエージェントの将来像について簡単に紹介した。本稿ではまず、AIエージェントそのものに焦点を当てる。

まずAIエージェントの定義から始めよう。AI分野において「Agent（エージェント）」は比較的古いが明確に定義されていない用語であり、主にAutonomous（自律性）を強調している。つまり、環境を感知し、それに対して反応を行うあらゆるAIをエージェントと呼ぶことができる。現代の定義では、AIエージェントは「大規模言語モデル（LLM）に人間の意思決定プロセスを模倣させるシステム」に近づいている。学術界では、このシステムこそがAGI（汎用人工知能）への最も有望な道と考えられている。

初期のGPTバージョンでは、大規模モデルが人間に似ていることは明らかだったが、複雑な質問に対しては曖昧で的外れな回答しかできなかった。その本質的な理由は、当時のモデルが因果関係ではなく確率に基づいていたこと、そしてツールの使用、記憶、計画立案といった人間が持つ能力を欠いていたためである。AIエージェントはこれらの欠陥を補完できる。つまり、AIエージェントとは＝LLM（大規模言語モデル）＋Planning（計画）＋Memory（記憶）＋Tools（ツール）という式で表される。

プロンプト（Prompt）に依存する大規模モデルは、入力があるときだけ動き出す静的な人間のような存在である。一方、エージェントの目標は、もっとリアルで自律的な人間を再現することだ。現在の業界におけるエージェントの多くは、Metaがオープンソース化したLlama 70bまたは405b（パラメータ数が異なる）をベースに微調整されたモデルであり、記憶機能やAPIを通じて外部ツールを利用する能力を持っている。しかし他の点では依然として人間の助けや入力が必要であり（他のエージェントとの協働も含む）、そのため現在の主要なエージェントはKOL（意見リーダー）のような形でソーシャルネットワーク上に存在している。エージェントをより人間に近づけるには、計画と行動能力を統合する必要があり、特にその中でも「思考の連鎖（Chain of Thought）」が極めて重要となる。

三、思考の連鎖（Chain of Thought, CoT）

思考の連鎖（Chain of Thought, CoT）という概念は、2022年にGoogleが発表した論文『Chain-of-Thought Prompting Elicits Reasoning in Large Language Models』で初めて登場した。この論文では、複数の推論ステップを生成することでモデルの推論能力を強化し、複雑な問題をより深く理解・解決できるようにすると指摘している。

典型的なCoTプロンプトは3つの要素から構成される。（1）明確なタスク指示、（2）タスク解決の理論的根拠や原理、（3）具体的な解決例。このような構造化されたアプローチにより、モデルはタスクの要求を理解しやすくなり、論理的推論を通じて段階的に正解へと近づくことで、問題解決の効率と正確性が向上する。CoTは数学的問題の解決やプロジェクトレポート作成など、深い分析と多段階の推論を要するタスクに特に適している。一方、単純なタスクでは顕著な利点はないが、複雑なタスクではモデルのパフォーマンスを大幅に向上させ、段階的な解決戦略によって誤りを減らし、タスク完了の品質を高めることができる。

AIエージェントの構築において、CoTは極めて重要な役割を果たす。エージェントは受け取った情報を理解し、それに基づいて合理的な判断を下す必要がある。CoTは順序立てられた思考プロセスを提供することで、エージェントが入力情報を効果的に処理・分析し、その結果を具体的な行動指針に変換するのを助ける。この方法は、エージェントの判断の信頼性と効率を高めるだけでなく、判断プロセスの透明性も向上させ、その行動をより予測可能かつ追跡可能にする。CoTはタスクを複数の小さなステップに分解することで、各意思決定ポイントを細かく検討し、情報過負荷による誤判断を防ぐ。また、CoTによりエージェントの意思決定過程が透明になり、ユーザーはその判断根拠をより容易に理解できるようになる。環境との相互作用の中で、CoTはエージェントが新しい情報を継続的に学び、行動戦略を調整することを可能にする。

CoTは有効な戦略として、大規模言語モデルの推論能力を高めるだけでなく、より知的で信頼性の高いAIエージェントの構築においても重要な役割を果たしている。CoTを利用することで、研究者や開発者はより複雑な環境に適応し、高度な自律性を持つスマートシステムを創出できる。実際の応用場面でも、CoTは特有の優位性を示しており、特に複雑なタスクにおいて、タスクを一連の小ステップに分解することで、解決の正確性を高めるとともに、モデルの説明可能性と制御性を強化している。このような段階的アプローチは、複雑なタスクに直面した際に、情報量の多さや複雑さによる誤判断を大きく低減する。同時に、この方法は全体の解決策の追跡性と検証性も高める。

CoTの核心機能は、「計画」「行動」「観察」を相互に結びつけ、推論と行動のギャップを埋めることにある。この思考パターンにより、AIエージェントは予想される異常事態に対して効果的な対策を立てることができ、外部環境とのインタラクションを通じて新たな情報を蓄積し、事前に設定した予測を検証しながら、新たな推論根拠を提供できる。CoTは、強力な精度と安定性のエンジンのように、AIエージェントが複雑な環境でも高い効率を維持するのを支援する。

四、正しい偽需要

CryptoはAI技術スタックのどの部分と結合すべきなのか？昨年の記事では、計算能力とデータの非中央集権化が中小企業や個人開発者のコスト削減にとって鍵になると述べた。今年、Coinbaseが整理した「Crypto x AI」の細分化セグメントでは、より詳細な分類が示されている。

（1）計算層（AI開発者にGPUリソースを提供するネットワーク）
（2）データ層（AIデータパイプラインの非中央集権的アクセス、オーケストレーション、検証を支援するネットワーク）
（3）ミドルウェア層（AIモデルやエージェントの開発、展開、ホスティングを支援するプラットフォームやネットワーク）
（4）アプリケーション層（B2BまたはB2Cを問わず、オンチェーンのAIメカニズムを利用したエンドユーザー向け製品）

この4つのレイヤーそれぞれに壮大なビジョンが込められており、総じて言えば次の時代におけるシリコンバレーの巨大企業によるインターネット支配に対抗することを目指している。昨年私が述べた通り、本当に我々はシリコンバレーの企業が計算資源とデータを独占することを受け入れるべきなのだろうか？彼らが独占するクローズドソースの大規模モデルは内部がブラックボックスであり、科学は現代人類が最も信仰する宗教であるが、未来において大規模モデルが発するすべての言葉が多くの人々にとって「真実」と見なされるかもしれない。だが、その「真実」をどう検証すればよいのだろうか？シリコンバレー企業の構想によれば、エージェントは最終的に想像を絶する権限を持つことになる。例えば、あなたのウォレットの支払い権や端末の使用権など。だが、人間に悪意がないことをどう保証できるだろうか？

非中央集権化が唯一の答えだとするが、そのような壮大なビジョンを誰が支払うのか、現実的に考える必要がある。かつては商業的循環を考慮せず、トークンによって理想と現実のズレを補っていた。しかし今の情勢は非常に厳しい。Crypto x AIは現実状況を踏まえて設計しなければならない。例えば、性能低下と不安定性を抱える計算層が、中央集権クラウドと競争できるように両端のバランスをどう取るのか？データ層のプロジェクトにはどれほどの実ユーザーがいるのか？提供されるデータの真実性と有効性はどのように検証できるのか？また、どのような顧客がそのデータを必要とするのか？他の二つの層も同様である。この時代に、見た目は正しくても実際には不要な「偽需要」はもう必要ない。

五、MemeがSocialFiを生み出した

冒頭で述べたように、Memeは超高速でWeb3に合致したSocialFiの形態を切り拓いてきた。Friend.techは今回のソーシャルアプリブームの先駆けとなったDappだが、焦って設計されたトークン構造が災いして失敗した。一方、Pump.funは完全にプラットフォーム化されたモデルの実現可能性を証明した。トークンを発行せず、特別なルールも設けず、注目力を求める者と供給する者が同一となる。ユーザーはプラットフォーム上でミームを作成し、ライブ配信を行い、コインを発行し、コメントを書き、取引ができる。すべてが自由であり、Pump.funはサービス料のみを徴収する。これはYouTubeやInstagramなどのソーシャルメディアの注目力経済モデルと基本的に同じであるが、収益化の対象が異なり、遊び方としてはよりWeb3的だ。

BaseのClankerはこれらを集大成した存在である。エコシステム自らが手掛ける統合型エコシステムのおかげで、Baseは独自のソーシャルDappを補助として持ち、完全な内部サイクルを形成している。スマートエージェントMemeはMemeコインの2.0形態であり、人は常に新しさを求めている。そして今、Pump.funはちょうど注目の的となっている。トレンドから見れば、炭素ベースの生物による低俗なジョークが、やがてシリコンベースの生物による奇想天外な発想に取って代わられるのは時間の問題だ。

私は何度もBaseに言及してきたが、その都度内容は異なる。時間軸で見れば、Baseは決して最初に走り出すわけではないが、いつも最後には勝者となっている。

六、エージェントは他に何になれるのか？

現実的な視点から言えば、エージェントが非中央集権化されるのは、まだ長い間不可能だろう。従来のAI分野におけるエージェントの構築方法を考えれば、単に推論プロセスを非中央集権化し、オープンソース化すれば解決する問題ではない。エージェントはさまざまなAPIを通じてWeb2のコンテンツにアクセスする必要があり、運用コストも非常に高い。思考の連鎖の設計や複数エージェントの協働も、通常は人間を媒介として行われる。我々は長い移行期間を経ることになるだろう。適切な融合形態が現れるまで、おそらくUNIのように。だが、前回の記事と同じく、私は依然としてエージェントが業界に大きな衝撃を与えると考えている。それは私たちの業界におけるCEX（中央集権取引所）のように、「正しくはないが、重要」なのである。

先月、スタンフォード大学とマイクロソフトが発表した『AI Agent Survey』という論文では、医療、スマートマシン、仮想世界におけるエージェントの応用が多数紹介されている。付録には、すでにGPT-4VがエージェントとしてトップクラスのAAAゲーム開発に参加する実験事例が数多く掲載されている。

非中央集権化との融合スピードをあまり急ぐ必要はない。むしろ、エージェントがまず補うべきは「下から上へ」の能力とスピードだ。我々には未利用のストーリーの廃墟や空白のメタバースがたくさんあり、それを埋めるためにエージェントが必要とされている。適切な段階になれば、次なるUNIとしての役割を考えればよい。

TechFlow公式コミュニティへようこそ

Telegram購読グループ：https://t.me/TechFlowDaily

Twitter公式アカウント：https://x.com/TechFlowPost

Twitter英語アカウント：https://x.com/BlockFlow_News

お気に入りに追加

SNSで共有

作者

YBB Capital

@YBBCapital