
ManusおよびMCPから始める:AIエージェントのWeb3横断的探求
TechFlow厳選深潮セレクト

ManusおよびMCPから始める:AIエージェントのWeb3横断的探求
AIエージェントは人工知能分野の重要な一分野として、次第に概念から現実へと移行しつつあり、さまざまな業界で大きな応用可能性を示している。もちろんWeb3業界も例外ではない。
執筆:pignard.eth、ZAN Team
3月6日、中国のスタートアップ企業Monicaがリリースした世界初の汎用AIエージェント製品「Manus」が、中国国内のテックメディアやSNSで話題となりました。公開初日に招待コードがネット上で入手困難となり、閑魚(アリババ傘下のフリマアプリ)では1つのコードが5万元(約100万円)で取引されるほどになりました。それでも業界のKOLの多くは事前にアクセス権を取得し、体験レポートや解説記事が相次いで登場しました。

Manusは、タスクの計画から実行までを一貫して自律的に完遂できる汎用AIエージェント製品であり、報告書作成や表計算の作成なども可能にします。単にアイデアを生成するだけでなく、独立して思考し、行動を起こすことが可能です。複雑なタスクを独自に分析・計画・実行し、完成された成果物を直接提供することで、前例のない汎用性と実行能力を示しています。
Manusの人気急上昇は業界全体の注目を集めただけでなく、さまざまなAIエージェント開発者にとって貴重な製品設計のインスピレーションと方向性を提供しました。AI技術の急速な進展に伴い、AIエージェントは人工知能分野における重要な一分野として、概念段階から現実へと着実に移行しつつあり、さまざまな産業に大きな応用可能性を示しています。もちろん、Web3業界にもその影響は及んでいます。
背景知識
AIエージェントとは、環境や入力、予め設定された目標に基づいて自ら判断を行い、タスクを実行するコンピュータプログラムのことです。AIエージェントの主な構成要素には以下のものがあります。まず大規模言語モデル(LLM)が「脳」としての役割を果たし、情報処理、対話からの学習、意思決定、行動実行を行います。次に、環境を感知するための観察・認識メカニズム、観測結果や記憶内容を分析し可能な行動を検討する推論プロセス、思考と観察に対する明示的な反応としての行動実行、そして過去の経験を保存して学習に活用する記憶と検索機能です。
AIエージェントの設計パターンはReActを出発点として、大きく2つの発展方向があります。1つは計画能力に重点を置くルートで、REWOO、Plan & Execute、LLM Compilerなどが含まれます。もう1つは反省(リフレクション)能力に注力するルートで、Basic Reflection、Reflexion、Self Discover、LATSなどが該当します。

このうちReActパターンは最も初期に登場したAIエージェント設計パターンであり、現在でも最も広く使われています。そのためここではReActの概念を中心に紹介します。ReActとは、言語モデル内の推論(Reasoning)と行動(Acting)を組み合わせることで、多様な言語的推論および意思決定タスクを解決する手法です。典型的なプロセスは下図のように、「思考(Thought)→ 行動(Action)→ 観察(Observation)」というサイクル、通称TAOサイクルで表されます。
-
思考:問題に直面した際、どのように問題を定義し、解決に必要な情報を特定し、推論のステップを整理するかを深く考えます。
-
行動:思考の方向性が定まれば、次に行動に移ります。その思考に基づき、適切な措置を講じたり、特定のタスクを実行したりして、問題解決に向けて前進します。
-
観察:行動の後には、その結果を注意深く観察します。このステップは、私たちの行動が有効だったか、答えに近づいたかを検証するものです。
-
繰り返しのイテレーション
AIエージェントはエージェントの数によってSingle Agent(単一エージェント)とMulti Agent(複数エージェント)に分けられます。Single Agentの核心はLLMとツールの連携であり、タスク遂行中にユーザーとのやり取りが複数回発生することがあります。一方、Multi Agentでは異なるエージェントに異なる役割を与え、協働することで複雑なタスクを達成しますが、その過程でユーザーとのインタラクションはSingle Agentよりも少なくなる傾向があります。現在の多くのフレームワークはSingle Agentのシナリオに焦点を当てています。

Model Context Protocol(MCP)は、Anthropic社が2024年11月25日に発表したオープンソースプロトコルで、LLMと外部データソース間の接続・相互作用の課題を解決することを目的としています。これを例えるなら、LLMをOSに、MCPをUSBインターフェースに見立てることができ、外部データやツールを柔軟に接続(プラグイン)でき、ユーザーはそれらのデータやツールを読み取り・利用できます。
MCPはLLMの拡張性を高めるために3つの機能を提供します。Resources(知識の拡張)、Tools(関数実行、外部システムの呼び出し)、Prompts(事前作成されたプロンプトテンプレート)。MCPプロトコルはClient-Serverアーキテクチャを採用しており、基盤となる通信にはJSON-RPCを使用しています。誰でもMCP Serverを開発・ホスティングでき、サービスの停止も自由に行えます。

Web3におけるAIエージェントの現状
Web3分野におけるAIエージェントへの注目は今年1月にピークを迎えた後、大きく後退しました。時価総額も90%以上縮小しています。現在、注目と市場規模が比較的大きいのは引き続き「AIエージェントフレームワーク」を軸にWeb3を探求するプロジェクト群です。具体的には、「Virtuals Protocolに代表される発行プラットフォーム型」「ElizaOSに代表されるDAO型」「Swarmsに代表される商用企業型」の3つです。
発行プラットフォームとは、ユーザーがAIエージェントを作成・展開・収益化できる仕組みを提供するもので、Memeコインにおけるpump.funのような存在です。Virtuals Protocolは現時点で最大の発行プラットフォームであり、同平台上で発行されたエージェントは10万を超えており、人気の「暗号資産界KOL」AIXBTもVirtuals上で作成されています。Virtuals Protocolはモジュラー型エージェントフレームワークG.A.M.Eを内包しており、その狙いは開発者がWordPressでサイトを構築するように、AIエージェントの開発と展開を効率的かつオープンに行えるようにすることです。

DAOとは分散型自律組織を指します。ElizaOS(旧称ai16z)は@shawmakesmagicによりdaos.fun上で設立され、当初はAIモデルを使って著名ベンチャーキャピタルa16zとその共同創設者Marc Andreessenの投資判断を模倣し、DAOメンバーの提案と組み合わせて投資を行うという理念でした。その後、Elizaフレームワークを中心としたAIエージェント開発者のためのDAOへと進化しました。ElizaフレームワークはTypeScriptで構築されており、AIエージェント開発に柔軟で拡張性のあるプラットフォームを提供します。これらのエージェントは複数のプラットフォーム間で連携しながら、一貫した人格と知識を維持できます。
Swarmsは2022年、当時20歳の@KyeGomezBが立ち上げたエンタープライズ向けマルチエージェントフレームワークです。Swarmsはスマートなオーケストレーションと高効率な協働を通じて、複数のAIエージェントがチームのように役割分担しながら、複雑なビジネス操作のニーズに対応します。当初SwarmsはWeb2のAIエージェントプロジェクトでしたが、創設者の話によると、すでに4500万以上のエージェントが本番環境で稼働しており、世界最大級の金融機関、保険会社、医療機関にサービスを提供しています。2024年12月にトークン$SWARMSを発行したことで、正式にWeb3へ参入しました。
経済モデルの観点から見ると、現時点では発行プラットフォームのみが自己完結型の経済循環を実現しています。Virtualsを例にすると:
-
エージェント作成:作成者はVirtuals平台上で新しいAIエージェントを起動します。
-
バウンディングカーブ設定:作成者は100 $VIRTUALトークンを支払い、新規エージェントのトークン用にバウンディングカーブを設定し、$VIRTUALとペアリングします。
-
流動性プール作成:バウンディングカーブの上限に達すると、エージェントは「卒業」し、エージェントトークンと$VIRTUALのペアで流動性プールが作成されます。内部関係者優遇なしのフェアローンチ原則を守り、プリマインや内部分配はなく、供給量は固定、流動性も長期間ロックされます。
VirtualsはAIエージェントの発行手数料に加え、エージェントトークンの取引ごとに手数料を徴収し、さらにAIエージェントがVirtualsのAPIを通じてLLMにアクセスする際には推論使用料も課金しています。現在、ElizaOSとSwarmsもそれぞれ独自の発行プラットフォーム構築を計画しています。
ただし、発行プラットフォームにも問題があります。このような資産発行モデルは、発行される資産自体に「魅力」があることが前提でなければ、好循環が成立しません。現時点での大多数の発行エージェントは本質的にMemeであり、内在価値を持たないため、市場の関心を失えば急速に価値がゼロに近づきます。現在の冷え込んだ市場環境では、そもそも発行プラットフォームに作成者を集めるのも難しく、経済モデル自体が機能していないのが実情です。
MCPのWeb3への応用
MCPの登場は、現在のWeb3におけるAIエージェントに新たな探求の方向をもたらしました。主に次の2つの方向が挙げられます。
-
MCP Serverをブロックチェーンネットワーク上に展開し、MCP Serverの単一障害点(single point of failure)を解決するとともに、検閲耐性を確保する。
-
MCP Serverがブロックチェーンと相互作用できるようにし、DeFi取引や資産管理などの機能を提供することで、技術的ハードルを下げること。
1つ目の方向は、基盤ブロックチェーンのストレージシステム、データ管理能力、非同期計算能力に対して非常に高い要求があり、0GのようなAI特化ブロックチェーンが候補となります。0Gはモジュラー型AIブロックチェーンであり、AI dappに適した拡張可能でプログラマブルなDA層を備えています。そのモジュラー技術により、チェーン間の摩擦のない相互運用性を実現しつつ、セキュリティを確保し、断片化を排除、接続性を最大化することで、分散型AIエコシステムを構築します。

2つ目の方向はDeFAIの亜種に似ていますが、現状のDeFAIバックエンドはすべて独自にラップしたFunction CallのTool群となっています。UnifAIは統一されたDeFAI MCP Serverを構築し、無駄な重複開発を回避します。UnifAIは自主的なAIエージェントがWeb3エコシステム内でオンチェーン・オフチェーンのタスクを実行できるプラットフォームです。タスク自動化のためのUniQ、エージェントサービス市場、ツール発見のためのインフラなどを備えています。

上記2つの方向以外にも、LXDAOおよびETHPandaの創設者である@brucexu_ethは、イーサリアム上にOpenMCP.Networkというクリエイター報酬ネットワークを構築する案を提唱しています。MCP Serverはホスティングと安定したサービス提供が必要ですが、ユーザーがLLMプロバイダーに支払った料金が、ネットワークを通じて実際に呼び出されたMCP Server運営者に還元されることで、ネットワーク全体の持続可能性と安定性が保たれます。これにより、MCPクリエイターは継続的に高品質なコンテンツを創作・提供するインセンティブを得ます。このネットワークでは、報酬の自動化・透明性・信頼性・検閲耐性を実現するためにスマートコントラクトを活用します。署名、権限検証、プライバシー保護などはイーサリアムウォレットやZK技術などで実装可能です。

理論的には、MCPとWeb3の融合はAIエージェントアプリケーションに分散型の信頼メカニズムと経済的インセンティブ層を注入できます。しかし、現時点のゼロ知識証明(ZKP)技術ではエージェントの行動真偽を検証することが難しく、また分散化ネットワークには効率性の問題も残っており、短期間で成功するとは言い難い状況です。
まとめ
Manusのリリースは、汎用AIエージェント製品における重要なマイルストーンを示しました。Web3の世界にも、外界からの「実用性がない、ただの投機だ」という批判を打ち破るような、象徴的なマイルストーン製品が必要です。
MCPの登場は、Web3におけるAIエージェントに新たな道筋を提示しました。MCP Serverをブロックチェーンネットワーク上に配置する方法、MCP Serverにブロックチェーンとの相互作用機能を持たせる方法、あるいはMCP Serverクリエイターをインセンティブ付与するネットワークを構築する方法などです。
AIは歴史上最大のストーリーであり、Web3にとってAIとの融合は避けられない必然です。私たちは依然として忍耐と信念を持ち続け、不断の探求を続けていく必要があります。
TechFlow公式コミュニティへようこそ
Telegram購読グループ:https://t.me/TechFlowDaily
Twitter公式アカウント:https://x.com/TechFlowPost
Twitter英語アカウント:https://x.com/BlockFlow_News












