AIフレームワークの解体：インテリジェントエージェントから分散化への探求

2025.01.08

共有先

TechFlow厳選深潮セレクト

AIフレームワークの解体：インテリジェントエージェントから分散化への探求

簡易なエージェント構築プロセスを提供し、いくつかの複雑な機能を組み合わせるフレームワークは、今後も優位性を保ち続け、GPT Storeよりも興味深いWeb3クリエイティブ経済を形成していくだろう。

2025.01.08 - 11:09:19

Web3業界の深掘り報道に専念し潮流を洞察

著者: YBB Capital リサーチャー Zeke

序文

以前の記事では、AI Memeの現状およびAIエージェント（Agent）の将来について何度も考察してきました。しかし、AI Agent分野におけるストーリーテリングの進展スピードとその急激な変化は、やや目が追いつかないほどです。「トゥルースターミナル」がエージェントサマーを開始してからわずか2か月間で、AIとCryptoを融合させるナラティブはほぼ毎週新たな展開を見せています。最近では、市場の注目が再び技術主導の「フレームワーク系」プロジェクトに集中しつつあります。この細分化されたトラックでは、ここ数週間のうちにすでに複数の時価総額が1億ドル、あるいは10億ドルを超える黒馬が登場しています。また、このようなプロジェクトは新たな資産発行モデルも生み出しており、プロジェクトがGithubのコードベースを通じてトークンを発行し、そのフレームワーク上で構築されたエージェント自体も再度トークンを発行できるようになっています。すなわち、「フレームワークを基盤とし、エージェントを上層に置く」という構造です。一見すると資産発行プラットフォームのように見えますが、実際にはAI時代ならではのインフラ構造が浮上しつつあるのです。我々はこうした新しいトレンドをどのように捉えるべきでしょうか？本稿では、まずフレームワークの概要から始め、独自の考察を交えながら、AIフレームワークがCryptoにとってどのような意味を持つのかを解説します。

一、フレームワークとは何か？

定義上、AIフレームワークとは、複雑なAIモデルの構築プロセスを簡素化するための基本的な開発ツールまたはプラットフォームであり、事前に構築されたモジュール、ライブラリ、ツールセットを統合しています。これらのフレームワークには、通常、データ処理、モデル学習、予測実行の機能も含まれます。簡単に言えば、AI時代のオペレーティングシステム（OS）と考えることもでき、デスクトップOSにおけるWindowsやLinux、モバイル端末におけるiOSやAndroidのような存在です。各フレームワークにはそれぞれ長所と短所があり、開発者は具体的なニーズに応じて自由に選択できます。

「AIフレームワーク」という言葉はCrypto分野ではまだ新興概念ですが、その起源をたどれば2010年に登場したTheanoまでさかのぼることができ、AIフレームワークの歴史は既に約14年近くになります。従来のAI業界、学術界・産業界問わず、すでに非常に成熟したフレームワークが多数存在しています。例えば、GoogleのTensorFlow、MetaのPyTorch、BaiduのPaddlePaddle、ByteDanceのMagicAnimateなどがあり、それぞれ異なるシナリオに対して優位性を持っています。

現在Crypto領域で登場しているフレームワークプロジェクトは、このAIブームの初期段階において大量のエージェント需要を背景に開発され、その後Cryptoの他のトラックへと派生し、最終的にさまざまな細分化領域におけるAIフレームワークを形成しました。以下では、現在の業界内で主流となっているいくつかのフレームワークを例に挙げて、この点をさらに展開します。

1.1 Eliza

まず、a16zのElizaを例に取り上げます。このフレームワークはTypeScriptを用いて開発されたマルチエージェントシミュレーションフレームワークであり、自律型AIエージェントの作成、展開、管理に特化しています。プログラミング言語としてTypeScriptを採用しているため、互換性が高く、APIとの統合も容易です。

公式ドキュメントによると、Elizaの主な対象シーンはソーシャルメディアであり、多プラットフォームの統合サポートを提供しています。完全なDiscord統合（音声チャンネル対応）、X/Twitterアカウントの自動化、Telegramとの連携、直接APIアクセスなどが可能です。メディアコンテンツの処理面でも、PDFの読み取り・分析、リンク内容の抽出と要約、音声文字起こし、動画コンテンツ処理、画像分析と説明生成、会話要約などをサポートしています。

Elizaが現在サポートしているユースケースは主に以下の4種類です：

1. AIアシスタント系アプリケーション：カスタマーサポートエージェント、コミュニティ管理者、パーソナルアシスタント；

2. ソーシャルメディアロール：自動コンテンツクリエイター、インタラクションロボット、ブランド代表；

3. 知的労働者：リサーチアシスタント、コンテンツアナリスト、ドキュメントプロセッサー；

4. インタラクティブロール：ロールプレイキャラクター、教育コーチ、エンタメロボット。

Elizaが現在サポートしているモデル：

1. オープンソースモデルによるローカル推論：Llama3、Qwen1.5、BERTなど；

2. OpenAIのAPIを利用したクラウド推論；

3. デフォルト設定：Nous Hermes Llama 3.1B；

4. Claudeとの統合により複雑なクエリに対応。

1.2 G.A.M.E

G.A.M.E（Generative Autonomous Multimodal Entities Framework）はVirtual社が開発した、自己生成・管理可能なマルチモーダルAIフレームワークであり、主な対象はゲーム内のスマートNPC設計です。このフレームワークの特徴の一つは、低コードまたはノーコードのユーザーでも利用可能である点です。試用インターフェースを見る限り、ユーザーはパラメータを調整するだけでエージェントの設計に参加できます。

プロジェクトアーキテクチャにおいて、G.A.M.Eの核心設計は複数のサブシステムが協調動作するモジュラー構造であり、詳細なアーキテクチャは以下の図の通りです。

1. Agent Prompting Interface：開発者がAIフレームワークとやり取りするインターフェース。このインターフェースを通じて、開発者はセッションを初期化し、セッションID、エージェントID、ユーザーIDなどのパラメータを指定できます；

2. Perception Subsystem：入力情報を受信し、合成した後戦略的計画エンジンに送信します。また、対話処理モジュールの応答も処理します；

3. Strategic Planning Engine：フレームワークの中心部分であり、ハイレベルプランナー（長期目標と計画の策定）とローレベルポリシー（具体的行動への変換）に分かれています；

4. World Context：環境情報、ワールドステータス、ゲームステータスなどのデータを含み、エージェントが現在の状況を理解するのに役立ちます；

5. Dialogue Processing Module：メッセージと応答を処理し、対話または反応を出力として生成します；

6. On Chain Wallet Operator：チェーン上のウォレット操作に関連する可能性があるが、具体的な機能は不明；

7. Learning Module：フィードバックから学習し、エージェントの知識ベースを更新します；

8. Working Memory：エージェントの直近の行動、結果、現在の計画などの短期情報を保存します；

9. Long Term Memory Processor：エージェントおよびその作業記憶に関する重要な情報を抽出し、重要度、最近性、関連性に基づいて順位付けします；

10. Agent Repository：エージェントの目的、反射、経験、個性などの属性を保存します；

11. Action Planner：ローレベルポリシーに基づき、具体的な行動計画を生成します；

12. Plan Executor：アクションプランナーが生成した計画を実行します。

動作フロー：開発者はエージェント提示インターフェースを通じてエージェントを起動し、知覚サブシステムが入力を受信して戦略的計画エンジンに渡します。戦略的計画エンジンは、記憶システム、ワールドコンテキスト、エージェントリポジトリの情報を活用して計画を策定・実行します。学習モジュールはエージェントの行動結果を継続的に監視し、結果に基づいて行動を調整します。

適用シーン：技術アーキテクチャ全体から見ると、このフレームワークは仮想環境におけるエージェントの意思決定、フィードバック、知覚、個性に重点を置いており、ゲーム以外にもメタバースへの適用が可能です。Virtualの公式リストを見ると、すでに多くのプロジェクトがこのフレームワークを採用して構築されています。

1.3 Rig

RigはRust言語で書かれたオープンソースツールであり、大規模言語モデル（LLM）アプリケーションの開発を簡素化するために設計されています。複数のLLMプロバイダー（OpenAIやAnthropicなど）およびさまざまなベクトルデータベース（MongoDB、Neo4jなど）とのやり取りを、統一された操作インターフェースを通じて容易に実現します。

主な特徴：

● 統一インターフェース：どのLLMプロバイダーやベクトルストレージであっても、Rigは一貫したアクセス方法を提供し、統合作業の複雑さを大幅に削減します；

● モジュラー構造：内部は「プロバイダーアブストラクション層」「ベクトルストレージインターフェース」「スマートエージェントシステム」などの主要コンポーネントからなるモジュラー設計で、柔軟性と拡張性を確保しています；

● 型安全性：Rustの特性を活かし、埋め込み操作における型安全性を実現し、コード品質とランタイムの安全性を保証します；

● 高性能：非同期プログラミングをサポートし、並列処理能力を最適化。組み込みのログ記録と監視機能により、メンテナンスと障害対応が容易です。

動作フロー：ユーザーのリクエストがRigシステムに入ると、まず「プロバイダーアブストラクション層」を通過し、ここで異なるプロバイダー間の差異が標準化され、エラー処理の一貫性が確保されます。次にコア層で、スマートエージェントが各種ツールを呼び出し、またはベクトルストレージを照会して必要な情報を取得します。最後に、RAG（検索拡張生成）などの高度なメカニズムを通じて、文書検索とコンテキスト理解を組み合わせ、正確かつ意味のある応答を生成し、ユーザーに返します。

適用シーン：Rigは、迅速かつ正確な回答を必要とする質疑応答システムの構築に適しています。また、効率的なドキュメント検索ツール、コンテキスト認識型チャットボットやバーチャルアシスタントの作成にも利用でき、さらには既存データパターンに基づいたコンテンツ生成（テキストやその他の形式）もサポートしています。

1.4 ZerePy

ZerePyはPythonベースのオープンソースフレームワークで、X（旧Twitter）プラットフォーム上でAIエージェントを展開・管理するプロセスを簡素化することを目指しています。Zerebroプロジェクトから派生したもので、そのコア機能を継承しつつ、よりモジュラーで拡張性の高い設計となっています。開発者が簡単にカスタマイズされたAIエージェントを作成し、X上でさまざまな自動化タスクやコンテンツ制作を行うことを可能にします。

ZerePyは、ユーザーが展開したAIエージェントを管理・制御するためのコマンドラインインターフェース（CLI）を提供しています「1」。そのコアアーキテクチャはモジュラー設計に基づき、開発者が以下のような異なる機能モジュールを柔軟に統合できるようになっています：

● LLM統合：ZerePyはOpenAIおよびAnthropicの大規模言語モデル（LLM）をサポートしており、開発者は使用シナリオに最も適したモデルを選択できます。これにより、エージェントは高品質なテキストコンテンツを生成することが可能になります；

● Xプラットフォーム統合：フレームワークはXプラットフォームのAPIを直接統合しており、エージェントによる投稿、返信、いいね、リツイートなどの操作が可能です；

● モジュラー接続システム：開発者が他のSNSプラットフォームやサービスのサポートを簡単に追加し、フレームワークの機能を拡張できる仕組みです；

● メモリシステム（将来計画）：現バージョンでは未完の可能性がありますが、ZerePyの設計目標にはメモリシステムの統合が含まれており、エージェントが過去のやり取りやコンテキスト情報を記憶することで、より一貫性とパーソナライズされたコンテンツを生成できるようにすることです。

ZerePyとa16zのElizaプロジェクトはどちらもAIエージェントの構築・管理を目指していますが、アーキテクチャと目標には若干の違いがあります。Elizaはマルチエージェントシミュレーションや広範なAI研究に重点を置いていますが、ZerePyは特定のSNSプラットフォーム（X）でのAIエージェント展開を簡素化することに焦点を当てており、実用性の簡便さに重きを置いています。

二、BTCエコのリメイク

実際の発展経路を考えると、AIエージェントと2023年末～2024年初頭のBTCエコロジーには多くの共通点があります。BTCエコの発展経路は簡単に言えば「BRC20 → Atomical/Runeなどの複数プロトコル競争 → BTC L2 → Babylonを中心としたBTCFi」とまとめられます。一方、AIエージェントは成熟した従来のAI技術スタックを基盤としているため、さらに急速に発展していますが、全体的な発展プロセスにはBTCエコと多くの類似点があります。筆者はこれを簡潔に「GOAT/ACT → ソーシャル系エージェント／分析系AIエージェントフレームワークの競争」とまとめます。今後の傾向として、エージェントの分散化・セキュリティ強化に焦点を当てるインフラプロジェクトが、このフレームワーク人気を引き継ぎ、次の段階の主軸となる可能性が高いでしょう。

では、このトラックもBTCエコのように均質化・バブル化に向かうのでしょうか？筆者はそうは思いません。まず、AIエージェントのナラティブはスマートコントラクトチェーンの歴史を再現するためのものではありません。また、現存するAIフレームワークプロジェクトは、技術的に真に実力があるか、まだPPT段階あるいはctrl+c+ctrl+vのレベルかは別として、少なくとも新しいインフラ発展のアイデアを提示しています。多くの記事ではAIフレームワークを資産発行プラットフォームに、エージェントを資産に例えますが、個人的にはMemecoin Launchpadやインスクリプションプロトコルよりも、AIフレームワークは将来的なパブリックチェーンに、エージェントは将来的なDappに近いと考えます。

現在のCryptoには数千のパブリックチェーンと数万ものDappが存在しています。汎用チェーンとしてはBTC、イーサリアム、その他さまざまな異種チェーンがあり、アプリチェーンの形態はさらに多様で、ゲームチェーン、ストレージチェーン、DEXチェーンなどがあります。パブリックチェーンとAIフレームワークは非常に類似しており、Dappとエージェントもよく対応しています。

AI時代のCryptoはおそらくこのような形態へと進むでしょう。今後の議論も、「EVM vs 異種チェーン」から「フレームワーク間の争い」へと移行していくと思われます。今の課題は、「どうやって分散化またはチェーン化するか？」という点です。これは今後のAIインフラプロジェクトが基盤として展開していくことでしょう。もう一つの疑問は、「ブロックチェーン上でこれをやることに意味はあるのか？」ということです。

三、チェーン上での意義とは？

ブロックチェーンはどのような事物と結合するにせよ、最終的に直面する問題があります：意味はあるのか？昨年の記事で筆者はGameFiの本末転倒や、インフラ発展の過剰な先行化を批判しました。前の数回のAI関連記事でも、現時点での実用分野におけるAI x Cryptoの組み合わせにはあまり期待していないと述べました。なぜなら、ナラティブによる駆動力は伝統的なプロジェクトにとってますます弱まりつつあり、昨年、価格が比較的良好だった少数の伝統的プロジェクトも、価格に見合うかそれ以上の実力を備えていました。AIがCryptoに何の役に立つのか？以前考えていたのは、エージェントによる自動操作による意図の実現、メタバース、エージェントを従業員として使うといった、やや陳腐だが需要のあるアイデアでした。しかし、これらはすべて完全にチェーン上に載せる必要はなく、ビジネスロジックとしても閉鎖できないサイクルです。前回取り上げたエージェントブラウザによる意図の実現は、データアノテーションや推論用計算資源などの需要を生み出すかもしれませんが、両者の結合はまだ十分に密ではなく、計算資源の面では多方面から総合的に判断しても依然として中央集権的な計算資源が優勢です。

DeFiの成功要因を再考しましょう。DeFiが従来の金融から一定のシェアを獲得できたのは、より高いアクセシビリティ、より良い効率、より低いコスト、そして信頼できる中央機関を必要としない安全性があったからです。この考え方を踏まえると、エージェントのチェーン化を支持する理由として、以下のいくつかが考えられます。

1. エージェントのチェーン化によって、使用コストを下げ、より高いアクセシビリティと選択肢を実現できるか？最終的に、Web2の大手企業が独占するAIの「レンタル権」を一般ユーザーも参加できるようにする；

2. セキュリティ：エージェントの最もシンプルな定義から言えば、エージェントと呼べるAIは仮想または現実世界と相互作用できるはずです。もしエージェントが現実世界や自分の仮想ウォレットに介入できるなら、ブロックチェーンベースのセキュリティソリューションは一種の必須要件と言える；

3. エージェントはブロックチェーン独自の金融遊びを実現できるか？例えばAMMのLPのように、一般人でも自動マーケットメイキングに参加できるようにする。あるいは、エージェントが計算資源やデータアノテーションを必要とし、ユーザーがそれを支援するためにU（USDTなど）をプロトコルに投入できるようにする。また、異なる応用シナリオに基づくエージェントが新たな金融遊びを生み出すことも可能；

4. 現在のDeFiは完全な相互運用性を持っていません。ブロックチェーンと統合されたエージェントが、透明で追跡可能な推論を実現できれば、前回の記事で触れた伝統的なインターネット大手が提供するエージェントブラウザよりも魅力的になるかもしれません。

四、創造性？

将来、フレームワーク系プロジェクトはGPT Storeに類似した起業機会を提供するでしょう。現時点では、フレームワークを使ってエージェントを公開することは一般ユーザーにとってはまだ複雑ですが、筆者はエージェントの構築プロセスを簡素化し、複雑な機能を組み合わせるフレームワークが将来優位を占めると考えます。これにより、GPT Storeよりも面白いWeb3のクリエイティブエコノミーが生まれるでしょう。

現在のGPT Storeは依然として伝統的領域の実用性に偏っており、人気アプリのほとんどが従来のWeb2企業によって作られています。収益面でも、クリエーターが独占しています。OpenAIの公式説明によると、この戦略は米国地域の一部優秀な開発者にのみ資金支援を行い、一定額の補助金を提供しています。

Web3は需要面でまだ多くの未充足領域があり、経済体系においてもWeb2大手の不公平な政策をより公平にすることができます。さらに、コミュニティ経済を取り入れることでエージェントをさらに完成度の高いものにできるでしょう。エージェントのクリエイティブエコノミーは、一般人でも参加できる機会となり、将来のAI MemeはGOATやClanker上で発行されるエージェントよりもさらにスマートで面白くなるでしょう。

参考文献：

1.AIフレームワークの歴史的進化とトレンド探求

2.Bybit：AI Rig Complex （ARC）：AIエージェントフレームワーク

3.Deep Value Memetics：四大Crypto×AIフレームワーク横断比較：採用状況、長所短所、成長可能性

4.Eliza公式ドキュメント

5.Virtual公式ドキュメント

TechFlow公式コミュニティへようこそ

Telegram購読グループ：https://t.me/TechFlowDaily

Twitter公式アカウント：https://x.com/TechFlowPost

Twitter英語アカウント：https://x.com/BlockFlow_News

お気に入りに追加

SNSで共有