
AIエージェント:Web3ゲームの革新の道を再定義する
TechFlow厳選深潮セレクト

AIエージェント:Web3ゲームの革新の道を再定義する
本稿では、「汎用大規模モデル、ドメイン特化型アプリケーションエージェント、およびGenerative AIアプリケーション」がWeb3ゲーム分野でどのように発展しているかを整理する。
著者:PSE Trading Analyst @Minta
Key Insights
-
AIエージェントとは、LLM(大規模言語モデル)ベースの汎用モデルを活用し、開発者やユーザーが直接構築できる自律的インタラクション型アプリケーションのためのツールである。
-
今後のAI分野における主要な構図は「汎用大規模モデル+垂直領域アプリ」になる可能性が高い。AIエージェントはこの中間層、すなわち汎用モデルとDappをつなぐミドルウェアとして位置づけられるため、参入障壁は低く、ネットワーク効果の創出やユーザースティッキネスの向上によって長期的な競争力を高める必要がある。
-
本稿では、「汎用大規模モデル」「垂直領域エージェント」「ジェネレーティブAIアプリ」がWeb3ゲーム分野でどのように展開しているかを整理した。特にジェネレーティブAI技術を組み合わせることで、短期間でヒットゲームが生まれる可能性が高い。

01 技術概要
今年話題となった人工汎用知能(AGI: Artificial General Intelligence)技術において、大型言語モデル(Large Language Model - LLM)が中心的な役割を果たしている。OpenAIのコア技術者であるAndrej Karpathy氏やLilian Weng氏も、LLMに基づくAIエージェントがAGI分野の次の重要な進展方向になると述べており、多くのチームがLLM駆動のAIエージェント(AI-Agents)システムの開発に取り組んでいる。簡単に言えば、AIエージェントとは大量のデータと複雑なアルゴリズムを用いて人間の思考や意思決定プロセスを模倣し、さまざまなタスクやインタラクション(自動運転、音声認識、ゲーム戦略など)を実行するコンピュータプログラムである。Abacus.aiの資料はAIエージェントの基本原理を明確に説明しており、そのステップは以下の通りである:
-
感知とデータ収集:データの入力、またはセンサーやカメラ、マイクなどのデバイスを通じて環境情報(ゲーム状態、画像、音声など)を取得する。
-
状態表現:取得したデータをエージェントが理解可能な形式(ベクトルやテンソルなど)に変換し、ニューラルネットワークへの入力準備を行う。
-
ニューラルネットワークモデル:通常はディープニューラルネットワークを使用して意思決定や学習を行う。画像処理には畳み込みニューラルネットワーク(CNN)、時系列データにはリカレントニューラルネットワーク(RNN)、より高度なモデルとしては自己注意機構(Transformer)などが用いられる。
-
強化学習:エージェントは環境との相互作用を通じて最適な行動戦略を学習する。その他にも、ポリシーネットワーク、バリューネットワーク、トレーニングと最適化、探索と活用のバランスといった要素も含まれる。例えばゲームの場面では、ポリシーネットワークがゲーム状態を入力として行動の確率分布を出力し、バリューネットワークが状態価値を推定する。エージェントは環境とのやり取りを通じて強化学習アルゴリズムを継続的に改善し、より優れた結果を出力できるようになる。

要するに、AIエージェントは理解・判断・行動が可能なインテリジェントな存在であり、ゲームを含む多様な分野で重要な役割を果たすことができる。OpenAIのLilian Weng氏が執筆した『LLM Powered Autonomous Agents』はAIエージェントの原理について非常に包括的に解説しており、その中で興味深い実験「Generative Agents」(GA)が紹介されている。
Generative Agents(GA)は『The Sims(邦題:魔法使いハリー)』から着想を得ており、LLM技術を用いて25体の仮想キャラクターを生成し、それぞれをLLM駆動のエージェントが制御することで、サンドボックス環境内で生活や相互作用を行う。
GAの設計は巧妙で、LLMに記憶、計画、反省機能を統合しており、過去の経験に基づいて意思決定を行い、他のエージェントと対話できるようにしている。
論文は、エージェントがポリシーネットワーク、バリューネットワーク、および環境との相互作用を通じて意思決定パスを継続的に訓練・最適化する方法を詳細に説明している。
その原理は以下の通りである。メモリストリーム(Memory Stream)は長期記憶モジュールであり、エージェントのすべての相互作用履歴を記録する。リトリーブモデル(Retrieve)は関連性、新鮮度、重要性に基づいて過去の記憶(Retrieved Memories)を提供し、エージェントの意思決定(Plan)を支援する。リフレクト機構(Reflect)は過去の出来事を分析・要約し、将来の行動を導く。PlanとReflectが協働して、エージェントは反省内容や環境情報を実際の行動(Act)に変換する。

このような実験は、AIエージェントの能力を示しており、新しい社会的行動の創出、情報伝播、関係性の記憶(2人の仮想キャラクターが会話を継続)、社交イベントの調整(パーティーを開催し、他のキャラクターを招待)などが可能であることを示している。つまり、AIエージェントは非常に興味深いツールであり、ゲームへの応用もさらに深掘りする価値がある。
02 技術トレンド
2.1 AI分野のトレンド
ABCDEの投資研究パートナーLaoBai氏は、シリコンバレーのベンチャーキャピタル界隈がAIの次なる発展について以下のように見ているとまとめた:
-
垂直領域専用モデルではなく、「大規模モデル+垂直領域アプリ」の構図が主流となる。
-
エッジデバイス(例:スマートフォン)上のデータが新たな壁となり得る。エッジデバイスベースのAIもチャンスとなる。
-
Context長の拡張が将来的に質的飛躍をもたらす可能性がある(現時点ではベクトルデータベースをAIの記憶としているが、依然としてcontext長に限界がある)。
つまり、業界全体の発展法則から考えると、汎用大規模モデルは汎用性が高く、開発コストも大きいため、各社が同様のモデルを繰り返し開発する必要はなく、むしろ既存の大規模モデルを特定分野に応用することが重点となる。
また、エッジデバイスとは、クラウドやリモートサーバーに依存せず、ローカルでデータ処理と意思決定を行う端末のことである。エッジデバイスの多様性ゆえに、AIエージェントを端末上で動作させ、適切にデータを取得する仕組みの構築は課題だが、同時に大きな機会でもある。
最後に、Contextに関する議論も注目されている。簡単に言うと、LLMにおけるContextとは情報量のことであり、Context長はその次元数を指す。例えばECサイトの予測モデルにおいて、Contextには閲覧履歴、購入履歴、検索記録、ユーザー属性などが含まれる。Context長とはこれらの特徴量が重ね合わされる次元の広がりであり、たとえば「上海在住30歳男性の競合製品購入履歴」に「最近の購入頻度」「直近の閲覧履歴」などを加えることで、より精密なユーザー理解が可能になる。
現在の共通認識として、ベクトルデータベースをAIの記憶として用いているが、それでもContext長に限界がある。しかし将来的にはContext長に質的変化が起こり、LLMモデルがより長く複雑なContextを処理・理解する高度な手法が登場することで、想像を超える応用が次々と現れるだろう。
2.2 AIエージェントのトレンド
Folius Venturesは、ゲーム分野におけるAIエージェントの応用パターンを以下のように整理している(下図参照):

図中の①はLLMモデルであり、ユーザーの意図を従来のキーボード/クリック操作から自然言語入力に変換し、利用の敷居を下げる役割を担う。
図中の②はAIエージェントを統合したフロントエンドDappであり、ユーザーに機能を提供すると同時に、端末からユーザーの行動習慣やデータを収集できる。
図中の③は各種AIエージェントであり、アプリ内機能やBotなどの形で存在する。
総じて、AIエージェントはコードベースのツールとして、Dappの機能拡張を支える基盤プログラムやプラットフォーム成長の触媒となり、すなわち「大規模モデル」と「垂直領域アプリ」をつなぐミドルウェアの位置を占める。
ユーザー視点では、AIエージェントが最も可能性を持って統合されやすいDappは、十分にオープンなSocialアプリ、Chatbot、ゲームである。あるいは、既存のWeb2のトラフィック入口をAIエージェントでより使いやすく親しみやすいAI+Web3の入り口に再構築することも可能である。これは業界全体で議論されている「Web3のユーザーフリクション低減」のテーマとも一致する。
業界の発展法則に基づけば、AIエージェントが位置するミドルウェア層は激しい競争が発生する分野であり、参入障壁は低い。そのため、AIエージェントはB2Cニーズに応える体験の継続的改善に加え、ネットワーク効果の創出やユーザースティッキネスの強化を通じて自らの競争優位性を高める必要がある。
03 分野マップ
Web3ゲーム分野におけるAIの応用はすでに多様な試みが行われており、以下のように分類できる:
-
汎用モデル:Web3プロジェクトのニーズに対応した神経ネットワークアーキテクチャや汎用モデルの構築に注力するプロジェクト。
-
垂直領域アプリ:ゲーム内の特定課題の解決やサービス提供を目指すもので、エージェント、Bot、BotKitの形で登場する。
-
ジェネレーティブAIアプリ:大規模モデルの最も直接的な応用がコンテンツ生成であり、ゲームはまさにコンテンツ産業であるため、この分野の応用は非常に注目される。仮想世界の要素、キャラクター、タスク、ストーリーの自動生成に加え、ゲーム戦略や意思決定、さらにはゲーム内エコシステムの自動進化まで可能になり、ゲームの多様性と深みを増す。
-
AIゲーム:すでに多数のゲームがAI技術を統合しており、用途もさまざまである。後述の事例を参照。
3.1 汎用大規模モデル
現在、Web3では経済モデル設計やエコシステム発展のためのシミュレーションモデルが存在する。例えばQTM(Quantitative Token Model)が挙げられる。Outlier VentureのDr. Achim Struve氏はETHCCでの講演で、経済モデル設計に関する見解を述べている。例えば経済システムの堅牢性を考慮し、LLMモデルを用いてエコシステム全体を1:1で模倣する「デジタルツイン(Digital Twin)」を作成できるという。
下図のQTM(定量的トークンモデル)はAI駆動の推論モデルである。QTMは10年間の固定シミュレーション時間を持ち、1ステップは1ヶ月である。各ステップ開始時にトークンがエコシステムに放出され、インセンティブモジュール、トークン帰属モジュール、エアドロップモジュールなどが設けられている。その後、トークンはいくつかのメタバケットに分配され、さらに細分化された汎用ユーティリティへ再分配される。これらのユーティリティツールから報酬支払いなどが定義される。また、オフチェーンビジネス面では、一般的な資金状況(焼却やリバウンド)やユーザーアダプション率の測定、ユーザー行動の定義なども考慮している。

もちろん、このモデルの出力品質は入力品質に依存するため、QTMを使用する前に十分な市場調査を行い、正確な入力情報を得る必要がある。しかしQTMモデルは、AI駆動モデルがWeb3経済モデルに実際に応用された好例であり、多くのプロジェクトがQTMをベースに操作が容易な2C/2B向けアプリを開発し、利用の敷居を下げている。
3.2 垂直領域アプリエージェント
垂直領域アプリは主にエージェントの形態を取り、Bot、BotKit、仮想アシスタント、インテリジェント意思決定支援システム、各種自動データ処理ツールなど多様な形で存在する。一般的に、AIエージェントはOpenAIの汎用モデルを基盤とし、テキスト読み上げ(TTS)などのオープンソースまたは独自技術を組み合わせ、特定データでファインチューニング(大規模データで事前学習されたモデルを特定分野でさらに最適化する技術)を行うことで、ChatGPTよりも特定分野で優れた性能を発揮するAIエージェントを創出する。
現在、Web3ゲーム分野で最も成熟しているのはNFTエージェントである。ゲーム分野のコンセンサスとして、NFTはWeb3ゲームの重要な構成要素であるとされている。
イーサリアムエコシステムにおけるメタデータ管理技術の進展により、プログラマブルな動的NFTが登場した。作成者にとってはアルゴリズムによりNFTの機能を柔軟にできる。ユーザーにとっては、NFTとのインタラクションが増え、そのデータが新たな情報源となる。AIエージェントはこうしたインタラクションを最適化し、データの応用範囲を広げることで、NFTエコシステムに革新と価値をもたらす。
ケース1:Gelatoの開発フレームワークは、開発者が条件(オフチェーンイベントや特定時間間隔など)に基づきNFTのメタデータを更新できるようにする。Gelatoノードは条件が満たされるとメタデータの変更をトリガーし、オンチェーンNFTの自動更新を実現する。例えば、スポーツAPIからリアルタイム試合データを取得し、選手が勝利した時点でNFTのスキル特性を自動アップグレードできる。

ケース2:PaimaもDynamic NFT向けのアプリケーションエージェントを提供している。PaimaのNFT圧縮プロトコルはL1上に最小限のNFTを発行し、L2のゲーム状態に応じて進化させる。これによりプレイヤーに深みとインタラクション性のある体験を提供する。例えばNFTはキャラクターの経験値、タスク達成状況、装備などに応じて変化する。
ケース3:Modulus Labsは有名なZKMLプロジェクトであり、NFT分野にも進出している。Modulus LabsはNFTシリーズ「zkMon」をリリースし、AIでNFTを生成してオンチェーンに発行すると同時にzkp(ゼロ知識証明)を生成する。ユーザーはzkpを通じて、自分のNFTが対応するAIモデルから生成されたことを検証できる。詳細はChapter 7.2: The World’s 1st zkGAN NFTsを参照。
3.3 ジェネレーティブAIアプリ
前述の通り、ゲームはコンテンツ産業そのものであり、AIエージェントは短時間かつ低コストで大量のコンテンツを生成できる。不確実性がありダイナミックなゲームキャラクターの生成なども可能である。よって、ジェネレーティブAIはゲーム分野に極めて適している。現在、ゲームにおけるジェネレーティブAIの応用は主に以下のタイプに分けられる:
-
AI生成キャラクタータイプ:AIと対戦、NPCの模擬・制御、あるいはAIによるキャラクター生成など。
-
AI生成コンテンツタイプ:タスク、ストーリー、アイテム、マップなどのコンテンツをAIが直接生成。
-
AI生成シーンタイプ:AIによるゲーム世界の地形、景観、雰囲気の自動生成、最適化、拡張をサポート。
3.3.1 AIによるキャラクター生成
ケース1:MyShell
MyShellはBot作成プラットフォームであり、ユーザーは目的に応じて専用Botを作成でき、チャット、会話練習、ゲーム、心理カウンセリングなどに使える。また、MyShellはテキスト読み上げ(TTS)技術を採用しており、数秒の音声サンプルで誰の声でも模倣し、Botを自動生成できる。さらにAutoPrompt機能を使えば、ユーザーは単に自分のアイデアを説明するだけでLLMに指示を出せ、プライベートLLMの基盤を築ける。
MyShellユーザーの中には「音声チャット機能が非常にスムーズで、GPTの音声チャットよりもレスポンスが速く、Live2Dもある」と評価する声もある。

ケース2:AI Arena
AI ArenaはAI対戦ゲームで、ユーザーはLLMモデルを使って自分の戦闘精霊(NFT)を訓練し、完成した精霊をPvP/PvE戦場に送り込む。任天堂の「大乱闘スマッシュブラザーズ」と似た対戦形式だが、AI訓練により競技性がさらに高まる。
ParadigmがAI Arenaにリード投資しており、現在パブリックテストが開始されており、無料でプレイ可能。NFT購入で訓練強度を高めることもできる。

ケース3:オンチェーンチェスゲーム Leela vs the World
Leela vs the WorldはModulus Labsが開発したチェスゲーム。対戦相手はAIと人間で、棋譜はスマートコントラクト上に保存される。プレイヤーはウォレットで操作(コントラクトと相互作用)。AIは新しい局面を読み取り判断し、計算プロセス全体に対してzkpを生成する。これらはAWSクラウド上で行われ、生成されたzkpはオンチェーンコントラクトで検証され、成功すれば棋譜コントラクトを呼び出して「着手」する。

3.3.2 AIによるゲームコンテンツ生成
ケース1:AI Town
AI Townはa16zとそのポートフォリオ企業Convex Devの共同プロジェクトで、スタンフォード大学の「Generative Agent」論文から着想を得ている。AI Townは仮想町であり、町に住む各AIは相互作用や経験に基づいて独自の物語を構築する。
使用技術はConvexのサーバーレスバックエンド、Pineconeのベクトルストレージ、Clerkの認証、OpenAIの自然言語生成、Flyのデプロイなど。さらにAI Townは完全オープンソースで、開発者がゲーム内要素(特徴データ、スプライトシート、タイルマップのビジュアル環境、プロンプト、ゲームルールやロジックなど)を自由にカスタマイズできる。一般ユーザーだけでなく開発者もソースコードを使ってゲーム内外で様々な機能を開発でき、この柔軟性によりAI Townは単なるコンテンツ生成ゲームにとどまらず、開発エコシステムや開発ツールとしても機能する。
つまり、AI TownはAI生成コンテンツゲームであると同時に、開発エコシステム、さらには開発ツールでもある。

ケース2:Paul
PaulはAIストーリージェネレーターであり、フルオンチェーンゲーム向けにAIでストーリーを生成し、そのままオンチェーンに記録するソリューションを提供する。実現ロジックは、LLMに大量の前提ルールを入力し、プレイヤーがそれらのルールに基づいて二次創作コンテンツを自動生成できるようにする。
現在、Straylight ProtocolがPaul Seidlerを使ってゲームをリリースしている。Straylightは多人数参加型NFTゲームで、コアプレイはフルオンチェーン版「マインクラフト」。プレイヤーは自動でNFTをミントし、モデルに入力された基本ルールに従って自分だけの世界を構築できる。

3.3.3 AIによるゲームシーン生成
ケース1:Pahdo Labs
Pahdo Labsはゲーム開発スタジオで、現在Godotエンジンを基にしたアニメファンタジーRPG「Halcyon Zero」を開発中。これはオンラインゲーム作成プラットフォームでもある。舞台は幻想的な世界で、繁華な街がソーシャルセンターとして機能する。
このゲームの特徴は、プレイヤーがゲーム提供のAI創作ツールを使い、素早く3D背景を作成したり、好きなキャラクターをゲームに導入できること。これにより、一般ユーザー向けのUGC(ユーザー生成コンテンツ)ツールとゲーム空間が提供される。

ケース2:Kaedim
Kaedimはゲームスタジオ向けに、ジェネレーティブAIを活用した3Dモデル生成ツールを開発している。これにより、スタジオはニーズに合った3Dシーン/アセットを大量に迅速に生成できる。現在、Kaedimの汎用製品は開発中で、2024年にゲームスタジオ向けに公開予定。
Kaedimの製品の核心ロジックはAIエージェントと全く同じで、汎用大規模モデルを基盤とし、内部のアーティストが良質なデータを継続的に投入し、エージェントの出力に対してフィードバックを与えることで、機械学習を通じてモデルを訓練し、最終的に要求に合う3DシーンをAIエージェントが出力できるようにする。

04 まとめ
本稿では、AIがゲーム分野でどのように応用されているかを詳細に分析・まとめた。総じて、今後は汎用モデルとジェネレーティブAIのゲーム応用において、スター級のユニコーンプロジェクトが必ず現れるだろう。垂直領域アプリは参入障壁が低いものの、先行者利益が大きく、これを活かしてネットワーク効果やユーザースティッキネスを創出できれば、大きな可能性が広がる。また、ジェネレーティブAIはコンテンツ産業であるゲームに天然的に適しており、すでに多くのチームがGAのゲーム応用に挑戦しており、このサイクルでGAを活用したヒットゲームが生まれる可能性は非常に高い。
文中で紹介した以外にも、今後の探求すべき方向は他にもある。例えば:
(1) データ分野+アプリ層:AIデータ分野にはすでに数十億ドルの評価額を持つユニコーンが誕生しており、データとアプリ層の連携も大きな可能性を秘めている。
(2) SocialFiとの融合:革新的なソーシャルインタラクションの提供、AIエージェントによるコミュニティ認証・ガバナンスの最適化、より高度なパーソナライズド推薦など。
(3) エージェントの自動化・成熟に伴い、将来的なAutonomous Worldの主な参加者は人間かBotか?オンチェーンの自律世界において、UniswapのようにDAUの80%以上がBotになることは可能か?もし可能なら、Web3ガバナンス概念と組み合わせたガバナンスエージェントの探求も意義深い。
TechFlow公式コミュニティへようこそ
Telegram購読グループ:https://t.me/TechFlowDaily
Twitter公式アカウント:https://x.com/TechFlowPost
Twitter英語アカウント:https://x.com/BlockFlow_News












