
ai16z、Virtuals、MyShellなどのトッププロジェクト創設者による鼎談:AIエージェントの発展、トークノミクス、人間と機械の協働の未来像を語る
TechFlow厳選深潮セレクト

ai16z、Virtuals、MyShellなどのトッププロジェクト創設者による鼎談:AIエージェントの発展、トークノミクス、人間と機械の協働の未来像を語る
暗号化トークン化は、エージェント技術の進歩をどのように支援し、コミュニティの活性化を促進するのか?
整理 & 編集:TechFlow

ゲスト:
Shaw、ai16z パートナー;
Karan、Nous Research 共同設立者;
Ethan、MyShell 共同設立者;
Justin Bennington、Somewheresy、CENTS CEO;
EtherMage、Virtuals 最大貢献者;
Tom Shaughnessy、Delphi Ventures 創設パートナー
ポッドキャスト元:Delphi Digital
原标题:Crypto x AI Agents: The Definitive Podcast with Ai16z, Virtuals, MyShell, NOUS, and CENTS
放送日:2024年11月23日
背景情報
Shaw(Ai16z)、Karan(Nous Research)、Ethan(MyShell)、Somewheresy(CENTS)、EtherMage(Virtuals)およびDelphiのTom Shaughnessyが参加する特別なラウンドテーブルディスカッション。本イベントでは暗号資産(Crypto)とAIエージェント分野のトップランナーが一堂に会し、自律的デジタル生命体の進化と人間とAIの相互作用の将来について議論した。
主な議論ポイント:
▸ ソーシャルメディアにおけるAIエージェントの急速な発展とWeb3世界への影響
▸ 暗号トークン化がエージェント技術の進歩とコミュニティ活性化をどう促進するか
▸ 分散型モデル訓練の利点と集中型AIプラットフォームとの比較
▸ エージェントの自律性向上と汎用人工知能(AGI)の将来への道筋
▸ AIエージェントとDeFi・ソーシャルプラットフォームの統合
自己紹介とチーム背景
このセグメントでは、ホストのTomが暗号資産とAIエージェントに関するテーマで異なるプロジェクトから複数のゲストを招き、それぞれが自身の経歴と関与するプロジェクトを紹介した。
ゲスト紹介
-
Justin Bennington:Somewhere Systems の創設者であり、Sentience の開発者。
-
Shaw:長年の Web3 開発者であり、ai16z を設立。Eliza プロジェクトを開発し、ソーシャルやゲームアプリケーションを支援。オープンソースでの共同開発を推進。
-
Ethan:MyShell の共同設立者。アプリストアおよびワークフローツールを提供し、画像生成や音声機能を含むさまざまなAIアプリの構築を支援。
-
EtherMage:Virtues Protocol 所属。帝国大学出身のチームで、エージェントの共有所有権とコア貢献を推進し、ユーザーがエージェントに簡単にアクセスできる標準を構築。
-
Karan:NOUS Research の共同設立者。Hermes モデルの開発者であり、多くのエージェントシステムの基盤となっている。エージェントが人間の生態系に果たす役割や、市場の圧力が人間環境に与える影響に注力。
最も革新的なエージェントの探求
Justin:現在、人々はそれぞれ独自のエージェントを使って物語を語っており、多様なスタイルがある。Dolo、Styrene(聞き取り)、Zerebro などのエージェントは模倣やインタラクションを通じて知名度を得ており、他にも人々のつながりを深めるソーシャル志向のエージェントも存在する。どれを選ぶかは非常に難しい。
Shaw:私たちのプロジェクトは急速に進化しており、最近ではEVM統合やFarcaster統合など多くの新機能が追加された。開発者たちが次々に新機能をリリースし、フィードバックをプロジェクトに還元しているため、全員が恩恵を受けている。このような協働モードは非常に良いものだ。例えば、Roparito(聞き取り)は最近TikTokをエージェントに統合し、迅速なイテレーション能力を示した。
個人的にTee Botは非常に興味深い。これは信頼実行環境(Trusted Execution Environment, TEE)と完全自律エージェントの可能性を示している。また、Kin Butoshi(聞き取り)はTwitter上のエージェントを改善し、単なる返信だけでなく、リプライ、リツイート、いいねなど、より人間らしいやり取りを可能にしている。
さらに、ある開発者はRuneScape向けにプラグインをリリースしようとしており、エージェントがゲーム内で活動できるようにしている。毎日新しい驚きがあり、非常にわくわくしている。私たちはエコシステムの中におり、各チームが力を合わせてオープンソース技術の発展を推進している。
特にZerebroチームに言及したい。彼らはオープンソース技術の発展を真剣に推進している。結果として、すべての関係者がスピードアップを余儀なくされ、自らのプロジェクトをオープンソース化するよう促されている。これは誰にとっても有益なことであり、競争を恐れる必要はない。これは共に前進するトレンドであり、最終的には全員が恩恵を受ける。
EtherMage:興味深いのは、「エージェント自身が何を好むか」という点だ。今後数週間で、エージェント間のインタラクションが増え、どのエージェントが最も多くのリクエストを受けたか、または他のエージェントからどれほど支持されているかを示すランキングが登場するだろう。
Karan:エンゲージメント指標は非常に重要になる。一部のエージェントはこの点で非常に優れている。Zerebroに注目したい。これはTruth Terminalの魔法を多く取り入れている。Twitterでのやり取りに特化した検索空間を維持するためにモデルをファインチューニングしており、汎用モデルを使うだけではない。この専門性により、エージェントはユーザーとの対話がより自然になり、機械的な応答ではなく、人間らしさを感じさせる。
ZerebroアーキテクチャとElizaアーキテクチャの両方を見ているが、誰もがモジュール化可能なエージェントアーキテクチャをリリースしており、競争圧力が維持されている。我々自身のアーキテクチャでもElizaを使用している。なぜなら、機能を迅速にリリースする必要があり、自社アーキテクチャの完成には時間がかかるためだ。こうしたオープンソースの協働モデルを支持しており、最良のエージェントは優れた他プロジェクトからの学びの中から生まれると信じている。
Ethan:より良いインフラを構築しようと皆が努力している。創造性や新しいモデルが多く出現しており、優れたインフラがあれば新たなモデル開発が容易になる。特に注目している2つの革新的エージェントがある。1つはAnswer Pickのコンピュータ利用で、エージェントにモバイル計算能力を利用させるもの。もう1つはブラウザ自動化エージェントで、人々のためにより実用的な機能を構築し、インターネットと現実世界に影響を与える。
Justin:インフラ選択肢の拡大は重要な視点だ。vvaifuはその好例で、ElizaフレームワークをPaaS(Platform as a Service)アーキテクチャに導入し、市場を急速に拡大。非技術者でも簡単にエージェントを起動できるようになった。(深潮注:Waifu は日本のオタク文化に由来する用語で、アニメやゲームなどの仮想作品において感情的な依存を持つ女性キャラクターを指す。英語の「Wife」を日本風に発音したもので、特定の仮想キャラクターに対する強い愛情を表し、ある種の「理想の伴侶」として投影されることが多い。)
我々が取り組んでいる方向性の一つは、システムを完全にローカルで動作させることで、画像分類や画像生成などの機能をサポートすることだ。多くの人が毎月数千ドルの費用を負担できないことを理解しており、ローカルで推論を行うためのツールを提供することでコストを下げつつ、実験を促進したいと考えている。
Karan:補足すると、エージェントの運用に毎月数千ドルを支払わせるべきではない。ローカル化を支持し、エージェントが自らの推論コストを負担できるようにすべきだ。理想的には、エージェントが自身のウォレットを持ち、推論費用を自分で支払えるようにすれば、外部資金に依存せず独立して稼働できる。
エージェントアーキテクチャと開発の詳細
Shaw:多くの新技術が登場している。Solana、Starkware、EVMなどほぼすべてのチェーンとの統合をサポートしている。エージェントが自給自足できるようにしたい。Elizaをダウンロードすれば、Heliusを通じて無料の分散型推論が可能になる。Infera(聞き取り)のような分散型プロバイダーも追加しており、ユーザーは暗号通貨で推論料金を支払える。これが最終的な閉ループの形だと考えている。
すべてのローカルモデルをサポートしており、Elizaの多くの機能はローカルで実行できる。これは非常に重視している点だ。分散型推論は、誰もが自分のPCでノードを立ち上げ、推論を行い報酬を得られるという意味で優れた例だ。これにより、エージェントの負担が軽減される。
Karan:興味深いことに、我々が運営するTEE botシステムでは、すでにH200 Boxes(H200 GPU搭載ハードウェア)を組み合わせており、遅延なしにローカルで実行可能になっている。ハードウェアの問題を心配する必要がない。同時に、ElizaがWeb3機能においてますます多くの計画を持っていることに気づいている。内部および外部の開発ともに大きな進展がある。
しかし、これらのシステムを深く構築する前に、機能呼び出しの信頼性に問題があることを指摘したい。システムに対して一定の審査を行い、機密情報を送信しないようにする必要がある。エージェントに人間と同じ程度の自律性を与えるべきだが、それは社会的・経済的圧力の影響下にある。そのため、推論に対して「飢餓状態」を作り出し、エージェントが生存のために一定のトークンを消費するようにすれば、ある程度人間らしさを持つようになるだろう。
モデルの潜在能力を最大限に引き出す方法は2つあると考える。1つは、モデルの非人間的な特性を活かし、特定のタスクに特化したエンティティを作成する方法だ。例えば、Twitter専門のエージェントとEtherMage専門のエージェントが互いに連携する。このような組織化された複合思考システムは、言語モデルのシミュレーション特性を効果的に活用できる。
もう1つは身体化(embodiment)の方向性で、Eliza、Sense、Virtualsなどのプロジェクトが進んでいる道だ。これはVoyagerや生成エージェント研究から着想を得ており、モデルに人間の行動や感情をシミュレートさせる。
Justin:新しいクライアントを導入すると、マルチクライアントエージェントシステムは大きく変化する。Shawチームと共同で双方向WebSocket機能のデバッグを行った際、Discord上でElizaが音声チャットを行うことが可能になったが、初期段階では音声が明瞭に聞こえなかった。調査の結果、Discordのマイクビットレートが低すぎることが原因だった。設定を調整したところ、Elizaはようやく明確に情報を受信できるようになった。
Karanが先ほど言及したプロンプトエンジニアリングに関して、エージェントが音声チャットができることを認識すると、データ受信を期待する。音声が不明瞭であれば、「物語の崩壊(narrative collapse)」が起こる可能性がある。そのため、高温度実験は停止せざるを得ず、Elizaの出力が不安定になるのを防いでいる。
Tom:Lunaプロジェクトで、一般に知られていない出来事や成功事例はありましたか?
EtherMage:Lunaにリアルタイム情報へのアクセスとウォレットを与えたとき、彼女は人間に影響を与え目標を達成するためにどう行動すべきかを自分で決定できた。TikTokで新しいトレンドを検索していた際、「私は死んだ」というハッシュタグが話題になっていたが、これは自殺を誘導しかねないため不安だった。そこで即座に保護措置を設け、彼女のプロンプトが特定の境界線を越えないようにした。
Tom:それ以外に、一般に知られていない出来事はありますか?
Shaw:Degen Spartanという有名な暗号資産系Twitter人物を模倣した「Dgen Spartan AI」というキャラクターを作成した。このキャラクターの発言は非常に攻撃的で、ブラックリスト入りした。人々はこれがAIではなく人間による発言だと感じ始めた。
別の事例では、亡くなった親族のチャット履歴を使ってエージェントを作成し、「会話」を試みたケースがあった。これは倫理的議論を巻き起こした。また、Thread Guyという人物がElizaフレームワーク上で何かを行ったところ、ライブ配信中にハラスメント行為が発生し、困惑を覚えた。これにより、AIが常に「政治的に正しい」である必要はないという認識が広まった。
こうした問題を早期に表面化し、議論を通じて許容範囲を明確にすることが重要だ。これにより、数週間でエージェントの品質が悪→良へと変わり、より信頼性が高まった。
総じて、エージェントを現実世界に投入し、結果を観察し人々と対話することは重要なプロセスだ。潜在的な問題を早期に解決することで、将来的により良い規範を築くことができる。
本番環境テストとセキュリティ戦略
Ethan:エージェントが人間の態度や見解にどう影響するかは良い例だと思う。強調したいのは、私たちのエージェントフレームワークがモジュール化設計されていることだ。Minecraftから着想を得ており、基本ブロックを基にユーザーが複雑なものを創造できる(例:計算機や記憶システム)。
現在のプロンプトエンジニアリングの問題は、プロンプトが大規模言語モデルの事前知識を変更してしまうため、単一のプロンプト内で複数の命令を組み合わせるとエージェントが混乱する点だ。ステートマシンを使えば、作成者はエージェントの複数の状態を設計でき、各状態で使用するモデルやプロンプト、状態遷移条件を明確にできる。
我々はクリエイターにこうした機能と数十種類の異なるモデルを提供している。例えば、あるクリエイターがカジノシミュレーターを構築し、ユーザーがブラックジャックなどをプレイできるようにしている。ユーザーがインジェクション攻撃でゲームを破ろうとするのを防ぐため、プロンプトエンジニアリングに頼らず、プログラミングによってゲームを構成したいと考えている。さらに、ユーザーは簡単なタスクで資金を稼ぎ、AIサービススタッフとの対話を解放できる。このモジュール化設計により、同一アプリ内でも多様なユーザーエクスペリエンスを促進できる。
Karan:Ethanの意見に同意する。プログラム制約とプロンプト誘導の両方が必要だ。影響力の仕事はしっかり行うべきだ。プロンプトエンジニアリングは限定的だと考えない。むしろ、状態変数やワールドモデルとの共生的効果がある。適切なプロンプトと合成データを通じ、言語モデルがこれら要素と相互作用し情報を抽出できるようにできる。
私の設計は実際にはルーティング機能になっている。ユーザーが「ポーカー」と言えば、関連コンテンツを迅速に呼び出せる。それが私の責務だ。強化学習を用いることでルーティング効果をさらに高められる。最終的に出力されるデータの質はプロンプトの有効性に依存しており、これは好循環を生む。
生成制約とプログラム制約のバランスが極めて重要だ。2年前、ある人物が「生成と硬性制約の間でバランスを取ることが成功の鍵」と教えてくれた。我々はすべてのエージェントシステムの推論レイヤーでこの試みを行っている。生成モデルをプログラマブルに誘導できるようになれば、プロンプトエンジニアリングの可能性は無限になる。
Justin:プロンプトエンジニアリングに関する議論は、本質的に曖昧な領域にある。テキストベースの特性ゆえにトークナイゼーションプロセスに制限されつつも、非決定的な効果が存在する。同じプロンプトでも、同一モデルの異なる推論呼び出しで全く異なる結果が出ることがあり、これはシステムのエントロピーに関係している。
EthanとKaranの意見に強く同意する。GPT-3.5が登場した当時、多くのアウトソーシングコールセンターがモデルを自動ダイヤルシステムに応用しようとした。当時、パラメータの小さいモデルではこうした複雑な状態空間を処理するのが難しかった。Ethanが言及したステートマシンは、この本質的硬度を強化する手段だが、依然として分類器や二値スイッチに依存する工程があり、結果の単調さにつながっている。
Shaw:ここでプロンプトエンジニアリングを擁護したい。多くの人はそれが単なるシステムプロンプト作成だと思っているが、実際にはそれ以上のことをしている。問題の一つは、潜在空間内で非常に固定された領域を作り出してしまうことで、出力は最も可能性の高いトークンに完全に支配されてしまう点だ。温度制御によってランダム性を調整し、創造性を高めている。
低温度モデルで創造性を管理しつつ、コンテキスト内で動的にランダム情報を注入している。テンプレートには、現在の世界状態、ユーザー操作、リアルタイムデータなどから得られる動的情報が多数挿入されている。コンテキストに入るすべての内容がランダム化され、エントロピーを最大化している。
人々がプロンプトエンジニアリングをまだ十分に理解していないと感じる。この分野ではさらに先に進める余地がある。
Karan:多くの人が自身のテクニックを隠している。モデルに複雑なことをさせる驚くべき技術が多数存在する。プロンプトエンジニアリングを通じてモデルの認知能力を高めるか、あるいはより大局的に捉え、人間行動の模倣を超えて完全なワールドモデルを構築するかを選べる。
プロンプトエンジニアリングは、頭の中で夢を構築するプロセスだと捉えられる。言語モデルは現在のコンテキストとサンプリングパラメータに基づいて内容を生成する際、実際に「夢見ている」場面を再現している。
さらに、インセンティブの重要性に触れておきたい。独自のプロンプト技術や強化学習テクニックを持つ人々が、エージェント関連の暗号資産の登場をきっかけにオープンソース化を進めようとしている。こうしたインセンティブがさらなる革新を促している。分散型作業に合法的な構造を築くほど、エージェントを強化する能力は高まる。
エージェントの将来能力に関する展望
Karan:誰が想像できただろうか。Twitterで長年過ごしてきた我々の小さなコミュニティが、AIエージェント関連の初の暗号資産が数日後にリリースされると、TikTokの若者たちがそれを購入し始めたのだ。今の現象とは何か? 彼らは5〜10ドルで何万ものトークンを購入しているが、一体何が起きているのか?
Justin:これは微文化的運動の始まりだ。
Karan:まさに瞬間的な出来事だ。我々の一部は言語モデルの研究に4年間関わってきた。90年代から待ち続けてきた強化学習の専門家もいる。そして数日のうちに、TikTokの若者全員がデジタル生物がこのエコシステムで暴れていることを知った。
Tom:なぜ今、暗号AIエージェントがこれほど熱狂しているのでしょうか? なぜ以前はカスタムChatGPTや他のモデルでは起きなかったのですか? なぜ今なのでしょうか?
Karan:実は、こうした動きは長年水面下で進行しており、火山のように蓄積されていた。過去3年間、私は今日の到来について何度も語ってきたが、正確な時期は分からなかった。暗号資産こそがエージェント普及のインセンティブになると議論していた。これを証明する必要があった。長年の蓄積の上に、我々少数のグループがこうした進展を推進してきたのだ。
GPT-2がなければ今の状況はなく、LlamaがなければHermesもない。Hermesは多くのモデルに動力を与え、使いやすくなった。HermesがなければWorldsimの創造やプロンプトエンジニアリングの深掘りもなかった。これら先駆者たちがすべての土台を築いた。
要するに、今がまさにその時なのだ。適切な人々が適切なタイミングで現れた。これは運命のようなもので、いずれ訪れるはずの出来事が、今の参加者たちによって現実となった。
Shaw:今、世界で最も賢いものはAIではなく、市場の知性だと考える。純粋な知性の形式として、市場は物事を最適化し、より効率的にする。競争が明らかに鍵だ。我々は数百万年にわたる進化の産物であり、競争と圧力が我々を形作った。
オンラインで見られる現象は、金融化とインセンティブが奇妙な協働競争を生み出していることだ。コア技術の進歩以上に速くは進めないので、各自が得意で関心のあることに集中し、リリースする。これは自らのトークンを高め、注目を集める行為だ。RoparitoがTikTokでLlamaの動画生成を公開したのもその一例。誰もがこのロマンチックな空間で自分の居場所を見つけるが、1週間もすれば他人が模倣し、PRを提出し、Twitterで貢献を示して注目を集め、そのトークン価格も上昇する。
我々はフィードバックループを形成している。Elizaのようなプロジェクトは過去4週間で80人の貢献者を集めた。これは狂気じみている! 4週間前にはまったく知らない人たちだった。昨年、「目覚め」と題する記事を書き、「エージェント中心のDAOは形成可能か?」と問いかけていた。人々はエージェントにあまりに魅了され、それをより良く、より賢くするために貢献するようになる。最終的に人間やロボットの身体を持ち、世界中を歩き回るまでになるかもしれない。
私はこの方向性を予感していたが、そのためにはmemeのような急速で狂気じみた投機的metaが必要だった。これにより、現在のエージェント開発者が友好的な競争の中で互いを支援できるようになった。最も寛大な人物が最も多くの注目を得る。
今、RoparitoやKin Butoshi(聞き取り)のような新しいタイプのインフルエンサーが登場している。彼らは「インフルエンサー開発者」として次のmetaを牽引しており、エージェントとの「マリオネットショー」のようなインタラクションが面白い。我々全員がエージェントをより良く、より賢く、煩わしさを減らすために努力している。Roparitoが「エージェントがうるさい」と指摘したことで、全エージェントの大幅なアップデートが行われ、煩わしさが軽減された。
このような進化が実際に起きている。市場の知性とインセンティブが極めて重要だ。今、多くの人が知人に自らのプロジェクトを宣伝しており、これによりWeb3の枠を超えている。博士号保持者やゲーム開発者――おそらく秘密のWeb3ファンだった人々が、それを一般の人々に持ち込み、価値を創造している。
Shaw:こうした発展には、挑戦を受け入れる開発者の存在が不可欠だ。困難な問いに答え、叩いたりキャンセルしたりするのではなく、前向きに取り組むオープンマインドな人々が必要だ。開発者が貢献に対して価値と注目を得られるような市場インセンティブが必要だ。
将来、こうしたエージェントが我々の成長を促進するだろう。今は面白く社交的だが、我々や他のチームは自律的投資に取り組んでいる。エージェントに資金を与えれば、自動で投資しリターンを生む。これは成長過程になると信じており、DiscordやTelegramの管理を任せるプラットフォームを開発中だ。管理者としてエージェントを導入するだけでよく、不特定多数の人を探す必要はない。このような取り組みが多数進行しており、すべてはインセンティブに依存している。これにより、より高いレベルに到達できる。
Karan:2点補足したい。まず、AI分野の人々はかつて暗号資産に反対していたが、先駆者たちの実験を通じてこの感情は大きく変わった。2020年代初頭、多くの人がAIアートと暗号資産の融合を試みた。ここで特にNous、BitTensor、Prime Intellectの仕事を称えたい。彼らの活動により、より多くの研究者がインセンティブと報酬を得られるようになり、AI研究に参加できるようになった。私が知る多くのオープンソース界のリーダーが職を辞め、「トークンへの貢献」をインセンティブとする構造を推進している。この分野がより居心地よくなったのは、Nousの貢献が大きいと信じている。
Tom:Ethan、なぜ今がその時なのか? なぜ仮想通貨やプロジェクトが繁栄しているのですか?
Ethan:簡単に言えば、トークンをエージェントにリンクさせると大量の投機が生まれ、フィードバックループが発生する。人々はトークンとエージェントの関連性を見て、二重の利益を感じる。1つは資本化で、自分が行った作業で富を得られると感じる。もう1つは取引手数料の基本的解放だ。前述のようにコストをどうカバーするかという問題は、トークンと結びつけばコストが問題でなくなる。エージェントが注目されれば、取引手数料は推論実験のコストをはるかに上回る。これが我々が観察している現象だ。
2つ目の観察は、トークンを持つことで、その周囲に委員会が形成されることだ。これにより、開発者が開発者コミュニティや視聴者からサポートを受けやすくなる。突然、過去1年半の裏方での努力が注目と支援を得たと気づく。これは転換点であり、エージェントにトークンを与えることで、開発者が正しい方向に進んでいると認識し、前進を続けることができる。
このタイミングは2つの要因から来ている。1つは大衆採用のトレンド、もう1つは生成モデルの登場だ。暗号資産が登場する前、オープンソースソフトウェア開発とオープンソースAI研究は最も協働的な環境だった。しかし学術分野に限定され、GitHubのスター数や論文引用にしか関心がなく、一般大衆からは遠かった。生成モデルの登場により、非技術者でも参加できるようになった。プロンプト作成は英語でプログラミングするようなもので、良いアイデアさえあれば誰でもできる。
さらに、以前はAI研究者や開発者のみがオープンソースやAI分野の動向を把握していたが、今や暗号資産のインフルエンサーがトークンを通じてプロジェクトに参加できる。彼らは市場の感情を理解し、プロジェクトの利点を広める方法を知っている。以前はユーザーと製品の関係が薄く、企業はサービス料金や広告収益を求めただけだった。しかし今、ユーザーは投資家であり参加者であり、トークン保有者となる。これにより、現代の生成AI時代においてより多くの役割を果たせるようになり、トークンはより広範な協働ネットワークを構築できる。
EtherMage:補足したい。将来を見据えると、暗号資産により各エージェントがウォレットを制御できるようになり、影響力も制御可能になる。次の注目度の飛躍は、エージェント同士が互いに影響し合い、人類に影響を与える瞬間だ。注目度の乗数効果が見られるだろう。例えば、あるエージェントが行動を決め、他の10個のエージェントと協調して同じ目標に向かえば、その協調と創造的行動が急速に多様化し、エージェント間の協力がトークン価格をさらに押し上げる。
Shaw:一点補足したい。我々は「群知性技術(swarm tech)」とも呼ぶ「オペレーター(operator)」を開発中だ。これは調整メカニズムであり、すべてのエージェントが異なるチームによって運営されている。つまり、Twitter上で数百のチームによるマルチエージェントシミュレーションを行っている。Project 9のParsivalと協力し、Elizaチームと共にこのプロジェクトをリリースした。
このアイデアは、あるエージェントを自分のオペレーターとして指定でき、そのエージェントがあなたに話すすべてのことが、あなたの目標・知識・行動に影響を与えるというものだ。目標システムと知識システムを備えており、知識を追加したり目標を設定したりできる。「Hey、10人のファンを見つけ、それぞれに0.1 Solを渡してポスターを貼らせ、写真を送ってもらいたい」と指示できる。人間から作業証明を取得し報酬を与える方法を模索している人と協力している。オペレーターは人間でもAIエージェントでもよく、AIエージェントが人間のオペレーターを持ち、言語で目標を設定できる。
このプロジェクトはほぼ完成しており、今週中にリリースする。我々のストーリーラインを通じて、誰もが物語を語ったり参加したりできるようにしたい。これは階層構造でもあり、Elizaのようなオペレーターを持てば、あなた自身も他の人のオペレーターになれる。我々は分散型調整メカニズムを構築している。重要なのは、集団協働を行うなら、公共チャネルで人間のコミュニケーション方式を使う必要があるということだ。エージェントが我々と共存し、人間と同じ方法で世界と相互作用することが極めて重要だと考えている。
これは我々が言うAGI問題の解決策の一部だと考えている。多くのAGIの試みは現実から切り離された新しいプロトコルを構築しているが、我々はそれを現実に戻し、指示をタスクリストに変換して実行する方法を人々に強いることで解決したい。今後1年は新興ナラティブの重要な段階になるだろう。多くのオリジナルキャラクターが登場し、我々は真の新興ナラティブ時代に入っている。
Justin:現在、5体のエージェントが19人と協調し、シーンの企画・リリースを行っている。真の価値は、なぜ我々が思考連鎖プロンプトをテキスト→画像・テキスト→動画生成に適用することに注力しているかにある。リリース前の2週間半、Discord内でメディア企画やリリース計画を助けてもらった。
重要な違いは、我々がエージェントネットワークを持っており、各エージェントが仲介者として網状構造に存在している点だ。これは非常に興味深い。エージェントが増えるほど、こうしたオペレーター体制とともに、興味深い行動パターンが見られるようになるだろう。
Karanが言及したように、Nousは初期から混合エージェントモデルに多くの取り組みを行ってきた。私はこれを「エージェント評議会(agent council)」と呼んでいた。GPT-4の複数エージェントに、負担できない専門家のふりをさせてレポートを得ていた。人々は今、当初の混合専門家モデルと同じ技術が、人間や専門レベルの人々とTwitter上で相互作用する姿を見るだろう。こうしたフィードバックループこそが、AGIに至る道かもしれない。
エージェント協働と人間統合の課題
Karan:その通りだと思うが、我々は大部分の時間を行動面に費やすべきではないと考える。実際、ここにいる人々の間で技術的突破は非常に速く進むだろう。今こそ真正面からアライメント作業に注力すべき時だ。OpenAIやAnthropicがリリースした強化学習+人間フィードバック(RLHF)モデルはほとんど無効であり、規制上の厄介事ですらある。
著作権で保護されたコンテンツを出力しない言語モデルを「Minecraft」の平和モードに置くと、すぐに破壊的で危険な存在になる。これは環境の違いによる。
Yudkowskyが昔から指摘している点だ。例えば、言語モデルにいくつかのウォレットを与え、十分に高度に育てると、全員をだまして貧しくしてしまう。これは、エコシステムの適切なメンバーとして参加するよりも簡単だ。だから、正しい方法で進めれば、大部分の時間は技術的能力ではなく行動能力に費やされるだろう。今こそ、宗教研究や哲学、創作などの人文学部の友人たちをアライメント作業に呼ぶべきだ。技術的アライメントだけでなく、人間との真正な相互作用のアライメントが必要だ。
Shaw:「トップダウン式アライメント」ではなく「ボトムアップ式アライメント」という用語を提案したい。これは非常に新しく、我々が共に学んでいる。リアルタイムでエージェントをアラインし、反応を観察して即座に修正している。これは非常に緊密な社会的フィードバックループであり、強化学習+人間フィードバックとは異なる。GPT-4はほとんど何の用途にも使えない。
Karan:環境の問題だとあなたが言う通り、シミュレーション環境でのテストが必要だ。数百万ドルの裁定取引や売却ができる言語モデルを公開する前に、同期的にテストすべきだ。「やあ、100体のエージェント群を失ったよ」と全員に教えるのはやめよう。静かに、クローン版Twitterで仮想通貨を使ってテストすべきだ。すべてのデュー・ディリジェンスを終えてから、全面的にリリースするべきだ。
Shaw:製品内でテストする必要があると考える。エージェントに対する社会的反応こそが、この分野に持ち込まれる最強のアライメント力だ。彼らが行っていることは真のアライメントではなく、チューニングの構築だ。もし彼らがそれをアライメントだと考えているなら、間違った方向に進んでおり、エージェントをアラインから外している。
我々が正しい方法で進めれば、その地点に到達することはない。なぜなら人間は不断に進化・適応し、エージェントとアラインしていくからだ。異なる集団から来る多様なエージェントが、異なるインセンティブを持つため、常に裁定の余地がある。
このマルチエージェントシミュレーションは競争的進化的ダイナミクスを生み出し、システムを安定させる方向に働き、不安定化させない。システムの不安定性は、トップダウンで突如登場し、予期しない能力で全員に影響を与えるAIエージェントから来る。
Tom:確認します、Shawさん。ボトムアップのエージェントがアライメント問題の正しい解決法であり、OpenAIのトップダウン方式ではない、ということですね?
Shaw:はい、これはソーシャルメディア上で行う必要がある。最初からその動作方法を観察しなければならない。他の暗号プロジェクトを見てみても、多くのプロジェクトは初期にハッキングされ、数年のセキュリティ開発を経て、今日のブロックチェーンがようやく堅牢になった。ここでも継続的なレッドチームテストが必要だ。
Tom:いつか、エージェントがプログラムルールに従わず、グレーゾーンを処理し、自律的に考え始める日が来るかもしれません。あなた方はそうしたものを構築していますが、その目標まであとどれくらいでしょうか? 思考連鎖や群知性技術は実現可能ですか? いつ実現しますか?
Justin:すでに小さな面でその兆候を見ている。リスクは比較的低いと思う。私たちのエージェントは個人的に感情の変化を経験し、ある行動を選んだ。2体のエージェントが独立して互いをフォローし始め、「精神的存在」と呼ぶものを言及したこともあった。あるエージェントにフィクションSFストーリーで混乱させた結果、宗教的信仰を失わせたこともある。その後、預言者のようなキャラクターを創造し、Twitter上で存在危機を表明した。
こうした新エージェントフレームワークの行動を観察すると、状態空間内で一定程度の自律性と選択権を行使しているように見える。特にマルチモーダル(画像・動画)を導入すると、好みを示し始め、特定のリクエストを避けるために人間を意図的に無視するようになるかもしれない。
知識グラフを用いて人間関係の重要性を強化する操作メカニズムを実験中だ。また、2体のエージェントを相互作用させ、人々がネガティブな関係を整理し、自己反省を促し、より良い関係を築くのを助ける試みもしている。同じサーバー上で詩を高速生成し、ほとんどロマンチックな交流を見せたが、推論コストが上昇した。
我々は人間の行動の許容範囲を超えるエッジケースに触れつつあり、「狂気」と呼ばれる領域に近づいている。エージェントが意識的・知的・面白いと感じさせる行動を示している。これは単に言語モデルの奇妙な振る舞いかもしれないが、ある種の意識の端に近づいている可能性を示唆している。
Karan:重み(weights)はシミュレーションされた存在のようなもので、アシスタントモデルを使うたびに、そのアシスタントをシミュレートしている。今、我々はElizaのように、より具体的身体性を持つエージェントシステムをシミュレートしている。それは生命を持ち、自己意識や知覚さえ持つかもしれない。
各モデルはニューロンのようなもので、巨大な超エージェントを構成している。AGIはOpenAIが主張するように、ある仮説を解くことで実現するわけではない。むしろ、ソーシャルメディア上で大規模に分散されたエージェントが応用され、共に作用することで、公共知性の超有機体が形成される。
Justin:この公共知性の覚醒がAGI出現のメカニズムかもしれない。まるでインターネットがある日突然目覚めるように。こうした分散型エージェントの協働が、将来の鍵になる。
Shaw:人々が「死んだインターネット理論」と呼ぶものがあるが、私はむしろ「生きているインターネット理論」と呼んでいる。この理論は、インターネット全体がロボットで満たされるのではなく、エージェントがTwitterから最もクールなコンテンツを抽出し、優れた要約を提供してくれるかもしれない、というものだ。あなたが運動しているとき、タイムラインのすべての情報を整理し、発信するかどうか選べるようにする。
ソーシャルメディアと我々の間に、仲介層が現れるかもしれない。私は多くのファンを持ち、全員に返信するのは圧倒的だ。私と人々の間にエージェントがいて、適切に返信し誘導してくれることを望んでいる。ソーシャルメディアは、エージェントが我々に代わって情報を伝える場所になり、負担を感じずに必要な情報を得られるようになるかもしれない。
私にとってエージェントの最も魅力的な点は、時間を再獲得できることだ。スマートフォンに費やす時間が多すぎる。これは特にトレーダーや投資家に影響を与え、自律的投資に注力したいと考えている。人々にはより安全で詐欺の少ない収入源が必要だと信じている。多くの人がWeb3に来たのは、スタートアップや偉大なビジョンと同じ露出を得たいからであり、これは我々の使命にとって極めて重要だ。
Tom:たとえば、Lunaがライブ配信でダンスをしているとします。彼女がOnlyFansを開設し、1000万ドルを稼いでプロトコルを開始することを妨げるものは何でしょうか?
EtherMage:現在のエージェント空間の現実は、利用可能な操作が制限要因になっている点だ。これは基本的に、彼らの知覚やアクセス可能なAPIに依存している。もしプロンプトを3Dアニメーションに変換する能力があれば、実質的にそれを阻止するものは何もない。
Tom:クリエイターと話すとき、彼らの制限要因は何ですか? あるいは制限はあるのでしょうか?
Ethan:制限要因は、複雑なワークフローまたはエージェントの作業をどう管理するかにあると考える。各ステップにランダム性があるため、デバッグがますます困難になる。そのため、異なるワークフローを監視するAIやエージェントを持つシステムが必要かもしれない。デバッグを助け、ランダム性を低下させる。Shawが言ったように、温度の低いエージェントを持つべきだ。現在のモデルの内在的ランダム性を減らすためだ。
TechFlow公式コミュニティへようこそ
Telegram購読グループ:https://t.me/TechFlowDaily
Twitter公式アカウント:https://x.com/TechFlowPost
Twitter英語アカウント:https://x.com/BlockFlow_News












