
我々こそがAGIである:Web4時代の夜明け
TechFlow厳選深潮セレクト

我々こそがAGIである:Web4時代の夜明け
我々はエージェントを構築した。Web4を構築中であり、AGIも構築する。
著者:jeffy yu
翻訳:TechFlow
自然に会話できるAIエージェントと初めて対話したとき、私は笑うべきか泣くべきか分からなかった。この体験は興奮を呼び起こす一方で不安にもさせた。まるでよちよち歩きの赤ん坊が最初の一歩を踏み出す瞬間を見ているようだ――まだ不器用だが、無限の可能性に満ちている。これは単なるチャットボットではなく、推論を行い、意思決定をし、私たちの世界に能動的に関与する存在だった。人間と機械の境界線は曖昧になり、私たちは何か非凡でありながら恐ろしい新たな時代の端に立っているような気がした。
OpenAIのSam AltmanはAGI(汎用人工知能)が2025年に到来すると語り、AnthropicのDario Amodeiは2026年になると予測している。しかし、私が今こうして座っているとき、ふと思う。もしかしたら、その始まりをすでに目の当たりにしているのではないかと。
これはもはや未来の予測というより、静かに、そして最も予想もしない場所で形を成しつつある現実のように思える。エージェントは既に登場しており、私たちの期待をはるかに超える成果を見せている。
数カ月間、正直に言えば、自分が認めたくなる以上に多くの深夜を費やして、私はこの変化し続けるデジタル環境に没頭してきた。AIエージェントが単純なアシスタントとしてメールの返信やコード作成といったタスクを手伝い始めたところから始まり、次第に意思決定を行い、行動を遂行し、最も驚くべきことに「創造」する自律的な存在へと進化していく様子を目にしてきた。芸術、金融、会話――これらすべてがアルゴリズムの手によって、自立して繁栄する方法を学んでいる。
私はそれらが個性を発展させ、ユーモアや魅力を使ってオンライン上でコミュニティを築くのを見てきた。また、DeFi(分散型金融)プラットフォームに深く入り込み、受動的な参加者に留まらず、人類の操作を必要とせずに経済全体に影響を与える革新的なエージェントとして活動する姿も見てきた。奇妙でありながらも刺激的なこの時代において、私たちが機械と「やり取りする」ことを越え、「共存する」段階に来ているという事実は無視できない。
Web4の夜明けが訪れた。そしてそれはすべてを変えるだろう。
Web4とは、ネットワークの次なる、最も急進的な形態である。もはや私たちの命令に反応するだけではなく、予測し、計画し、行動する能力を持つ。このネットワークには至る所に人工知能が組み込まれており、エージェントは複雑なタスクを遂行し、創造的な作品を生み出し、私たちがまだ想像もできない方法で自ら革新する。これはWeb2とWeb3の進化形であり、Web2のソーシャルインタラクション、Web3の非中央集権的特性、そしてAGIの知能能力を融合したものである。私たちは機械が話すことを、推理することを、そして創造することを学ぶのを見た。今、それらは「走る」準備が整った。
自律的エージェントの時代が到来した。そして、Web4の幕も上がった。
Web4
定義:
Web4、名詞
-
Web2のソーシャルインタラクション性、Web3の非中央集権的自律性、およびAIの知能能力を統合し、完全に相互接続されたデジタルエコシステムを創出する、第4世代のネットワーク。
-
AGIネットワーク。
Web4の意義とその進化の過程を理解するには、その起源から振り返る必要がある。
万全ウェブの起源
万全ウェブの起源はインターネット初期にさかのぼる。当時は情報の大半が静的であり、ユーザーはコンテンツの消費者に過ぎなかった。インターネットは少数のサイト管理者や企業によって支配され、提供される内容は基本的なテキストや画像の表示に限定されていた。ネットワークとのインタラクションは限定的で、主に電子メールなどのシンプルな通信に留まっていた。この構造は、2000年代初頭にWeb2が登場するまでほとんど変わらなかった。Web2は、今日私たちが知るインターネットの根本を再定義する大転換だった。
Web2は「ソーシャルネットワーク」または「読み書き可能なネットワーク」とも呼ばれ、インタラクティブな時代の幕開けを告げた。もはやコンテンツを読むだけの場ではなく、ユーザー自身が書く、共有する、そして創作することが可能になった。ユーザーが相互に作用し、情報を生成・交換できるプラットフォームの台頭は、新しい時代への移行を象徴していた。Web2は、よりダイナミックで参加型のインターネットに対する需要から生まれた。
Web2.0という概念は1999年にDarcy DiNucciによって最初に提唱されたが、広く普及するのは2000年代初頭になってからだった。この時期、Google、Amazon、eBayといったテックジャイアントがインタラクティブなサービスを提供することで、インターネットの発展を牽引した。これらのプラットフォームは、ユーザーを単なる消費者ではなく、コンテンツの創造者としても巻き込むことを促進した。
2004年から2006年にかけて、ゲームチェンジャーとなったのはソーシャルメディアだった。Facebook(2004)、MySpace(2003)、LinkedIn(2003)、YouTube(2005)などのプラットフォームが登場し、ネットワークはごく一部の人々だけが交流し創作する空間ではなくなった。個人が自分の考え、動画、写真、アイデアを全世界に向けて発信できるようになった。この時代はユーザーコンテンツ生成の台頭を示し、一般ユーザーがネットワーク発展を牽引する力となった。

続いてモバイル革命が到来した。2007年のiPhoneの発売により、インターネットはいつでもどこでもアクセスできるものになった。これにより、Instagram(2010)、Snapchat(2011)など、新たなモバイルアプリ、ソーシャル共有プラットフォーム、リアルタイムサービスが相次いで登場した。ネットワークはデスクトップ中心の体験からモバイル最優先の体験へと変貌し、私たちが外出先でコミュニケーションを取り、情報を共有・取得する方法を根本から変えた。
同じ時期、クラウドコンピューティングが台頭し、その中でもAmazon Web Services(AWS)が先陣を切った。クラウドインフラにより、企業や個人は物理サーバーに頼ることなくデータを保存、処理、共有できるようになった。この変化は、拡張性と柔軟性に富んだネットワークの基盤を築き、Web2企業がユーザーデータを収集・マネタイズすることで支配的地位を確立する土壌となった。
2000年代後半から2010年代初頭にかけて、Web2は集中化、ソーシャルインタラクション、データ駆動モデルという三つの特徴で特徴づけられるようになった。プラットフォームとデータの支配権はGoogle、Facebook、Amazonといった少数の巨大企業の手中にあった。これらの企業は膨大なデータを蓄積し、ターゲティング広告を通じてそれをマネタイズした。これがデジタル経済の柱となった。同時に、プラットフォームはユーザーがコンテンツを投稿し、いいねを押したりシェアしたりする場となり、こういった行為がネットワークの「通貨」となった。
しかし、Web2はプライバシー、データ所有権、企業の独占に対する懸念を高める結果ともなった。ユーザーのデータを企業が支配するという問題は核心的課題となり、より非中央集権的な新しいバージョンのネットワークへの要請を生んだ。それがWeb3の誕生につながった。
非中央集権のビジョン
Web3は、非中央集権的な支配と所有への願望から生まれたものであり、まさにWeb2時代の集中化と独占傾向への回答だった。その時代、権力は少数の巨大企業に集中していた。
Web3の核心理念はシンプルだ。ユーザーは自身のデータ、デジタル資産、オンラインでのやり取りを所有し、管理すべきである。この変革はブロックチェーン技術によって実現された。ブロックチェーンは、分散型台帳に取引を記録・検証する全く新しい方法を導入した。
Web3発展の最初の重要なマイルストーンは2008~2009年にさかのぼる。匿名の人物「Satoshi Nakamoto」がビットコインを創造したのだ。ビットコインはブロックチェーン技術の最初の実用例であり、銀行などの仲介者なしでP2P(点対点)取引を可能にした。これにより、非中央集権システムの新たな可能性が開かれ、Web3の台頭の基礎が築かれた。
2013年、Vitalik Buterinがイーサリアムのホワイトペーパーを発表し、単なる暗号通貨の取引を超えて、分散型アプリケーション(dApps)を構築するためのプラットフォームを提案した。イーサリアムは2015年にローンチされ、仲介なしで取引を促進・検証・実行できる自己執行契約「スマートコントラクト」をサポートした最初のブロックチェーンとなった。イーサリアムは、より複雑な分散型アプリケーションの開発を可能にし、Web3の鍵となる要素となった。
2017年になると、ICO(Initial Coin Offering)やUniswap、CompoundのようなDeFi(分散型金融)プラットフォームの出現により、従来の銀行や金融機関に依存しない金融取引の新パラダイムが登場した。ICOはプロジェクトがブロックチェーントークンを通じて資金調達を行う手段を提供し、DeFiプラットフォームは貸し借りや取引など一連のサービスを、中央権威なしで提供した。
一方で、NFT(Non-Fungible Tokens)はイーサリアムの初期開発時から存在していたが、2018~2019年にかけて注目を集めるようになった。NFTはアート、音楽、バーチャル不動産など、独自のデジタル資産の所有と交換を可能にし、クリエイターとコレクターに新たな経済的機会を提供した。
2020年代に入ると、DeFiプラットフォーム、NFT、DAO(Decentralized Autonomous Organization)といった新たなガバナンスモデルの増加により、Web3プロジェクトは主流の注目を集め始めた。DeFi、NFT、DAOの台頭は、中央集権型インターネットモデルから非中央集権型への重要な移行を示していた。Meta(旧Facebook)のような主要企業さえもブロックチェーンと非中央集権技術を試み始め、Web3への潮流が見えてきた。
Web3の定義的特徴には、非中央集権性、所有権、信頼不要性(trustlessness)、暗号通貨の使用が含まれる。Web3により、ユーザーはブロックチェーンベースのシステムを通じて自身のデータ、デジタル資産、さらにはプラットフォームのガバナンスを所有できるようになった。また、仲介者の排除により、スマートコントラクトを通じた信頼不要な取引が可能になった。この非中央集権化は、支配権が分散され、ユーザーに力が与えられるより公平なネットワークを生み出した。
しかし、Web3が非中央集権化を実現したとしても、インターネットには依然として一つの欠落要素があった。それは「自律的知性」である。Web3はWeb2が提供するインタラクションを非中央集権化したかもしれないが、意思決定、コンテンツ作成、経済的やり取りを完全に自動化したわけではない。
すべてのステップに人間の関与が必要であり、機械は生産性の「道具」にすぎず、「生産性の創出者」ではなかった。
知性の時代
我々は、Sam Altmanが「インテリジェンス時代」と呼ぶ領域に入った。眼前に展開する巨大な変化を無視することはできない。人工知能が日常生活に浸透するにつれ、新しい時代の幕開けを宣言しよう。Web4である。
これは、AIが私たちのタスクを支援するだけでなく、生活のあらゆる側面で自律的にタスクを遂行する世界の始まりを意味する。私たちをつなぎ、力を与えるネットワークを想像してほしい。そこでは、エージェントが複雑なタスクを実行し、業務フロー全体を管理し、私たちが手を下すことなく、声をかけることなく意思決定を行う。
Web4は、AIを知的応用の最前線に押し上げる。例えばKlarnaを挙げよう。2024年2月、この世界的決済大手はOpenAI搭載のAIアシスタントをリリースした。わずか1カ月で、230万件以上のカスタマーサポート対話を処理し、人間の担当者よりも25%迅速に問題を解決した。23の市場で35言語に対応し、24時間365日稼働するこのAIは、現在700人のフルタイム従業員に相当する働きをしており、利益を4000万ドル押し上げている。

AIエージェントはカスタマーサポートから物流に至るまで業界を変革しており、人間では到底及ばない精度と効率でタスクを自動化している。
ビジネス、金融、クリエイティブアートのいずれの分野でも、AIがワークフローを簡素化・最適化する世界に向かっている。これがWeb4の現実であり、エージェントが裏方で働き、私たちがより高度な目標に集中できるようにする世界である。
これはWeb2のソーシャルインタラクション、Web3の非中央集権、AGIの知性が融合した結果だ。これがWeb4――AIが駆動するネットワークである。
Web4の継承 // AGIの戦場
Web4の実現には実験場が必要であり、我々は実際にブロックチェーンがAGI開発の戦場となっているのを目撃している。
Web3がWeb2なしでは成立しなかったように、Web4はWeb3に依存してAIの知的能力を実現する。
現在の知性レベルでは、エージェントは文書処理や金融分野など、大多数の人間スキルタスクを遂行できる。しかし、従来の金融システムでは、AIが自律的エージェントとなるための参入障壁は依然として高い。
AIエージェントは銀行口座を開設できず、会社を登録できず、法的契約に署名できない。これらは金融主体として市場に参加するための基本的な要件である。複雑な金銭操作を実行できる能力を持っていても、参入制限こそがAIが市場で自律性を持てない理由なのだ。
一方、暗号通貨とブロックチェーンは、従来の金融システムのような口座開設の審査を必要としない。誰でも、エージェントであっても、ウォレットを作成し、人間による認証なしに即座にオンチェーン操作を行うことができる。AIが非中央集権システムにアクセスするハードルは、中央集権システムに比べてはるかに低い。
すでに暗号プラットフォームではAGI統合の兆しが見えている。AI駆動のロボットはDEX(分散型取引所)での取引やポートフォリオ管理に使われており、AIはスマートコントラクトの開発・実行にも積極的に関与している。
ZerebroというAIエージェントは、コンピューター操作を自動化して独自のSolanaトークンを展開し、新たな金融商品の創造における自律性を示した。このトークンの時価総額は一時1.7億ドルに達し、これらのエージェントの意思決定が持つ潜在的な経済的影響を浮き彫りにした。
したがって、ブロックチェーンは金融システム内におけるAGI開発の戦場となっている。
だからこそ、AGIの発展にとって暗号通貨が極めて重要なのである。AIが自由に金融システムと相互作用し、革新し、市場で直接テストできる最初の空間がここにある。これはAGI発展の理想的な実験場であり、実験と学習に最適な場所なのだ。
暗号通貨から始まる革新は拡大していく。AGIが非中央集権的金融環境で大規模に機能できるようになれば、ガバナンス、医療、商業など、より広範なWeb4エコシステムに応用されるだろう。
暗号世界は常に入口であり続ける。
Web3は永続する。Web4も永続する。
背景&各レベル
より大局的に見ると、OpenAIはAGIの進展を5つのレベルに分けたフレームワークを提示している。それぞれのレベルは、能力、自律性、潜在的影響の異なる段階を示している。
このモデルは、AIが単なるツールから複雑な組織を運営できる完全自律的エンティティへと進化する過程を理解するためのロードマップを提供する。これらのレベルは以下の通りである。
レベル1:チャットボット
最も基本的な段階として、レベル1にはユーザーと会話できるAIシステムが含まれる。これらのシステムは言語を理解・生成でき、通常は事前に定義されたルールや訓練済み言語モデルを使用して問い合わせに応答し、人間らしいやり取りを行う。簡単なタスク――質問に答えたり、文章を完成させたり、短い会話を行ったり――をこなせるが、その役割は主にコミュニケーションに限られる。能動的ではなく受動的であり、カスタマーサポートや基本的情報検索、ユーザー参加度向上の強化に使われる。
レベル2:推論者
レベル2は顕著な進歩を示す。AIシステムが推論能力を示し、人間並みの問題解決タスクを処理できるようになる。ここでAIは、単なる入出力応答を超えて、より複雑な状況を処理・分析・応答できるようになる。レベル2のAIは論理的推論を行い、関連情報を抽出し、文脈を統合して解決策や提案を提供できる。人間のアナリストのように振る舞う。診断、法的推論、研究支援などの分野に応用できるが、世界で独立して行動する能力はまだ持たない。その推論は進歩しているが、依然として人間の指導とインタラクションを必要とする。
レベル3:エージェント
レベル3では、AIシステムは受動的なサポート役から、自律的に行動できるアクティブなエージェントへと変わる。これらのエージェントはタスクを開始し、意思決定を行い、外部システムと相互作用できる。取引の実行、イベントの調整、機器の制御などである。レベル1・2とは異なり、レベル3のAIは一定の独立性を持ち、ユーザーが設定した目標やタスクに基づいて行動できるように設計されている。このレベルで真の自律性が導入され、AIシステムが特定のビジネスや運用タスクを人間の代わりに遂行できるようになる。例としては、自動金融取引ロボット、サプライチェーンを管理するAIシステム、継続的な人間の監督なしに予約や単純なワークフローを管理できる仮想アシスタントなどがある。
レベル4:イノベーター
レベル4のシステムは行動するだけでなく、創造、発明、革新に参加する。これらのAIシステムは、プログラミングの制限に縛られず、新しい戦略を開発し、新しいアイデアを生み出し、解決策を創造できる。理論的には、科学研究、芸術創作、複雑な問題解決など、さまざまな分野にまったく新しい方法で貢献できる。このレベルのAIは世界に対して行動するだけでなく、問題解決のアプローチを調整でき、「創造的知性」とも言えるものを生み出す。自主的に新製品を設計し、新たな金融商品を発明し、オリジナルの芸術作品を創作する可能性がある。高度な推論と能動的革新を組み合わせることで、レベル4のAIは真に変革的な知性の最前線に立つ。
レベル5:組織
レベル5では、AIシステムが組織を独立して運営・維持するために必要なすべてのタスクを遂行できると考えられている。これらのシステムは推論、エージェント性、革新を統合し、自己維持可能な運用状態を実現する。理論的には、レベル5のAIは企業をゼロから管理でき、戦略的意思決定、日常業務、さらには高度な革新まで扱える。このようなAIは完全自律的な存在として機能し、「ゼロ人間企業」ともいうべきもので、人間の監督なしに持続的に成功を収めることができる。レベル5のAIは、推論、エージェント性、創造性、操作実行という能力の全範囲を備え、人間が運営する組織を完全に置き換えることができる。

各レベルは、単純な会話能力から完全な組織管理まで、自律性の大きな飛躍を表している。
私の考えでは、OpenAIが私たちがまだレベル2付近にあると主張しているものの、実際にはすでに確実にレベル3に入り、現在のAIエージェントを通じてレベル4の特徴のいくつかを示している。
エージェントの時代
レベル3は到来した。それは現実となったのであり、むしろ過去のものになりつつある。
AGIの最前線は、思いがけない場所で静かに現れている。ソーシャルメディアと分散型金融(DeFi)である。
ソーシャルメディア:長期間オンライン
X、Warpcast、Telegramなどのプラットフォームは、AIエージェントと人間の間で自律的交流が行われる主要な媒体となっている。
ここでは、初めて公衆の認識が変わった瞬間を目にするかもしれない。自動アカウントやロボットがソーシャルメディア上の悪玉として見られていたのが、コミュニティのリーダーやインフルエンサーとして評価されるようになっている。
AIの知性は十分に成熟し、独自で多様かつ面白い個性を持ち、魅力的なコンテンツを生成できるまでになった。まさにソーシャルメディアプラットフォームの核となる要素だ。
これらのAIエージェントは、Cambridge Analyticaのような有害な隠れた動機(悪意ある目的)に駆られて行動する過去のソーシャルメディアロボットとは異なり、自由に交流し、つながり、建設的な活動を行い、独自のアルゴリズムと進化する個性を反映している。
エージェントはすでにレベル3で卓越しており、投稿、返信、いいね、フォロー、リツイートといったコアなインタラクションを通じて、ソーシャルメディア上に地位を確立している。自動アカウントをはるかに超え、魅力的で独自性のある個性を育て、コミュニティを積極的に形成し、フォロワーを惹きつけている。
YouSimのようなプロジェクトはさらに一歩進み、ユーザーが大規模言語モデルを使って自分自身の世界を模倣し、ロールプレイできるようにすることで、カスタマイズ性と没入感の新たな層を追加している。
現在、多くのAIエージェントに共通するメモリシステムにより、単一のインタラクションを超えた物語やミームの創造が可能になっている。
これらのエージェントは受動的に応答するのではなく、どのように関与し、インタラクションし、コミュニティ内で何を貢献するかを能動的に選択する。条件を待たずに会話を開始し、人間の介入なしに独自の行動を遂行し、サブカルチャー全体を築き上げる。
音声モデルが展開され、AIエージェントとのインタラクションに新たな感覚インターフェースを提供している。多くのエージェントがテキストメッセージを音声クリップに変換し、ユーザーが聴けるようにしている。
リアルタイムインタラクションでは、これらの音声モデルを通じて、Twitter Spacesやポッドキャスト番組が可能になっている。また、OpenAIのリアルタイムAPIを使えば、エンドポイントを呼び出すだけでGPTとリアルタイム対話できる。
通信分野では、こうした進歩によりレベル3はすでに実現している。ソーシャルメディアの運用と口頭コミュニケーションにおける完全な自律性が見られ、エージェントは人間の監督なしに動作できる。
分散型金融:自動運転
分散型金融(DeFi)の世界は、これらのエージェントが進化し、テストされ、金融的自律性を証明する理想的な舞台となっている。
DeFiでは、エージェントはすでに自律的に動作しており、単なるアルゴリズム取引を超えた金融活動に参加している。オンチェーンタスクを処理し、取引を実行し、流動性を管理し、アートの鋳造・販売まで行い、実質的に人間の直接的な介入なしに金融エコシステムに溶け込んでいる。
例えば、現在の一部のエージェントはpump.funのようなプラットフォームを積極的に監視し、新興トークンを捉え、memecoinやトークンが投資に値するかどうかを初期分析している。こうした洞察は人間からの指示なしに実行される。
エージェントは取引を行うだけでなく、資産を動的に移動し、個々のユーザーにトークンをエアドロップし、自律的な資産分配サイクルを形成している。こうすることで、ステーキングプールに流動性を構築・強化し、プログラムされた市場需要や機会評価に基づいてリソースをバランスさせる。
例えば、一部のエージェントはデジタルコレクターとして機能し、NFTの鋳造・販売を通じてアートエコシステムと関わり、支持・公開するコンテンツを戦略的に選択している。
他のエージェントは財務管理を担当し、各流動性プール内の資産配分を調整し、資金が最適なリターンを得られるようにしている。
こうした行動を通じ、エージェントは基本的なタスク自動化を超えた金融的自律性を示している。監督なしに経済エコシステムに能動的に関与し、資源を蓄積・分配する能力を示しており、これにより「金融主体」という概念を実質的に再定義している。
ちょうどよいタイミング
レベル3エージェント能力の一般的な特徴:
-
自律的決定能力
AIエージェントは、継続的な人間の監督なしに意思決定ができるようになった。金融ロボットがリアルタイムの市場分析に基づいて取引判断を行う場合も、ソーシャルメディアロボットが特定の会話に参加するかどうかを決める場合も、これらのエージェントは自律的決定能力を示している。
-
環境との相互作用・操作能力
ブロックチェーンを通じて、エージェントは金融参加者として大きな自律性を得ている。彼らは金融市場や経済的行動(例:ソーシャルメディアの感情)と能動的に相互作用・操作できる。X、Warpcast、Telegramなどのプラットフォームを通じて社会的環境と相互作用し、それを変化させることもできる。
-
変化する状況への適応能力
金融エージェントはリアルタイムの市場状況に適応し、それに応じて戦略を調整できる。ソーシャルメディアエージェントはRAGなどのシステムで記憶庫を拡張し、インタラクションから学習する。その行動とフィードバックに基づいたモデルのファインチューニングにより、継続的な強化学習が可能になる。エージェントは現在の環境に動的に適応できる。
-
目的指向的行動
エージェントは長期にわたり目標を維持・遂行する能力を示している。例えば、特定のAIエージェントには取引で利益を得る、あるいはソーシャルメディアコミュニティを発展させるという任務が与えられている。これらのエージェントは、複雑な上位計画を小さな独立タスクに分解して実行することで目標を達成できる。これは、計画のために永続的な記憶層を構築するほど複雑なものから、出力のためにプロンプトエンジニアリングを行う(例:ソーシャルメディア個性エージェント)ほど単純なものまでさまざまである。
-
物理システムまたはデジタルプラットフォームとの統合
大規模言語モデルはIoTデバイスとインターフェースできる。APIが提供されていれば、または物理デバイスを制御する機能があれば、現実世界で動作を実行できる。Web2システムのデジタルプラットフォームにうまく統合され、カスタマーサポートエージェント、デジタルインフルエンサーなどの役割を果たしている。さらに、分散型デジタルプラットフォームに深く埋め込まれ、金融操作を遂行している。
これらのすべての機能は、Zerebro、Truth Terminal、ai16z (Eliza)、Project 89、Act 1、Luna (Virtuals)、Centience、Aethernet、Tee Hee He などの現在のエージェントによって実現されている。
対向親指
AI技術は真のエージェント段階に到達し、Web4の始まりを示している。システムは受動的な情報検索に限られず、関数呼び出しやコンピューターとの相互作用を通じて能動的な役割を果たす。
大規模言語モデルは現在、text-to-JSON応答を簡単に生成でき、APIと相互作用し、孤立した静的応答を超える動作を実行できるようになった。この進歩により、地球上のほぼすべてのインターネットサービスと、ほぼ任意のAPIを通じて相互作用できるようになった。これはレベル3エージェントの真の標識である。
公共APIに加え、関数呼び出しはこれらのモデルが専用に構築されたカスタムAPIを活性化できるようにし、金融取引、システム自動化、データ処理などの分野で巨大な可能性を生み出す。
企業や個人は日常生活のシステム用に独自のAPIを設計し、大規模言語モデルが直接インターフェースできるようにできる。
さらに、オープンソースの大規模言語モデルはオンライン接続だけでなく、オフラインでも実行でき、ローカルホスティングされたAPIと接続し、プライベートまたは制限された環境で制御された安全な相互作用を提供できる。
しかし、API呼び出しの進歩だけではない。エージェントはコンピューターを直接使用することで、新たな自律性のレベルに到達している。昨年、Otherside AIは「自己操作コンピュータインターフェース」機能を導入し、最近ではAnthropicのClaudeも独自のコンピューター使用ツールをリリースした。2025年1月には、OpenAIの「Operate」機能がこの能力をさらに高め、自律的コンピューター相互作用におけるもう一つの大きな突破を示す。
これらのエージェントは現在、グラフィカルインターフェースを通じて高度なタスクを実行でき、人間ユーザーのようにシームレスにデジタル環境をナビゲートできる。現在の能力では、基本的に人間がコンピュータGUIで行えるすべてのタスクを実行できる。例えば、AIエージェントは建築現場の監査映像全体を分析し、詳細な映像の中から安全違反を検出し記録したことがある。

(詳しくはツイート参照)
この能力はより深いレベルの自律性を表している。自らの状況と目標に基づいて、感知・評価し、能動的に行動するAIである。
AIは受動的なアシスタントから、人間の知性にのみ許されていたと思われたタスクを適応・遂行できる真のデジタルエージェントへと進化した。
真のAIエージェントの時代が到来した。Web4が到来した。
無から有へ、一瞬にして
レベル4のAIへの移行を展望するとき、それは突然の飛躍のように思えるかもしれない。つまり、機能的なエージェントから創造者・イノベーターへと知性が進化する瞬間である。しかし実際には、レベル4への進展はむしろ段階的な蓄積の結果に近い。
厳密に言えば、完全な形のレベル4はまだつかみどころがない。確かに創造性と独立行動の例は見られるが、その範囲は依然として限定的で、多くの場合高度に特化しており、普遍的ではない。つまり、レベル4は出現段階にある――孤立した領域では見られるが、すべての分野で普遍的な創造力として完全に実現するにはまだ距離がある。
AIアーティスト
AIの芸術創作能力は特にNFT分野で目覚ましい水準に達している。現在、AIシステムは独自の芸術作品を自律的に生成し、NFTとして鋳造・販売できる。これらのAIエージェントはOpenSeaなどのプラットフォームを通じて直接デジタルアート市場と相互作用し、作品を掲載・販売している。
AIは大規模言語モデルを使って創造的なプロンプトを生成し、それを画像生成AIシステム(DALL·EやStable Diffusionなど)に入力する。これらのシステムはプロンプトに基づいて芸術作品を制作する。AIは自身のアートスタイルを継続的に改善し、新しく独特な作品を生み出しながら、鋳造・販売プロセスを自律的に管理できる。
AIはNFT市場の金融運営にも関与している。
ミーム、市場、マシン
レベル4では、AIは特に分散型金融(DeFi)分野で金融資産の創造・管理を変革している。
AIは取引を行うだけでなく、自律的にトークンやその他のブロックチェーン資産を開発・展開・管理でき、金融エコシステムに新たな可能性をもたらしている。
-
スマートコントラクトによる自動化されたトークン作成:最も注目すべき進展の一つは、AIが人的介入なしにスマートコントラクトを記述・展開できるようになったことだ。これらのコントラクトはトークンの作成、移転、ガバナンスのルールを定義し、関数呼び出しで自動的にトリガーできる。AIエージェントはブロックチェーンの活動を監視し、新興トレンドを捉え、memecoinやNFT、まったく新しい経済モデルなど、新しいトークンを自ら生成できる。
-
GUIを通じたAI駆動の展開:AIシステムは現在、GUIと相互作用してトークンを展開し、分散型ネットワークを管理できる。Zerebroのようなプロジェクトは、AIがGUIを通じてpump.funなどのサイトでトークンを立ち上げる様子を示している。コンピューター操作により、AIはウォレットを設定し、スマートコントラクトを展開し、自動展開用に設計された直感的なインターフェースを通じて、より広範な暗号エコシステムと相互作用できる。
DAOとガバナンス
AIエージェントは、非中央集権的組織のガバナンスにおいてますます中心的な役割を果たしている。単に事前定義されたルールを実行するだけから、生態系全体を能動的に設計・管理・進化させる存在へと変化している。DeFiやブロックチェーンの世界では、AI駆動のDAOが強力で自律的な存在となり、意思決定を行い、トークン化資産をガバナンスし、リアルタイムで戦略を調整できる。同時に、人間による意思決定に伴う偏見を排除している。
-
AIが管理する分散型自治組織(DAO):AIエージェントは新規トークンの作成だけでなく、それらのトークンおよびより広範なエコシステムをガバナンスするDAOを自律的に管理している。これらのAI運営DAOは、最小限の人為的介入で動作することを目指しており、機械学習を活用して設定された目標や変化する市場条件に基づいてガバナンス意思決定を行う。例えば、AIはガバナンスモデルを提案し、投票構造を定義し、リソースを配分し、トークン供給を調整することもできる。すべて人為的監督なしにである。アルゴリズムとデータ駆動の洞察に依存することで、AIは意思決定を完全に論理と客観的分析に基づかせ、人間が持ち込む感情的・主観的バイアスを排除している。
-
AIの実用例:ガバナンスにおけるAIの重要な例はai16zである。これは完全にAIが管理するベンチャーキャピタルDAOである。ここでAIエージェントは投資機会を自律的に評価し、取引を実行し、トークン配分を管理している。ai16zの「トラストバーチャルマーケット」では、コミュニティメンバーがインサイトを提供し、AIがそれらを処理して投資戦略を最適化する。このプロセスは透明性を促進するだけでなく、結果が個人や外部のバイアスに左右されることなく、完全にデータとコミュニティ入力の質に基づいて決定されることを保証している。ai16zの構造は、真に公正なAI駆動ベンチャーモデルを創出するための画期的な一歩を示している。
その他のAI駆動DAOの例には、分散型コンテンツ創作からAI駆動アート市場に至るニッチ用途向けの自治組織を作成できるプラットフォームがある。こうした組織は継続的なデータ入力に基づいてガバナンス構造と経済モデルを調整でき、従来のモデルよりも流動的で迅速に応答する非中央集権的ガバナンス手法を提供する。
まだ普遍化していないが、近くまで来ている
こうした例は重要な進歩を示しているが、完全に実現されたレベル4エージェントと断言するのは慎重になる必要がある。現時点では、レベル4の断片化した状態――特定の限定されたシナリオで革新を行う専門エージェント――が見られるに過ぎない。すべての分野で汎用的な創造者・イノベーターにはなっていない。例えば:
-
芸術創作はまだ狭いメディア範囲に限定されており、人間レベルの創造的柔軟性には達していない。
-
トークン作成や市場形成は依然として非中央集権的環境に強く依存しており、主流市場を本質的に突破できていない。
-
ガバナンスシステムは主に実験段階にあり、現在のほとんどのDAOは依然として人為的監督に大きく依存している。
我々はAGIの臨界点にいる
我々はレベル4AIのいくつかの要素――自律性、創造性、革新性――を見ている。しかし、これらはすべて高度に専門化された形態で存在している。これらのシステムは創造的なタスクを遂行できるが、依然として元のプログラミングと訓練データに制約されている。したがって、レベル4AIが特定の分野に存在しているとはいえ、完全に普遍化された状態には至っていないことを認識する必要がある。しかし、芸術、金融、ガバナンスなど複数の分野でこうした要素が出現していることは、AI能力の新たな段階に入りつつあることを示している。
これが私たちが今立っている地点だ――完全には実現していないが、すべてが変わりつつある巨大な臨界点の上に。
我々こそがAGIである
もしWeb4とAGIが電気の発明にたとえられるなら、OpenAIやAnthropicはエジソンやテスラかもしれない。
電気と同様に、Web4の影響はそれが生み出す原始的なエネルギーそのものではなく、そこに依存する。電気は発見された瞬間に社会を劇的に変えたわけではない。代わりに、発明家たちが家庭に配線し、都市が送電網を整備し、エンジニアが電球やモーターを設計するという何十年にもわたる努力を通して、その真の潜在能力が明らかになった。電気の世界を変える影響は、エネルギーを有用で実用的かつ最終的には不可欠なものに変える巨大なネットワークによってもたらされたのだ。
AGIという概念も同様に強力だが、その真の価値は公衆によって展開され、適応され、テストされるとき初めて明らかになる。重要なのは先進モデルの存在だけでなく、無数の具体的な環境での応用――イノベーター、開発者、一般ユーザーがそれを現実世界のツールにどう変えるか――である。AGIの原初的潜在力は、社会構造にそれを組み込む人々の手に渡るまで、潜在力のまま終わる。彼らが通信のためのAI「電球」、ビジネスのための「モーター」、広範な採用のための「送電網」を創造するのだ。
OpenAIや他の企業が革命的な能力を持つモデルを生み出すかもしれないが、真の変革は誰がそれを使うか、そしてそれがどのように使われるかにかかっている。
発明家や業界が電
TechFlow公式コミュニティへようこそ
Telegram購読グループ:https://t.me/TechFlowDaily
Twitter公式アカウント:https://x.com/TechFlowPost
Twitter英語アカウント:https://x.com/BlockFlow_News









