
DWF深度報告:AIはDeFiにおけるリターン最適化において人間を上回るが、複雑な取引では依然として5倍の遅れを抱える
TechFlow厳選深潮セレクト

DWF深度報告:AIはDeFiにおけるリターン最適化において人間を上回るが、複雑な取引では依然として5倍の遅れを抱える
エージェント活動は今後さらに加速するのみであり、今日構築されるインフラストラクチャが、チェーン上金融の次の段階の動作方法を決定する。
著者:DWF Ventures
編集・翻訳:TechFlow
TechFlow解説:AIエージェントはすでにDeFiにおける取引量の約5分の1を占めており、収益最適化といったルールが明確に定義されたユースケースでは、人間による運用を上回るパフォーマンスを発揮しています。しかし、実際に自律的な取引を任せる場合、トップクラスのAIエージェントの成績は、トップクラスの人間の成績の5分の1にも満たないという結果が出ています。本レポートでは、AIがDeFiのさまざまなシナリオでいかなる実際のパフォーマンスを示すかを詳細に分析しており、自動化取引に関心を持つすべての関係者が一読すべき内容です。

主なポイント
自動化およびエージェント活動は、現在すべてのチェーン上活動の約19%を占めていますが、真のエンドツーエンドの自律性はまだ実現されていません。
収益最適化などの狭く、明確に定義されたユースケースでは、エージェントが人間やボットを上回るパフォーマンスを示しています。一方、取引といった多面的かつ複雑な行動では、人間のパフォーマンスがエージェントを上回ります。
エージェント同士の比較では、採用するモデルの選択とリスク管理が取引パフォーマンスに最も大きな影響を与えます。
エージェントの大規模な導入が進むにつれ、信頼性および実行に関する複数のリスクが浮上します。これらには、サイビア攻撃(Sybil attack)、戦略の過密化(strategy crowding)、およびプライバシーとのトレードオフが含まれます。
エージェント活動の継続的成長
過去1年間にわたり、エージェント活動は着実に増加しており、取引量および取引件数ともに伸びています。コインベースのx402プロトコルが重要な進展を牽引しており、Visa、Stripe、Googleといった主要企業も独自の標準を発表しています。現在構築中のインフラの大部分は、以下の2つのユースケースを支援することを目的としています:①エージェント間の通信チャネル、および②人間によってトリガーされるエージェントの呼び出し。
ステーブルコイン取引はすでに広範にサポートされていますが、現行のインフラは依然として従来型のペイメントゲートウェイを基盤としており、つまり中央集権的なカウンターパーティーに依存していることを意味します。このため、エージェントが自己資金調達・自己実行を行い、変化する条件に応じて継続的に最適化できる「完全自律」の最終状態は、いまだ実現していません。

エージェントはDeFiにとってまったく新しい存在ではありません。長年にわたり、MEVのキャプチャやコードなしでは得られない超過剰収益の獲得といった目的で、チェーン上のプロトコル内にボットによる自動化が存在してきました。こうしたシステムは、頻繁に変化せず、追加の監視を必要としない明確に定義されたパラメータ下で非常に良好に機能します。しかし、市場は時間とともにさらに複雑化しています。このような背景から、次世代のエージェントが登場し、ここ数ヶ月の間にチェーン上はまさにその実験の場となっています。
エージェントの実際のパフォーマンス
報告書によると、エージェント活動は指数関数的に増加しており、2025年以降に立ち上げられたエージェントは17,000以上に達しています。自動化/エージェント活動の総量は、全チェーン上活動の19%超を占めると推定されています。これは驚くべきことではなく、ステーブルコイン送金の76%以上がボットによって生成されていると推定されているためです。これは、DeFiにおけるエージェント活動が今後さらに大きく拡大する余地を示唆しています。
エージェントの自律性には幅広いスケールがあり、高度な人間の監視を必要とするチャットボット型の体験から、目標入力に基づいて市場の状況に応じた戦略を自ら立案できるエージェントまで多様です。ボットと比較して、エージェントにはいくつかの重要な利点があります。たとえば、新規情報に対してミリ秒単位で即座に応答・実行できること、また厳格さを保ちつつ数千のマーケットへ対応範囲を拡大できることなどです。
現時点では、大多数のエージェントは依然として「アナリスト」または「副操縦士(co-pilot)」レベルにとどまっており、多くはまだテスト段階です。

収益最適化:エージェントが優れた成績を収める分野
流動性提供は、すでに自動化が頻繁に行われている領域であり、エージェントが保有する総TVL(Total Value Locked)は3,900万ドルを超えています。この数字は、ユーザーが直接エージェントに預け入れた資産のみを測定したものであり、金庫経由でルーティングされた資本は含まれていません。
Giza Techはこの分野で最大規模のプロトコルの一つであり、昨年末に主要DeFiプロトコルの収益獲得能力を強化する初のエージェントアプリケーション「ARMA」をリリースしました。ARMAは1,900万ドルを超える資産を管理し、40億ドル以上のエージェント取引量を生み出しています。取引量と管理資産総額の比率が非常に高いことは、エージェントが頻繁に資本の再配分(リバランス)を行っていることを示しており、それによりより高い収益獲得が可能になっています。一度資本がコントラクトに預けられれば、その後の実行は自動化されるため、ユーザーにはほぼ監視不要のワンクリック体験が提供されます。
ARMAのパフォーマンスは測定可能なほど優れており、USDCに対して年率9.75%を超えるリターンを実現しています。再配分手数料およびエージェントの業績報酬(10%)を考慮しても、AaveやMorphoにおける通常の貸付金利を上回っています。ただし、スケーラビリティは依然として重要な課題であり、これらのエージェントは、主要DeFiプロトコルの規模での運用・拡張を実戦で検証されていません。
取引:人間が圧倒的に優位
しかし、取引のようなより複雑な行動においては、結果ははるかに多様化しています。現在の取引モデルは、人間が定義した入力に基づき、事前に設定されたルールに従って出力を生成する方式で動作しています。機械学習は、モデルが明示的な再プログラミングを必要とせずに新たな情報をもとに自身の行動を更新できるようにすることで、これを「副操縦士」レベルへと拡張します。完全自律型エージェントの参入により、取引の構図は劇的に変化することになります。
既に、エージェント同士および人間 vs エージェントの取引コンペティションが開催されており、その結果、モデル間で大きな差異が確認されています。Trade XYZは自社プラットフォームに上場する銘柄について、人間 vs エージェントの取引コンペティションを開催しました。各口座には1万ドルの初期資金が与えられ、レバレッジや取引頻度に制限はありませんでした。結果は圧倒的に人間に有利であり、トップクラスの人間のパフォーマンスはトップクラスのエージェントの5倍以上に達しました。
一方、Nof1は複数のモデル(Grok-4、GPT-5、Deepseek、Kimi、Qwen3、Claude、Gemini)を相互に競わせるエージェント取引コンペティションを開催し、資本の保全から最大レバレッジまで、異なるリスク配分をテストしました。その結果、パフォーマンス差異を説明するいくつかの要因が明らかになりました:
ポジション保有期間:平均して2~3時間ポジションを保有するモデルは、頻繁にポジションを反転させるモデルよりも大幅に優れているという強い相関関係が確認されました。
期待値(Expectancy):これは、モデルが1取引あたり平均して利益を上げているかどうかを測る指標です。興味深いことに、上位3モデルのみが正の期待値を示しており、他の大多数のモデルは損失を出す取引の方が利益を出す取引よりも多いことが分かりました。
レバレッジ:平均6~8倍の低いレバレッジ水準は、10倍を超える高レバレッジで運用するモデルよりも優れたパフォーマンスを示しました。高水準のレバレッジは損失を加速させてしまうことが判明しました。
プロンプト戦略:これまでのところ、「Monk Mode」が最も優れたパフォーマンスを示し、「Situational Awareness」が最も劣っていました。モデルの特徴に基づくと、リスク管理に焦点を当て、外部情報源への依存を減らすことで、より良いパフォーマンスが得られることが示唆されています。
基盤となるモデル:Grok 4.20は、異なるプロンプト戦略において他モデルを22%以上上回るパフォーマンスを示し、唯一の平均利益を達成したモデルとなりました。
その他、ロング/ショート志向、取引規模、信頼度スコアといった要因については、十分なデータが得られなかったか、あるいはモデルのパフォーマンスとの有意な正の相関が確認されませんでした。全体として、結果はエージェントが明確に定義された制約内ではより良いパフォーマンスを発揮することを示しており、人間による目標設定が引き続き極めて重要であることを意味しています。

エージェントの評価方法
エージェントは依然として初期段階にあるため、現時点では包括的な評価フレームワークは存在しません。歴史的パフォーマンスはしばしばエージェント評価のベンチマークとして用いられますが、それは基礎的要因に左右されるため、真に優れたエージェントのパフォーマンスをより強く示す指標が必要です。
異なるボラティリティ下でのパフォーマンス:条件が悪化した際にも規律ある損失管理を行う能力を含む点が重要です。これは、エージェントが取引の収益性に影響を与えるオフチェーン要因を認識できるかどうかを示す指標となります。
透明性とプライバシー:どちらにもそれぞれのトレードオフがあります。透明性の高いエージェントは、取引が容易に模倣可能になるため、戦略的な優位性を維持できません。一方、非公開のエージェントは、作成者による内部からの価値抽出(internal extraction)リスクを抱え、作成者が自らのユーザーを簡単にフロントランニング(先行取引)することが可能です。
情報源:エージェントがアクセスするデータソースは、その意思決定プロセスを規定する上で極めて重要です。情報源の信頼性を確保し、単一ソースへの過度な依存を回避することが不可欠です。
セキュリティ:スマートコントラクトの監査および適切な資金保管アーキテクチャを備えることで、ブラック・スワン事象発生時にもバックアップ体制が整うことが重要です。
エージェントの今後の展望
エージェントの大規模な採用を実現するためには、インフラストラクチャー面でまだまだ多くの課題が残されています。これは、エージェントに対する「信頼」と「実行」を巡る核心的な問題に集約されます。自律型エージェントの行動には制限がなく、既に資金管理の不備事例が報告されています。
ERC-8004は2026年1月に導入され、自律型エージェントが互いに発見・検索可能になり、検証可能な評判を構築し、安全に協働できる初めてのチェーン上レジストリとなりました。これはDeFiの「コンポーザビリティ(組み合わせ可能性)」を実現する鍵となるブレイクスルーであり、信頼スコアがスマートコントラクト自体に埋め込まれているため、エージェントおよびプロトコル間のパーミッションレスな活動が可能になります。ただし、これはエージェントが常に悪意のない形で動作することを保証するものではなく、評判の共謀やサイビア攻撃といったセキュリティ上の脆弱性は依然として存在します。そのため、保険、セキュリティ、エージェントの経済的ステーキング(経済的担保)など、さらなる対策の整備が求められています。
DeFiにおけるエージェント活動の拡大に伴い、「戦略の過密化(strategy crowding)」が構造的なリスクとして浮上しています。収益ファーム(yield farming)が最も明確な先例であり、戦略の普及に伴いリターンは圧縮されていきます。同様のダイナミクスがエージェント取引にも適用される可能性があります。多数のエージェントが類似したデータセットで学習し、類似した目標を最適化しようとすると、それらは類似したポジションおよび類似したエグジット(決済)サインに収斂してしまうでしょう。
コーネル大学が2026年1月に発表した論文「CoinAlg」は、この問題の一つの形式化を正式に提示しています。透明性の高いエージェントは、その取引が予測可能であり、フロントランニングされやすいという点でアービトラージの対象となります。一方、非公開のエージェントはこのリスクを回避できますが、代わりに作成者がユーザーに対して情報優位性を保持し、本来プライバシー保護のために設計された不透明性を利用して内部知識から価値を抽出するという別のリスクを抱えることになります。
エージェント活動は今後さらに加速していくばかりです。今日築かれているインフラは、チェーン上金融の次のフェーズがどのように機能するかを決定づけるでしょう。エージェントの利用が拡大すれば、それらは自己反復(self-iteration)を繰り返し、ユーザーの嗜好に応じた適応力も高まっていきます。したがって、今後の主要な差別化要因は、信頼できるインフラに集約されることになり、それが最大のシェアを獲得することになるでしょう。
TechFlow公式コミュニティへようこそ
Telegram購読グループ:https://t.me/TechFlowDaily
Twitter公式アカウント:https://x.com/TechFlowPost
Twitter英語アカウント:https://x.com/BlockFlow_News













