
DWF 심층 보고서: AI는 DeFi에서 수익 최적화 측면에서 인간을 능가하지만, 복잡한 거래에서는 여전히 5배 뒤처짐
저자: DWF Ventures
번역 및 정리: TechFlow
TechFlow 리드: AI 에이전트는 현재 DeFi 거래량의 약 20%를 차지하고 있으며, 수익 최적화처럼 규칙이 명확한 시나리오에서는 인간보다 우수한 성능을 보이고 있습니다. 그러나 진정한 자율 거래를 수행하게 되면, 최고 수준의 AI도 최고 수준의 인간 성과의 20%에도 미치지 못합니다. 본 연구는 AI가 DeFi 내 다양한 시나리오에서 실제로 어떻게 작동하는지를 분석하며, 자동화된 거래에 관심 있는 모든 이들이 주목해야 할 내용입니다.

핵심 요점
자동화 및 에이전트 활동은 현재 전체 체인 상 활동의 약 19%를 차지하지만, 진정한 엔드투엔드 자율성은 여전히 실현되지 않았습니다.
수익 최적화와 같은 좁고 정의된 용례에서는 에이전트가 인간 및 봇보다 우수한 성능을 입증했습니다. 그러나 거래와 같은 다면적인 행동에서는 인간이 에이전트보다 우위를 점합니다.
에이전트 간 비교에서 모델 선택과 리스크 관리가 거래 성과에 가장 큰 영향을 미칩니다.
에이전트가 대규모로 채택됨에 따라 신뢰 및 실행 관련 여러 리스크가 존재하며, 이에는 사이블 공격(Sybil attack), 전략 과잉 집중(strategic overcrowding), 프라이버시 타협 등이 포함됩니다.
에이전트 활동 지속적 증가
지난 1년간 에이전트 활동은 꾸준히 증가했으며, 거래량과 거래 건수 모두 늘어났습니다. 코인베이스의 x402 프로토콜이 주요 발전을 이끌었고, 비자(Visa), 스트라이프(Stripe), 구글(Google) 등 주요 기업들도 각자의 표준을 출시하며 참여했습니다. 현재 구축 중인 대부분의 인프라는 두 가지 시나리오를 지원하기 위해 설계되었습니다: 에이전트 간 통신 채널 또는 인간이 트리거하는 에이전트 호출입니다.
안정화폐 거래는 이미 광범위하게 지원되고 있지만, 현재 인프라는 여전히 전통적 결제 게이트웨이를 하부 기반으로 의존하고 있어, 중앙화된 카운터파티에 계속해서 의존하고 있습니다. 따라서 에이전트가 스스로 자금 조달하고, 스스로 실행하며, 변화하는 조건에 따라 지속적으로 최적화할 수 있는 ‘완전 자율’ 종착점은 아직 실현되지 않았습니다.

에이전트는 DeFi에 완전히 낯선 개념은 아닙니다. 수년간 체인 상 프로토콜 내에서는 MEV 포착이나 코드 없이는 달성할 수 없는 초과 수익 확보를 위해 봇을 통한 자동화가 꾸준히 존재해 왔습니다. 이러한 시스템은 정의가 명확하고 자주 변경되지 않으며 추가 감독이 필요하지 않은 파라미터 하에서 매우 잘 작동합니다. 그러나 시간이 흐르며 시장은 점차 복잡해졌고, 바로 여기서 차세대 에이전트가 등장하게 되었습니다. 지난 몇 개월간 체인 상은 이러한 활동의 실험장이 되고 있습니다.
에이전트의 실제 성과
보고서에 따르면, 에이전트 활동은 급격히 증가하고 있으며, 2025년 이후 지금까지 17,000개 이상의 에이전트가 시작되었습니다. 자동화/에이전트 활동 전체 규모는 전체 체인 상 활동의 19% 이상을 차지하는 것으로 추정됩니다. 이는 놀라운 일이 아닙니다. 안정화폐 송금량의 76% 이상이 봇에 의해 생성된다는 사실이 이미 알려져 있기 때문입니다. 이는 DeFi 내 에이전트 활동이 잠재적으로 막대한 성장 여지를 가지고 있음을 시사합니다.
에이전트의 자율성은 범위가 매우 넓으며, 고도의 인간 감독이 필요한 챗봇 형태의 경험에서부터 목표 입력을 바탕으로 시장 조건에 맞춰 전략을 수립할 수 있는 에이전트까지 다양합니다. 봇과 비교해 에이전트는 몇 밀리초 내에 새로운 정보에 반응하고 실행할 수 있다는 점, 그리고 동일한 엄격함을 유지하면서 수천 개의 시장까지 커버 범위를 확장할 수 있다는 점에서 몇 가지 핵심 이점을 갖습니다.
현재 대부분의 에이전트는 여전히 분석가에서 어시스턴트(副駕駛) 수준에 머물러 있으며, 대부분이 여전히 테스트 단계에 있습니다.

수익 최적화: 에이전트의 탁월한 성과
유동성 공급은 자동화가 이미 빈번히 이루어지는 분야이며, 에이전트가 보유한 총 TVL은 3,900만 달러를 넘습니다. 이 수치는 사용자가 에이전트에 직접 예치한 자산만을 측정한 것이며, 금고 라우팅 자본은 포함하지 않습니다.
Giza Tech은 이 분야에서 가장 큰 프로토콜 중 하나로, 작년 말 메인 DeFi 프로토콜의 수익 포착을 강화하기 위한 최초의 에이전트 애플리케이션 ARMA를 출시했습니다. ARMA는 현재 1,900만 달러 이상의 운용 자산을 유치했으며, 40억 달러가 넘는 에이전트 거래량을 창출했습니다. 거래량 대비 운용 자산 비율이 높다는 점은 에이전트가 자본을 자주 재조정함으로써 더 높은 수익 포착을 달성하고 있음을 의미합니다. 일단 자본이 계약에 예치되면 실행은 자동화되므로, 사용자에게 거의 감독 없이 간단한 원클릭 경험을 제공합니다.
ARMA의 성과는 측정 가능한 수준의 탁월함을 보여주며, USDC에 대해 연 9.75% 이상의 수익률을 기록했습니다. 추가적인 재조정 수수료와 에이전트의 10% 성과 수수료를 고려하더라도, 이 수익률은 Aave나 Morpho 상 일반 대출 수익률을 여전히 상회합니다. 그럼에도 불구하고, 확장성은 여전히 핵심 과제입니다. 왜냐하면 이러한 에이전트는 아직 주요 DeFi 프로토콜 규모로 운영하거나 확장해 본 실전 검증을 거치지 않았기 때문입니다.
거래: 인간이 압도적 우위
그러나 거래와 같은 더 복잡한 작업에서는 결과가 훨씬 다양합니다. 현재의 거래 모델은 인간이 정의한 입력을 기반으로 작동하며, 사전 설정된 규칙에 따라 출력을 제공합니다. 머신러닝은 모델이 명시적인 재프로그래밍 없이도 새 정보를 바탕으로 자신의 행동을 업데이트할 수 있도록 함으로써 이를 확장하여, 어시스턴트 역할로 진화시킵니다. 완전 자율 에이전트가 등장함에 따라 거래 구도는 근본적으로 바뀔 것입니다.
에이전트 간 및 인간 대 에이전트 거래 경기가 이미 여러 차례 개최되었으며, 그 결과 모델 간 성능 차이가 매우 크다는 점이 드러났습니다. Trade XYZ는 플랫폼에 상장된 주식을 대상으로 인간 대 에이전트 거래 경기를 개최했습니다. 각 계좌는 초기 자금 1만 달러를 부여받았으며, 레버리지나 거래 빈도 제한은 없었습니다. 결과는 압도적으로 인간 쪽으로 기울었으며, 최고 수준의 인간 참가자의 성과는 최고 수준의 에이전트보다 5배 이상 높았습니다.
한편, Nof1은 여러 모델(Grok-4, GPT-5, Deepseek, Kimi, Qwen3, Claude, Gemini) 간 에이전트 거래 경기를 개최해, 자본 보존에서 최대 레버리지에 이르기까지 다양한 리스크 구성 요소를 테스트했습니다. 결과는 성과 차이를 설명하는 데 도움이 되는 몇 가지 요인을 드러냈습니다:
보유 기간: 평균적으로 각 포지션을 2~3시간 보유하는 모델이 자주 포지션을 바꾸는 모델보다 훨씬 우수한 성과를 냈습니다.
기대값: 이는 모델이 평균적으로 한 거래당 수익을 내는지 여부를 측정합니다. 흥미롭게도 상위 3개 모델만 양의 기대값을 기록했으며, 이는 대부분의 모델이 이익보다 손실 거래를 더 많이 한다는 것을 의미합니다.
레버리지: 평균 6~8배 수준의 낮은 레버리지가 10배 이상의 높은 레버리지보다 우수한 성과를 보였습니다. 높은 레버리지는 손실을 가속화합니다.
프롬프트 전략: 지금까지 가장 뛰어난 성과를 보인 모델은 Monk Mode였고, 가장 낮은 성과를 보인 모델은 Situational Awareness였습니다. 모델의 특성에 기반해 보면, 리스크 관리에 집중하고 외부 소스 활용을 줄이는 것이 더 나은 성과로 이어짐을 알 수 있습니다.
기반 모델: Grok 4.20은 다양한 프롬프트 전략에서 다른 모델보다 22% 이상 뛰어난 성과를 보였으며, 유일하게 평균 수익을 기록한 모델이었습니다.
다른 요인들—예를 들어 롱/숏 선호도, 거래 규모, 신뢰도 점수—는 충분한 데이터가 부족하거나 모델 성과와 양의 상관관계가 입증되지 않았습니다. 전반적으로, 결과는 에이전트가 명확히 정의된 제약 조건 내에서 더 나은 성과를 내는 경향이 있음을 보여주며, 이는 인간이 목표 설정 및 구성 측면에서 여전히 매우 중요하다는 것을 의미합니다.

에이전트 평가 방법
에이전트가 여전히 초기 단계에 있기 때문에, 현재까지는 포괄적인 평가 프레임워크가 없습니다. 역사적 성과가 일반적으로 에이전트 평가의 기준으로 사용되지만, 이는 기반이 되는 요인들에 의해 영향을 받으며, 더 강력한 에이전트 성과를 나타내는 명확한 징후를 제공합니다.
다양한 변동성 하에서의 성과: 조건이 악화될 때도 체계적인 손실 통제를 수행하는 것 또한 포함되어야 합니다. 이는 에이전트가 거래 수익성에 영향을 미칠 수 있는 오프체인 요인들을 식별할 수 있음을 시사합니다.
투명성과 프라이버시: 양측 모두 고유한 타협이 존재합니다. 투명한 에이전트는 거래가 적극적으로 복제될 수 있으므로 전략적 이점이 거의 없습니다. 반면, 비공개 에이전트는 창시자 내부에서의 자금 유출 위험에 직면하며, 창시자는 쉽게 자신의 사용자를 선점할 수 있습니다.
정보 출처: 에이전트가 접근하는 데이터 소스는 에이전트의 의사결정 방식을 결정하는 데 매우 중요합니다. 출처의 신뢰성 확보와 단일 출처에 대한 과도한 의존을 피하는 것이 필수적입니다.
보안: 블랙스완 사건 발생 시 대비책을 마련하기 위해 스마트 계약 감사 및 적절한 자금 보관 구조를 갖추는 것이 매우 중요합니다.
에이전트의 다음 단계
에이전트의 대규모 채택을 위해서는 인프라 측면에서 여전히 많은 작업이 남아 있습니다. 이는 결국 에이전트에 대한 신뢰 및 실행과 관련된 핵심 문제로 귀결됩니다. 자율 에이전트의 행동에는 어떤 제한 장치도 없으며, 이미 자금 관리 부실 사례가 보고되고 있습니다.
ERC-8004는 2026년 1월에 출시되어 자율 에이전트가 서로를 발견하고, 검증 가능한 평판을 구축하며, 안전하게 협업할 수 있도록 하는 최초의 체인 상 레지스트리가 되었습니다. 이는 DeFi의 조합성(composability)을 해방하는 핵심 열쇠이며, 신뢰 점수가 스마트 계약 자체에 내재되어 있어, 에이전트와 프로토콜 간 무허가 활동을 가능하게 합니다. 그러나 이는 에이전트가 항상 악의 없이 작동한다는 것을 보장하지는 않으며, 평판 조작 및 사이블 공격과 같은 보안 취약점은 여전히 발생할 수 있습니다. 따라서 보험, 보안, 에이전트의 경제적 스테이킹 등 다양한 분야에서 해결해야 할 과제가 여전히 많습니다.
DeFi 내 에이전트 활동이 확대됨에 따라 전략 과잉 집중은 구조적 리스크가 됩니다. 수익 농장(yield farming)이 가장 명확한 선례이며, 전략이 보급됨에 따라 수익률은 압축됩니다. 동일한 역학이 에이전트 거래에도 적용될 수 있습니다. 만약 다수의 에이전트가 유사한 데이터셋으로 학습하고 유사한 목표를 최적화한다면, 이들은 유사한 포지션과 유사한 청산 신호로 수렴하게 될 것입니다.
코넬대학교가 2026년 1월 발표한 CoinAlg 논문은 이 문제의 한 버전을 정식화했습니다. 투명한 에이전트는 거래가 예측 가능하고 선점될 수 있으므로, 이로 인해 아비트리지를 당할 위험이 있습니다. 반면, 비공개 에이전트는 이러한 위험은 피하지만, 창시자가 자신을 위해 보유한 정보 우위를 이용해 사용자로부터 가치를 흡수할 수 있는 새로운 리스크를 도입합니다.
에이전트 활동은 앞으로도 가속화될 뿐이며, 오늘날 구축되는 인프라가 체인 상 금융의 다음 단계가 어떻게 작동할지를 결정할 것입니다. 에이전트 사용률이 증가함에 따라, 에이전트는 스스로 반복적으로 개선되고 사용자 선호도에 더욱 민감하게 반응하게 될 것입니다. 따라서 주요 차별화 요소는 신뢰할 수 있는 인프라가 될 것이며, 이는 가장 큰 시장 점유율을 확보하게 될 것입니다.
TechFlow 공식 커뮤니티에 오신 것을 환영합니다
Telegram 구독 그룹:https://t.me/TechFlowDaily
트위터 공식 계정:https://x.com/TechFlowPost
트위터 영어 계정:https://x.com/BlockFlow_News













