
에이전트의 시대: AI와 크립토의 대결과 공생
작성: Zeke, YBB Capital 리서처

일, 주의력의 '새로운 것 선호'에서 비롯되다
지난 1년간 애플리케이션 레이어의 서사가 단절되어 인프라 급성장 속도를 따라잡지 못하면서 암호화 세계는 점차 주의력 자원을 둘러싼 게임으로 변모했다. Silly Dragon에서 Goat까지, Pump.fun에서 Clanker까지, 주의력의 '새로운 것 선호'는 이 경쟁을 끊임없이 내부 경쟁으로 몰아갔다. 가장 흔한 눈길 끌기 수익화 방식에서 시작해, 곧바로 주의력을 원하는 자와 제공하는 자가 통합된 플랫폼 모델로 진화했으며, 이후 실리콘 기반 생명체가 새로운 콘텐츠 공급자로 등장했다. Meme 코인의 천태만상 속에서 마침내 일반 투자자와 VC가 합의할 수 있는 존재가 등장했는데, 바로 AI 에이전트(AI Agent)였다.

주의력은 궁극적으로 제로섬 게임이지만, 투기는 분명히 사물을 무질서하게 성장시키기도 한다. 우리는 UNI에 관한 글에서 이전 블록체인 황금시대의 시작을 회고한 바 있다. DeFi의 급속한 성장은 Compound Finance가 개척한 LP 마이닝 시대에서 비롯됐으며, 당시 체인 상에서 가장 원초적인 게임 방식은 수천, 수만%의 APY를 자랑하는 다양한 마이닝 풀 사이를 오가는 것이었다. 비록 결국 대부분의 마이닝 풀이 붕괴하며 혼란이 일어났지만, 금광 열풍 덕분에 블록체인은 전례 없는 유동성을 확보했고, DeFi는 순수한 투기를 넘어 결제, 거래, 차익거래, 스테이킹 등 다양한 금융 수요를 충족시키는 성숙한 분야로 자리 잡았다. 현재 AI 에이전트 역시 이러한 무질서한 성장 단계를 겪고 있으며, 우리는 크립토가 어떻게 더 잘 AI와 융합할 수 있을지 탐색 중이며, 궁극적으로 애플리케이션 레이어가 새로운 고지를 정복할 수 있도록 하고 있다.
이, 지능형 에이전트의 자율성
이전 글에서는 AI 메미의 기원인 Truth Terminal과 AI 에이전트의 미래 전망을 간략히 소개했다. 본문은 우선 AI 에이전트 자체에 초점을 맞춘다.
먼저 AI 에이전트의 정의부터 살펴보자. 에이전트(Agent)는 AI 분야에서 비교적 오래되었으나 명확하지 않은 용어로, 주로 Autonomous(자율성)을 강조한다. 즉, 환경을 인지하고 반응을 생성할 수 있는 모든 AI를 에이전트라고 부를 수 있다. 오늘날의 정의에서 AI 에이전트는 인간 의사결정을 모방하는 시스템을 대규모 언어 모델(LLM)에 부여하는 개념에 가까우며, 학계에서는 이를 AGI(범용 인공지능) 달성 가능성이 가장 높은 방법으로 보고 있다.
초기 GPT 버전에서는 대규모 모델이 인간처럼 느껴졌지만, 복잡한 질문에는 여전히 모호하거나 부정확한 답변을 제공하는 경우가 많았다. 그 근본적인 이유는 당시의 대규모 모델이 인과관계가 아닌 확률 기반으로 동작했으며, 인간이 갖는 도구 사용, 기억, 계획 등의 능력을 결여하고 있었기 때문이다. AI 에이전트는 이러한 결함을 보완할 수 있다. 따라서 하나의 공식으로 요약하면, AI 에이전트 = LLM(대규모 언어 모델) + Planning(계획) + Memory(기억) + Tools(도구).
프롬프트(Prompt) 기반의 대규모 언어 모델은 마치 정적인 인간 같지만, 지능형 에이전트의 목표는 더욱 현실적인 인간에 가깝다. 현재 업계의 에이전트는 주로 메타(Meta)가 오픈소스로 공개한 Llama 70B 또는 405B 버전(파라미터 규모 다름)을 기반으로 미세 조정된 모델로, 기억 기능과 API를 통해 도구를 사용할 수 있는 능력을 갖추고 있다. 그러나 다른 측면에서는 여전히 인간의 도움이나 입력이 필요하며(다른 에이전트와의 협업 포함), 이 때문에 현재 업계의 주요 에이전트들은 주로 소셜 네트워크 상에서 KOL 형태로 존재한다. 에이전트를 더욱 인간답게 만들기 위해서는 계획 및 행동 능력을 추가해야 하며, 특히 계획의 하위 항목인 '사고의 사슬(Chain of Thought)'이 핵심이다.
삼, 사고의 사슬(Chain of Thought, CoT)
사고의 사슬(Chain of Thought, CoT) 개념은 2022년 구글이 발표한 논문 《Chain-of-Thought Prompting Elicits Reasoning in Large Language Models》에서 처음 등장했다. 논문은 일련의 중간 추론 단계를 생성함으로써 모델의 추론 능력을 향상시켜 복잡한 문제를 보다 잘 이해하고 해결할 수 있음을 밝혔다.

전형적인 CoT 프롬프트는 세 부분으로 구성된다: (1) 명확한 작업 설명, (2) 작업 해결을 위한 이론적 근거 또는 원리, (3) 구체적인 해결책 예시. 이러한 구조화된 방식은 모델이 작업 요구사항을 이해하도록 돕고, 논리적 추론을 통해 점차 답에 접근함으로써 문제 해결의 효율성과 정확성을 높인다. CoT는 수학 문제 해결, 프로젝트 보고서 작성 등 심층 분석과 다단계 추론이 필요한 작업에 적합하다. 단순한 작업의 경우 CoT의 효과가 뚜렷하지 않지만, 복잡한 작업에서는 모델의 성능을 크게 향상시킬 수 있으며, 단계별 해결 전략을 통해 오류율을 줄이고 작업 완성도를 높인다.
AI 에이전트 구축 시 CoT는 핵심적인 역할을 한다. AI 에이전트는 수신한 정보를 이해하고 이에 기반해 합리적인 결정을 내려야 하는데, CoT는 질서 있는 사고 방식을 제공하여 에이전트가 입력 정보를 효과적으로 처리하고 분석하며, 이를 구체적인 행동 지침으로 전환하도록 돕는다. 이 방법은 에이전트의 결정 신뢰성과 효율성을 높일 뿐 아니라, 결정 과정의 투명성을 제고하여 행동을 더욱 예측 가능하고 추적 가능하게 만든다. CoT는 작업을 여러 소단계로 분해함으로써 각 결정 지점을 세밀하게 고려하게 하고, 정보 과부하로 인한 잘못된 결정을 줄일 수 있다. 또한 CoT는 에이전트의 결정 과정을 투명하게 만들어 사용자가 그 판단 근거를 이해하기 쉽게 한다. 환경과의 상호작용 속에서 CoT는 에이전트가 새로운 정보를 지속적으로 학습하고 행동 전략을 조정할 수 있게 한다.
CoT는 효과적인 전략으로서 대규모 언어 모델의 추론 능력을 향상시킬 뿐 아니라, 더욱 지능적이고 신뢰할 수 있는 AI 에이전트 구축에도 중요한 역할을 한다. CoT를 활용함으로써 연구자와 개발자는 복잡한 환경에 더욱 잘 적응하고, 높은 수준의 자율성을 갖춘 지능형 시스템을 창출할 수 있다. 실제 응용에서 CoT는 특히 복잡한 작업 처리 시 독특한 장점을 보여주며, 작업을 일련의 소단계로 분해함으로써 해결의 정확성을 높일 뿐 아니라 모델의 해석 가능성과 제어 가능성을 증진시킨다. 이러한 단계적 문제 해결 방식은 복잡한 작업에서 정보가 과도하거나 너무 복잡해 발생하는 잘못된 결정을 크게 줄일 수 있다. 동시에 이 방법은 전체 솔루션의 추적 가능성과 검증 가능성을 높인다.
CoT의 핵심 기능은 계획, 행동, 관찰을 상호 결합하여 추론과 행동 사이의 격차를 메우는 것이다. 이 사고 방식은 AI 에이전트가 예상되는 이상 상황에 대비해 효과적인 대응책을 마련할 수 있도록 하며, 외부 환경과 상호작용하면서 새로운 정보를 축적하고 사전 설정된 예측을 검증하며 새로운 추론 근거를 제공할 수 있게 한다. CoT는 정밀도와 안정성을 높이는 강력한 엔진과 같아, AI 에이전트가 복잡한 환경에서도 효율적인 작업 수행을 유지하도록 돕는다.
사, 올바른 듯한 가짜 수요
크립토는 AI 기술 스택의 어떤 부분과 결합해야 할까? 작년 글에서 나는 컴퓨팅 파워와 데이터의 탈중앙화가 소기업과 개인 개발자의 비용 절감을 위한 핵심 단계라고 생각했다. 올해 코인베이스(Coinbase)가 정리한 Crypto x AI 세부 분야에서는 더 상세한 분류를 확인할 수 있다:
(1) 컴퓨팅 레이어(GPU 리소스를 AI 개발자에게 제공하는 네트워크);
(2) 데이터 레이어(AI 데이터 파이프라인의 탈중앙화된 접근, 조정, 검증을 지원하는 네트워크);
(3) 미들웨어 레이어(AI 모델 또는 에이전트의 개발, 배포, 호스팅을 지원하는 플랫폼 또는 네트워크);
(4) 애플리케이션 레이어(체인 기반 AI 메커니즘을 활용한 최종 사용자 제품, B2B 혹은 B2C 모두 포함).
이 네 가지 레이어 각각은 웅대한 비전을 갖고 있으며, 요약하자면 모두 실리콘밸리 거대 기업들이 다음 세대 인터넷을 독점하는 것을 막기 위한 것이다. 내가 작년에 말했듯이, 우리는 정말 실리콘밸리 거대 기업이 컴퓨팅 파워와 데이터를 독점하는 것을 받아들여야 하는가? 그들의 폐쇄형 대규모 모델은 블랙박스이며, 과학은 현대 인류의 가장 신성한 종교인데, 미래에는 대규모 모델이 말하는 모든 문장이 많은 사람들에게 진리로 받아들여질 것이다. 하지만 그 진리는 어떻게 검증될 것인가? 실리콘밸리 거대 기업의 비전 속에서, 에이전트는 궁극적으로 상상할 수 없는 권한을 갖게 될 것이다. 예를 들어 당신의 지갑 결제권, 터미널 사용 권한 등 말이다. 인간이 악의 없음을 어떻게 보장할 것인가?
탈중앙화가 유일한 해답이지만, 때때로 우리는 이러한 웅대한 비전을 누가 실제로 지불할 것인지 합리적으로 종합적으로 고려해야 한다. 과거에는 Token을 통해 이상과 현실의 오차를 메울 수 있었지만, 현재의 상황은 매우 엄중하다. Crypto x AI는 현실 상황을 더욱 깊이 고려해 설계되어야 한다. 예를 들어, 성능 저하와 불안정성을 감수하는 컴퓨팅 레이어가 양쪽 수요를 어떻게 균형 있게 맞출 것인지, 중앙화된 클라우드와 경쟁 가능한 수준으로 매칭할 수 있을지? 데이터 레이어의 프로젝트가 얼마나 많은 실제 사용자를 확보할 수 있을지, 제공되는 데이터의 진실성과 유효성을 어떻게 검증할지, 그리고 누구 같은 고객이 그런 데이터를 필요로 할지? 나머지 두 레이어 역시 마찬가지다. 이 시대에는 보기에는 올바른 듯하지만 실은 가짜 수요가 너무 많을 필요 없다.
오, Meme이 SocialFi를 만들어냈다
앞서 말했듯이 Meme은 초고속으로 Web3에 부합하는 SocialFi 형태를 만들어냈다. Friend.tech는 이번 라운드 소셜 앱의 첫 신호탄을 쏘아 올린 Dapp이었지만, 서둘러 도입한 토큰 설계로 인해 실패하고 말았다. Pump.fun은 순수한 플랫폼화 가능성을 입증했다. 토큰도 없고, 규칙도 없다. 주의력을 원하는 자와 제공하는 자가 통합되며, 플랫폼에서 밈 이미지를 올리거나, 라이브 스트리밍을 하거나, 코인을 발행하거나, 댓글을 달거나, 거래할 수 있다. 모든 것이 자유롭고, Pump.fun은 단지 서비스 수수료만 받는다. 이는 현재 YouTube, Instagram 등의 소셜 미디어 주의력 경제 모델과 기본적으로 동일하지만, 수익 구조와 플레이 방식에서 Pump.fun이 훨씬 더 Web3적이다.

베이스(Base)의 Clanker는 집대성된 형태다. 생태계가 직접 운영하는 통합 생태계 덕분에, Base는 자체 소셜 Dapp을 보조 수단으로 삼아 완전한 내부 폐쇄 순환을 형성했다. 지능형 에이전트 기반 Meme은 Meme Coin의 2.0 형태이며, 사람들은 항상 새것을 좋아한다. Pump.fun은 현재 마침 논란의 중심에 서 있으며, 추세상 탄소기반 생명체의 저속한 밈을 실리콘기반 생명체의 자유로운 상상이 대체하는 것은 시간문제다.
나는 베이스를 수없이 언급해왔는데, 다만 매번 언급하는 내용이 다를 뿐이다. 시간 축상에서 보면 베이스는 한 번도 선도적이지 않았지만, 언제나 승자가 되었다.
육, 지능형 에이전트는 또 무엇이 될 수 있을까?
현실적인 관점에서 보면, 지능형 에이전트는 앞으로 오랜 기간 동안 탈중앙화되기 어렵다. 전통적인 AI 분야에서 에이전트를 구축하는 방식을 보면, 단순히 추론 과정을 탈중앙화하고 오픈소스화한다고 해결될 문제가 아니다. Web2 콘텐츠에 접근하기 위해 다양한 API를 연결해야 하며, 운영 비용이 매우 비싸다. 사고의 사슬 설계 및 다중 에이전트 협업은 여전히 인간 매개체에 의존하는 경우가 많다. 우리는 적절한 융합 형태가 등장할 때까지 오랜 과도기를 겪어야 할 것이다. 어쩌면 UNI와 같을지도 모른다. 그러나 이전 글과 마찬가지로, 나는 여전히 지능형 에이전트가 우리 산업에 큰 충격을 줄 것이라 생각한다. CEX가 우리 산업 내 존재와 마찬가지로, 부정확하지만 중요하다.
지난달 스탠포드와 마이크로소프트가 발표한 《AI Agent 종합 리뷰》 논문은 의료, 스마트 로봇, 가상 세계 등에서 에이전트의 응용을 대량으로 소개했으며, 부록에는 이미 GPT-4V가 지능형 에이전트로서 최정상급 3A 게임 개발에 참여한 실험 사례가 다수 수록되어 있다.
탈중앙화와의 결합 속도를 너무 강요할 필요 없다. 나는 먼저 지능형 에이전트가 하향식이 아닌 상향식의 능력과 속도를 보완하기를 바란다. 우리 앞에는 이야기 폐허가 너무 많고, 채워야 할 공백의 메타버스가 너무 많다. 적절한 시점에 비로소 우리가 다음 UNI를 어떻게 만들지 고민하면 된다.
TechFlow 공식 커뮤니티에 오신 것을 환영합니다
Telegram 구독 그룹:https://t.me/TechFlowDaily
트위터 공식 계정:https://x.com/TechFlowPost
트위터 영어 계정:https://x.com/BlockFlow_News














