AI 프레임워크 해체하기: 인공지능 에이전트에서 탈중앙화까지의 탐색

2025.01.08

AI 프레임워크 해체하기: 인공지능 에이전트에서 탈중앙화까지의 탐색

간소화된 에이전트 구축 과정과 일부 복잡한 기능 조합을 제공하는 프레임워크는 앞으로도 우위를 점할 것이며, 이로 인해 GPT 스토어보다 더 흥미로운 Web3 창의적 경제가 형성될 것이다.

2025.01.08 - 11:09:19

Web3 심층 보도에 집중하고 흐름을 통찰

저자: YBB Capital 리서치어 제이크

서론

이전 글들에서 우리는 AI 밈의 현황과 AI 에이전트(Agent)의 미래 발전에 대해 여러 차례 논의한 바 있다. 그러나 AI 에이전트 분야의 스토리텔링 속도는 빠르고 변화가 극심하여 따라가기 어려울 정도다. '진리 터미널(Truth Terminal)'이 에이전트 서머(Agent Summer)를 시작한 지 불과 두 달 만에, AI와 크립토(Crypto)의 융합 스토리는 거의 매주 새로운 국면을 맞고 있다. 최근에는 시장의 관심이 기술 중심의 '프레임워크(framework)' 프로젝트들로 다시 집중되고 있으며, 이 세부 분야에서는 지난 몇 주 사이 이미 시가총액 1억 달러를 넘는 것은 물론, 10억 달러를 초과하는 유망주들이 다수 등장했다. 이러한 프로젝트들은 또 하나의 새로운 자산 발행 패러다임을 만들어냈다. 즉, Github 코드 저장소를 통해 토큰을 발행하고, 해당 프레임워크 위에서 구축된 에이전트 역시 다시 토큰을 발행할 수 있는 구조다. 프레임워크를 기반으로 하고, 그 위에 에이전트가 존재하는 형태다. 일종의 자산 발행 플랫폼처럼 보이지만 실상은 AI 시대만의 독특한 인프라 모델이 부상하고 있는 것이다. 우리는 이런 새로운 트렌드를 어떻게 바라봐야 할까? 본고는 프레임워크 소개부터 출발해, 필자의 사고를 더해 AI 프레임워크가 크립토에게 과연 무엇을 의미하는지 해석하고자 한다.

일, 프레임워크란 무엇인가?

정의상 AI 프레임워크란 복잡한 AI 모델 개발을 단순화하는 일련의 사전 구축된 모듈, 라이브러리 및 도구들을 통합한 저수준 개발 도구 또는 플랫폼이다. 일반적으로 데이터 처리, 모델 학습, 예측 수행 등의 기능도 포함한다. 간단히 말해, AI 시대의 운영체제(OS)라고 이해할 수 있다. 마치 데스크톱 환경의 Windows, Linux나 모바일 환경의 iOS, Android와 같은 존재다. 각각의 프레임워크는 고유의 장단점을 가지고 있으며, 개발자는 필요에 따라 자유롭게 선택할 수 있다.

'AI 프레임워크'라는 용어가 크립토 영역에서는 여전히 신생 개념이지만, 그 기원을 따져보면 2010년 탄생한 Theano부터 계산하면 이미 약 14년 가까운 발전 역사를 가지고 있다. 전통적인 AI 업계, 특히 학계와 산업계에서는 이미 매우 성숙한 프레임워크들이 다양하게 존재한다. 예를 들어 구글의 TensorFlow, 메타(Meta)의 PyTorch, 바이두(Baidu)의 페더(PaddlePaddle), 바이트(ByteDance)의 MagicAnimate 등이 있으며, 각기 다른 사용 사례에 따라 각각의 강점을 지닌다.

현재 크립토 생태계에서 나타난 프레임워크 프로젝트들은 이번 AI 열풍 초기에 폭발적으로 증가한 에이전트 수요를 기반으로 개발되었으며, 이후 크립토 내 다른 분야로 확장되면서 다양한 세부 영역의 AI 프레임워크들이 형성되었다. 현재 커뮤니티 내 주요 프레임워크 몇 가지를 예로 들어 설명해보겠다.

1.1 Eliza

먼저 a16z 산하의 Eliza를 예로 들 수 있다. 이 프레임워크는 자율형 AI 에이전트를 생성, 배포, 관리하기 위한 다중 에이전트 시뮬레이션 프레임워크다. TypeScript 기반으로 개발되어 API 통합이 용이하며 호환성이 뛰어난 것이 장점이다.

공식 문서에 따르면 Eliza는 주로 소셜 미디어 환경에 초점을 맞추고 있다. 예를 들어 다중 플랫폼 통합 지원을 제공하는데, Discord 완전 통합(음성 채널 포함), X/Twitter 계정 자동화, Telegram 통합, 직접 API 접근 등을 지원한다. 미디어 콘텐츠 처리 측면에서는 PDF 문서 읽기 및 분석, 링크 내용 추출 및 요약, 오디오 전사, 동영상 콘텐츠 처리, 이미지 분석 및 설명, 대화 요약 기능을 제공한다.

Eliza가 현재 지원하는 주요 활용 사례는 다음과 같이 네 가지로 나뉜다:

1. AI 어시스턴트 애플리케이션: 고객 지원 에이전트, 커뮤니티 관리자, 개인 비서;

2. 소셜 미디어 캐릭터: 자동 콘텐츠 제작자, 상호작용 로봇, 브랜드 대변인;

3. 지식 작업자: 연구 보조, 콘텐츠 분석가, 문서 처리기;

4. 상호작용 캐릭터: 역할극 캐릭터, 교육 코치, 엔터테인먼트 로봇.

Eliza가 현재 지원하는 모델은 다음과 같다:

1. 오픈소스 모델의 로컬 추론: 예를 들어 Llama3, Qwen1.5, BERT;

2. OpenAI API를 활용한 클라우드 기반 추론;

3. 기본 설정은 Nous Hermes Llama 3.1B;

4. 복잡한 질의응답을 위해 Claude와의 통합.

1.2 G.A.M.E

G.A.M.E (Generative Autonomous Multimodal Entities Framework)는 Virtual이 출시한 자동 생성 및 관리형 멀티모달 AI 프레임워크로, 주로 게임 내 스마트 NPC 설계를 위한 목적을 지닌다. 이 프레임워크의 특별한 점은 낮은 코딩 능력 또는 전혀 코딩 경험이 없는 사용자도 이용 가능하다는 점이다. 체험용 인터페이스를 보면 사용자는 파라미터만 조정해도 에이전트 설계에 참여할 수 있다.

프로젝트 아키텍처 측면에서 G.A.M.E의 핵심 설계는 여러 하위 시스템이 협업하는 모듈화된 구조이며, 자세한 아키텍처는 아래 그림과 같다.

1. Agent Prompting Interface: 개발자가 AI 프레임워크와 상호작용하는 인터페이스. 이를 통해 개발자는 세션을 초기화하고 세션 ID, 에이전트 ID, 사용자 ID 등의 파라미터를 지정할 수 있다;

2. Perception Subsystem: 입력 정보를 수신하여 종합한 후 전략 계획 엔진에 전달하며, 대화 처리 모듈의 응답도 처리한다;

3. Strategic Planning Engine: 전체 프레임워크의 핵심 부분으로, 고급 계획기(High Level Planner)와 저급 정책(Low Level Policy)으로 구성된다. 고급 계획기는 장기 목표 및 계획 수립을 담당하고, 저급 정책은 이를 구체적인 행동 단계로 변환한다;

4. World Context: 환경 정보, 세계 상태, 게임 상태 등의 데이터를 포함하며, 에이전트가 현재 상황을 이해하는 데 도움을 준다;

5. Dialogue Processing Module: 메시지 및 응답을 처리하며 출력으로 대화 또는 반응을 생성한다;

6. On Chain Wallet Operator: 블록체인 기술 적용 사례일 수 있으나 구체적 기능은 명확하지 않음;

7. Learning Module: 피드백을 통해 학습하고 에이전트의 지식 베이스를 업데이트한다;

8. Working Memory: 에이전트의 최근 행동, 결과, 현재 계획 등 단기 정보를 저장한다;

9. Long Term Memory Processor: 에이전트와 워킹 메모리의 중요한 정보를 추출하고 중요도, 최신성, 관련성 등을 기준으로 정렬한다;

10. Agent Repository: 에이전트의 목표, 성찰, 경험, 성격 등의 속성을 보관한다;

11. Action Planner: 저급 정책을 기반으로 구체적인 행동 계획을 생성한다;

12. Plan Executor: 액션 플래너가 생성한 계획을 실행한다.

작동 흐름: 개발자는 Agent Prompting Interface를 통해 에이전트를 시작하며, 감지 하위 시스템이 입력을 수신해 전략 계획 엔진에 전달한다. 전략 계획 엔진은 메모리 시스템, 월드 컨텍스트, 에이전트 저장소의 정보를 활용해 행동 계획을 수립하고 실행한다. 학습 모듈은 지속적으로 에이전트의 행동 결과를 모니터링하며 결과에 따라 행동을 조정한다.

적용 사례: 전체 기술 아키텍처를 보면 이 프레임워크는 가상 환경에서의 에이전트 의사결정, 피드백, 인지 및 성격 형성에 중점을 두고 있으며, 게임 외에도 메타버스(Metaverse)에 적합하다. Virtual의 공개 리스트를 보면 이미 다수의 프로젝트가 이 프레임워크를 기반으로 개발 중이다.

1.3 Rig

Rig는 Rust 언어로 작성된 오픈소스 도구로, 대규모 언어 모델(LLM) 애플리케이션 개발을 단순화하기 위해 설계되었다. 다양한 LLM 서비스 제공업체(예: OpenAI, Anthropic) 및 여러 벡터 데이터베이스(MongoDB, Neo4j 등)와 쉽게 상호작용할 수 있도록 통합된 운영 인터페이스를 제공한다.

주요 특징:

● 통합 인터페이스: 어떤 LLM 제공업체나 벡터 저장소이든 Rig는 일관된 접근 방식을 제공하여 통합 작업의 복잡성을 크게 줄인다;

● 모듈화 아키텍처: 내부적으로 「제공업체 추상화 계층」, 「벡터 저장 인터페이스」, 「스마트 에이전트 시스템」 등 핵심 모듈로 구성되어 시스템의 유연성과 확장성을 보장한다;

● 타입 안전성: Rust의 특성을 활용해 임베딩 작업의 타입 안전성을 구현하여 코드 품질과 런타임 안정성을 확보한다;

● 고성능: 비동기 프로그래밍 모드를 지원해 동시 처리 능력을 최적화하며, 내장된 로깅 및 모니터링 기능은 유지보수 및 오류 진단에 유리하다.

작동 흐름: 사용자 요청이 Rig 시스템에 들어오면 먼저 「제공업체 추상화 계층」을 거치며, 여기서 각 제공업체 간 차이점을 표준화하고 오류 처리의 일관성을 보장한다. 다음으로 핵심 계층에서 스마트 에이전트가 다양한 도구를 호출하거나 벡터 저장소를 조회해 필요한 정보를 취득한다. 마지막으로 RAG(검색 증강 생성) 등의 고급 메커니즘을 통해 문서 검색과 컨텍스트 이해를 결합해 정확하고 의미 있는 응답을 생성한 후 사용자에게 반환한다.

적용 사례: Rig는 빠르고 정확한 답변이 필요한 질문응답 시스템 구축에 적합할 뿐 아니라, 효율적인 문서 검색 도구, 상황 인식이 가능한 챗봇 또는 가상 비서, 나아가 기존 데이터 패턴을 기반으로 텍스트나 기타 형태의 콘텐츠를 자동 생성하는 콘텐츠 창작까지 지원할 수 있다.

1.4 ZerePy

ZerePy는 Python 기반의 오픈소스 프레임워크로, X(구 Twitter) 플랫폼에서 AI 에이전트를 배포하고 관리하는 과정을 단순화하는 것을 목표로 한다. Zerebro 프로젝트에서 파생되었으며 핵심 기능을 계승했지만, 더 모듈화되고 확장하기 쉬운 방식으로 재설계되었다. 개발자가 쉽게 개인화된 AI 에이전트를 만들고 X에서 다양한 자동화 작업과 콘텐츠 창작을 수행할 수 있도록 하는 것이 목표다.

ZerePy는 사용자가 배포한 AI 에이전트를 관리하고 제어할 수 있는 CLI(명령줄 인터페이스)를 제공한다. 핵심 아키텍처는 모듈화 설계 기반으로, 개발자가 다양한 기능 모듈을 유연하게 통합할 수 있도록 한다. 예를 들어:

● LLM 통합: ZerePy는 OpenAI 및 Anthropic의 대규모 언어 모델(LLM)을 지원하며, 개발자는 사용 사례에 가장 적합한 모델을 선택할 수 있다. 이를 통해 에이전트는 고품질의 텍스트 콘텐츠를 생성할 수 있다;

● X 플랫폼 통합: 프레임워크는 X 플랫폼의 API를 직접 통합하여 에이전트가 게시물 작성, 답글, 좋아요, 리트윗 등의 작업을 수행할 수 있게 한다;

● 모듈화 연결 시스템: 개발자가 다른 소셜 플랫폼이나 서비스를 쉽게 추가해 프레임워크 기능을 확장할 수 있도록 한다;

● 메모리 시스템(향후 계획): 현재 버전에서는 아직 완전히 구현되지 않았을 수 있으나, ZerePy의 설계 목표 중 하나는 메모리 시스템을 통합해 에이전트가 이전 상호작용 및 컨텍스트 정보를 기억함으로써 더 일관되고 개인화된 콘텐츠를 생성할 수 있도록 하는 것이다.

ZerePy와 a16z의 Eliza 프로젝트 모두 AI 에이전트의 구축 및 관리를 목표로 하지만, 아키텍처와 목표에서 다소 차이가 있다. Eliza는 다중 에이전트 시뮬레이션 및 광범위한 AI 연구에 중점을 두는 반면, ZerePy는 특정 소셜 플랫폼(X)에서 AI 에이전트 배포를 단순화하는 데 집중하며, 실제 응용 측면에서의 간소화를 우선시한다.

이, BTC 생태계의 리메이크

실제로 발전 경로를 살펴보면, AI 에이전트는 23년 말부터 24년 초의 BTC 생태계와 많은 유사점을 지닌다. BTC 생태계의 발전 경로는 간단히 BRC-20 → Atomical/Rune 등 다중 프로토콜 경쟁 → BTC L2 → Babylon 중심의 BTCFi로 요약할 수 있다. AI 에이전트는 성숙한 전통 AI 기술 스택 위에서 더 빠르게 발전하고 있지만, 전체적인 발전 경로는 BTC 생태계와 상당히 유사하다. 필자는 이를 간단히 GOAT/ACT → 소셜형 에이전트 / 분석형 AI 에이전트 → 프레임워크 경쟁으로 요약할 수 있다고 본다. 추세상 에이전트의 탈중앙화와 보안을 중심으로 한 인프라 프로젝트들이 이번 프레임워크 열풍을 이어받아 다음 단계의 주류가 될 가능성이 크다.

그렇다면 이 분야도 BTC 생태계처럼 동질화·버블화로 흐를 것인가? 나는 그렇지 않다고 본다. 우선 AI 에이전트의 스토리텔링은 스마트 계약 체인의 역사 재현을 위한 것이 아니다. 또한 기존 AI 프레임워크 프로젝트들이 기술적으로 실제로 실력이 있든, PPT 단계에 머물렀든, 혹은 ctrl+c + ctrl+v 수준이든, 적어도 새로운 인프라 개발 사고방식을 제시하고 있다는 점에서 의미가 있다. 많은 기사들이 AI 프레임워크를 자산 발행 플랫폼에 비유하고, 에이전트를 자산에 비유하지만, 개인적으로는 메모코인 런치패드나 인스크립션 프로토콜보다는 오히려 AI 프레임워크가 미래의 퍼블릭 체인(Public Chain) 같고, 에이전트가 미래의 DApp(Dapp) 같다고 느낀다.

현대 크립토에서는 수천 개의 퍼블릭 체인이 있고, 수만 개의 DApp이 존재한다. 일반 체인에는 BTC, 이더리움, 다양한 이종 체인들이 있고, 애플리케이션 체인은 게임 체인, 스토리지 체인, DEX 체인 등 더욱 다양하다. 퍼블릭 체인이 AI 프레임워크와 매우 유사하고, DApp은 에이전트와 잘 대응된다.

AI 시대의 크립토는 이러한 형태로 나아갈 가능성이 높으며, 미래의 논쟁도 EVM과 이종 체인 간의 논쟁에서 프레임워크 간의 논쟁으로 옮겨갈 것이다. 현재의 핵심 질문은 "어떻게 탈중앙화하거나 체인화할 것인가?"다. 이 부분은 향후 AI 인프라 프로젝트들이 기반을 마련해 나갈 것으로 생각한다. 다른 한편으로는 블록체인 위에서 이것을 하는 것이 과연 어떤 의미가 있는가?

삼, 체인화의 의미는?

블록체인은 무엇과 결합하든 결국 한 가지 질문에 직면해야 한다: 의미가 있는가? 작년의 글에서 나는 게임파이(GamFi)의 본말 전도와 인프라 발전의 과도한 선도를 비판했으며, 최근 몇 차례 AI 관련 글에서도 현재 단계에서 실용 분야의 AI x 크립토 조합을 그리 긍정적으로 보지 않았다. 어쨌든 스토리텔링의 추진력은 전통 프로젝트들에게 점점 더 약해지고 있으며, 작년에 유일하게 몇몇 코인 가격이 상승한 전통 프로젝트들도 대부분 코인 가격에 걸맞거나 초과하는 실력을 갖추고 있었다. AI가 크립토에 어떤 도움이 될 수 있을까? 이전에는 에이전트의 자동 조작을 통한 의도 실현, 메타버스, 에이전트를 직원으로 활용하는 등의 다소 진부하지만 수요는 있는 아이디어들을 떠올렸다. 그러나 이러한 수요들은 전부 체인화할 필수는 없었으며, 상업적 로직상에서도 완전한 사이클을 이루기 어렵다. 이전 글에서 언급한 에이전트 브라우저를 통한 의도 실현은 데이터 태깅, 추론 컴퓨팅 파워 등의 수요를 파생시킬 수 있지만, 여전히 두 요소의 결합은 충분히 밀접하지 못하며, 컴퓨팅 파워 측면에서는 종합적으로 봤을 때 여전히 중심화된 컴퓨팅이 우세하다.

다시 디파이(DeFi)의 성공 원리를 생각해보면, 디파이가 전통 금융에서 한몫을 차지할 수 있었던 이유는 더 높은 접근성, 더 나은 효율성과 낮은 비용, 신뢰할 수 있는 중앙 기관이 없는 보안성 때문이었다. 이러한 관점에서 본다면, 에이전트의 체인화를 지지할 수 있는 몇 가지 이유가 있을지도 모른다.

1. 에이전트의 체인화가 더 낮은 사용 비용을 실현해 더 높은 접근성과 선택성을 제공할 수 있는가? 궁극적으로 Web2 대기업들이 독점하는 AI '임대권'을 일반 사용자도 참여할 수 있게 할 수 있는가?

2. 보안성: 에이전트의 가장 간단한 정의에 따르면, 에이전트라 불릴 수 있는 AI는 가상 또는 현실 세계와 상호작용할 수 있어야 한다. 만약 에이전트가 현실 세계 또는 나의 가상 지갑에 개입할 수 있다면, 블록체인 기반의 보안 솔루션은 일종의 필수 요건이 될 수 있다;

3. 에이전트가 블록체인만의 금융 플레이를 창출할 수 있는가? 예를 들어 AMM의 LP처럼 일반인도 자동 시장 조성에 참여할 수 있도록 할 수 있는가? 에이전트가 컴퓨팅 파워, 데이터 태깅 등을 필요로 하며, 사용자가 해당 프로토콜에 U(USDT 등)를 투자할 수 있도록 할 수 있는가? 아니면 다양한 사용 사례에 기반한 새로운 금융 플레이를 창출할 수 있는가?

4. 디파이는 현재 완벽한 상호 운용성을 갖추지 못하고 있다. 블록체인과 결합된 에이전트가 투명하고 추적 가능한 추론을 실현한다면, 앞선 글에서 언급한 전통 인터넷 대기업이 제공하는 에이전트 브라우저보다 더 큰 매력을 발휘할 수 있을 것이다.

사, 창의성?

프레임워크 기반 프로젝트들은 앞으로 GPT 스토어와 유사한 창업 기회를 제공할 것이다. 현재 일반 사용자가 프레임워크를 통해 에이전트를 발행하는 것은 여전히 복잡하지만, 에이전트 생성 과정을 단순화하고 복잡한 기능 조합을 제공하는 프레임워크가 미래에는 우위를 점할 것이라 본다. 이 과정에서 GPT 스토어보다 더 흥미로운 Web3 창의 경제가 형성될 수 있다.

현재의 GPT 스토어는 여전히 전통 영역의 실용성에 치중되어 있으며, 대부분의 인기 앱들은 전통 Web2 기업들에 의해 만들어졌다. 수익 구조 역시 창작자가 전부 가져가는 형태다. OpenAI의 공식 설명에 따르면, 이 전략은 미국 내 일부 우수 개발자에게만 자금 지원을 제공하며, 일정 금액의 보조금을 지급한다고 한다.

Web3는 수요 측면에서 여전히 채워야 할 부분이 많으며, 경제 체계 측면에서도 Web2 거대 기업의 불공정 정책을 더 공정하게 만들 수 있다. 더불어, 우리는 자연스럽게 커뮤니티 경제를 도입해 에이전트를 더욱 완성도 있게 만들 수도 있다. 에이전트 기반의 창의 경제는 누구나 참여할 수 있는 기회가 될 것이며, 미래의 AI 밈은 GOAT, Clanker에서 발행된 에이전트보다 훨씬 더 지능적이고 흥미로울 것이다.

참고 문헌:

1.AI 프레임워크의 역사적 발전과 트렌드 탐색

2.Bybit：AI Rig Complex （ARC）：AI 에이전트 프레임워크

3.Deep Value Memetics：네 가지 Crypto×AI 프레임워크 비교: 채택 현황, 장단점, 성장 가능성

4.Eliza 공식 문서

5.Virtual 공식 문서

TechFlow 공식 커뮤니티에 오신 것을 환영합니다

Telegram 구독 그룹:https://t.me/TechFlowDaily

트위터 공식 계정:https://x.com/TechFlowPost

트위터 영어 계정:https://x.com/BlockFlow_News

즐겨찾기 추가

소셜 미디어 공유