
에이전트가 웹3의 미래를 어떻게 재정의하는가? ai16z 창립자와의 대화
팟캐스트 출처: Delphi Digital
정리 및 번역: Coinspire

서론
AI 에이전트가 이번 암호화 사이클에서 막강한 기세로 등장했다면, ai16z와 Eliza의 창립자 Shaw는 그 흐름을 정확히 잡아챘다 할 수 있다.
그가 설립한 ai16z는 유명 벤처 캐피털 a16z를 패러디한 이름의 AI 메임(밈) 테마 체인상(On-chain) 펀드로, 2024년 10월 제로에서 시작해 단 몇 개월 만에 솔라나(Solana) 상에서 최초로 시가총액 25억 달러를 돌파한 AI DAO가 되었으며(현재는 다소 조정됨) 이 프로젝트의 핵심인 ElizaOS는 다중 에이전트(Multi-Agent) 시뮬레이션 프레임워크로, 개발자들이 자율형 AI 에이전트를 생성하고 배포하며 관리할 수 있도록 지원한다. 선점 효과와 활발한 TypeScript 커뮤니티 덕분에 Eliza 코드베이스는 GitHub에서 스타 수 1만 개 이상을 기록하며 현재 Web3 AI 에이전트 개발 시장 점유율 약 60%를 차지하고 있다.
소셜 미디어에서의 논란이 끊이지 않지만, Shaw는 여전히 암호화 분야 AI 영역의 핵심 인물로 자리매김했다. 중국 커뮤니티 내에서는 이미 그에 대한 많은 인터뷰가 존재하지만, 우리가 보기에 1월 6일 Delphi Digital 공동창립자 Tom Shaughnessy와 26 Crypto Capital의 Ejazz가 Shaw와 진행한 이 팟캐스트가 'AI 에이전트 실용성'이라는 주제를 가장 깊이 있게 다루며 여전히 선견지명을 갖춘 대담이라 판단한다.
이번 대화는 질문 자체도 통찰력 있으며, Shaw 역시 늘 그렇듯 솔직하고 직설적으로 Web3 산업 내 AI 에이전트 사례부터 토큰 경제학, 오픈소스 AGI 플랫폼의 미래까지 다양한 주제에 대해 진솔한 견해와 전망을 나누었다. 여기에는 풍부한 인사이트가 담겨 있다. 이에 Coinspire는 독자들과 함께 AI+Web3의 미래 한 조각을 엿볼 수 있도록 전체 내용을 음성 번역하여 소개한다.
🎯 주요 하이라이트
▶ Eliza Labs 설립과 ai16z의 급속 성장 비하인드 스토리
▶ Eliza 프레임워크 기술 심층 분석
▶ 에이전트 플랫폼 평가 및 '쓰레기봇(slop bots)'에서 실용 도구로의 전환
▶ 토큰 경제학 및 가치 포획(Value Capture) 메커니즘 논의
▶ 크로스체인 개발과 블록체인 선택 전략
▶ 오픈소스 AGI 비전과 AI 에이전트의 미래
Part.1 창업 경험과 아시아 방문
Q1: Shaw 본인의 경력을 간단히 설명해줄 수 있나요?
Shaw:
저는 오랫동안 오픈소스 프로젝트를 개발해왔고, 오픈소스 스페이스 네트워크 프로젝트를 만들기도 했습니다. 하지만 파트너가 저를 GitHub에서 제외시키고 7,500만 달러에 프로젝트를 매각했고 저는 아무것도 받지 못했습니다. 그는 코드 한 줄도 작성하지 않았고, 저는 프로젝트의 수석 개발자였습니다. 지금은 소송을 진행 중이지만, 이 사건으로 모든 것을 잃었고 명예도 추락했습니다.
그 후 다시 시작해 AI 에이전트 연구에 집중했지만, 앞선 사건으로 모든 자금을 잃었기 때문에 책임을 혼자 짊어져야 했고, 부채까지 지게 되었습니다. 생계를 위해 서비스 프로젝트를 병행해야 했죠. 결국 메타버스 열풍이 가라앉으며 방향성도 더 이상 적합하지 않았습니다.
이후 Webiverse에 수석 개발자로 합류했고 초반엔 잘 진행됐지만, 프로젝트가 해킹당하고 자금이 탈취되면서 팀은 전환을 강요받았습니다. 이 과정은 극도로 힘들었고 거의 정신적 붕괴 직전까지 갔습니다.
많은 좌절을 겪었지만 계속해서 전진하려 노력했습니다. Project 89(신경언어 바이러스형 상호작용 AI) 창업자와 협업해 Magic이라는 플랫폼을 시작하고 시드 펀딩도 마쳤습니다. 그는 이를 무코드 도구로 만들어 사용자가 쉽게 에이전트 시스템을 구축하게 하고 싶어 했고, 저는 완전한 솔루션을 제공하면 사용자가 복사하기만 할 것이고, 제공하지 않으면 어디서 시작해야 할지 모를 것이라고 생각했습니다. 자금이 바닥날 무렵, 저는 에이전트 시스템 개발에 집중하기로 결정했습니다. 당시 이 플랫폼 위에서 Eliza의 첫 번째 버전을 만들었습니다. 이 모든 게 미친 듯이 들릴 수 있지만, 저는 계속 새로운 방향을 시도하고 탐색해왔습니다.
Q2: 아시아 개발자 커뮤니티의 상황은 어떤가요?
Shaw:
지난 몇 주간 아시아에 머물며 현지 개발자 커뮤니티와 밀접하게 만남을 가졌습니다. 저희 프로젝트가 주목받기 시작하면서 특히 ai16z 같은 AI 에이전트 관련 콘텐츠에 관심이 쏠리자, 아시아, 특히 중국에서 많은 연락을 받았고, 여기에 많은 지지자들이 있다는 걸 알게 됐습니다.
706이라는 커뮤니티를 통해 많은 멤버들을 알게 되었고, 누군가는 우리를 위해 중국어 채널과 디스코드 운영을 도와주었고, 작은 해커톤도 조직해주었습니다. 행사에서도 많은 개발자들을 만나 프로젝트를 심사했는데, 반드시 직접 와서 얼굴을 익혀야겠다고 느꼈습니다. 그래서 여러 도시를 방문하며 개발자들을 직접 만나는 일정을 계획했습니다.
현지 커뮤니티는 매우 열정적이었고, 연이은 행사를 마련해주었습니다. 많은 사람들과 교류하며 프로젝트를 이해하고 관계를 형성할 수 있었습니다. 최근 베이징, 상하이, 홍콩을 거쳐 지금 서울에 있고, 내일은 일본으로 갈 예정입니다.
이번 만남을 통해 게임, 가상 여자친구 앱, 로봇, 웨어러블 기기 등 흥미로운 프로젝트들을 많이 봤습니다. 일부는 데이터 수집, 미세조정(fine-tuning), 어노테이션에 초점을 맞추고 있는데, 기존 기술과 결합하면 좋은 가능성을 보입니다. 특히 DeFi 프로토콜에 AI 에이전트를 통합하는 데 큰 관심이 있습니다. 이는 사용 장벽을 낮출 수 있고, 향후 몇 달 안에 킬러 앱이 될 수 있을 것입니다. 대부분 초기 단계지만, 개발자들의 열정과 창의력은 인상 깊었습니다.
Part.2 AI 에이전트 + DeFi 융합 사례와 실용성 논의
Q3: 현재 ai16z의 시가총액은 수십억 달러에 달하고, Eliza 프레임워크는 다수의 에이전트를 지원하며 개발자들의 관심도 매우 높습니다. GitHub에서도 수주간 인기를 유지하고 있습니다. 동시에 사람들은 소셜 미디어에서 자동 응답만 하는 챗봇에 점점 지쳐가고 있으며, 대신 토큰 생성, 토큰 이코노미 관리, 생태계 유지, 심지어 DeFi 작업 수행 같은 실제 작업을 수행하는 에이전트를 원하고 있습니다. 앞으로 에이전트의 발전 방향이 이런 기능들을 포함할 것으로 보시나요? Eliza의 에이전트는 DeFi에 중점을 둘 계획인가요?
Shaw:
이건 명백한 비즈니스 기회입니다. 저 역시 리플라이 로봇(reply robot) 상황에 지쳐 있습니다. 요즘 많은 사람들이 도구를 다운로드해서 보여주고 토큰을 밀어붙이는 데 그치지만, 저는 정말 그런 수준을 넘어서길 바랍니다. 저는 지금 다음 세 가지 유형의 에이전트에 가장 관심이 있습니다. 첫째, 당신이 돈을 벌게 해주는 에이전트, 둘째, 제품을 적합한 고객에게 전달해주는 에이전트, 셋째, 당신의 시간을 절약해주는 에이전트입니다.
지금 우리는 여전히 자동 응답 모드에 갇혀 있습니다. 저는 스스로 소환되지 않은 모든 응답 로봇은 차단합니다. 여러분도 그렇게 하길 권장합니다. 사회적 반작용을 만들어내야만, 에이전트 개발자들이 진정한 의미 있는 무언가를 만들도록 진지하게 고민하게 됩니다. 특정 트렌드를 맹목적으로 따라다니며 모든 콘텐츠에 댓글을 달아대는 것은 어떤 토큰에도 도움이 되지 않습니다.
지금 제가 가장 관심 있는 건 DeFi입니다. 왜냐하면 여기엔 많은 차익거래(arbitrage) 기회가 있기 때문입니다. DeFi는 다른 어떤 것보다 '돈을 벌 수 있는 기회가 있지만 많은 사람이 어떻게 이용해야 할지 모르는' 특성을 가지고 있습니다. 이미 Orca와 협업 중이며, Meteora의 DLMM(동적 유동성 마켓메이커)에서도 작업 중입니다. 봇은 잠재적인 차익거래 기회를 자동으로 식별하고, 토큰의 범위가 변경되면 자동으로 조정하여 수익을 당신의 지갑으로 돌려줍니다. 이렇게 사용자는 안전하게 자신의 토큰을 투입할 수 있고, 전체 과정이 자동화됩니다.
또한, 메임 코인은 변동성이 매우 큽니다. 사실 메임 코인이 초기에 상승세가 매우 강해 유동성 풀(LP) 운영이 어렵지만, 일단 안정화되면 변동성은 오히려 유리한 요소가 되며, LP를 통해 수익을 창출할 수 있습니다. 저는 기본적으로 토큰을 판매하지 않고 LP를 통해 수익을 얻고 있으며, 다른 에이전트 개발자들에게도 그렇게 하라고 항상 권장합니다. 하지만 놀랍게도 많은 사람들이 그러지 않는다는 걸 발견했습니다. 친구 하나가 돈을 벌기 어렵다고 했는데, LP를 고려했는지 물어봤더니 시간이 없다고 하더군요. 그런데 실제로는 LP를 통해 거래량으로 많은 수익을 올릴 수 있는 겁니다.
Q4: 유동성 풀 외에도, 이러한 에이전트들이 자체 자산을 관리하며 거래를 시작할 수 있을까요? 예를 들어 ai16z나 Degen Spartan AI 같은 프로젝트들이 자산 운용(AUM)을 어떻게 운영할지, 그리고 이러한 에이전트들이 올해 안에 이를 실현할 능력이 있다고 보시나요?
Shaw:
저는 현재 대규모 언어 모델(LLM)이 직접 거래에 사용되기에 적합하지 않다고 봅니다. 다만, 시장 정보를 얻을 수 있는 적절한 API가 있다면 합리적인 판단을 내릴 수는 있습니다. 예를 들어, 어떤 AI 시스템의 거래 성공률이 약 41% 정도인데, 이 수치는 꽤 좋은 편입니다. 대부분의 암호화폐가 불안정하기 때문이죠. 하지만 LLM은 복잡한 의사결정에는 서툴며, 주된 역할은 다음 토큰을 예측하는 것입니다. 컨텍스트 정보를 기반으로 좀 더 합리적인 결정을 내리는 것이죠.
LLM이 가치를 가지는 지점은 비정형 데이터를 정형 데이터로 변환하는 데 있습니다. 예를 들어, 그룹 채팅에서 사람들이 서로 토큰을 추천하는 정보를 조작 가능한 데이터로 전환하는 것 말입니다. 우리는 "신뢰 시장(trust market)"이라는 연구를 진행 중인데, 핵심 질문은 '채팅방이나 트위터에서의 추천 정보를 진짜로 간주하고 그 추천에 따라 거래한다면 돈을 벌 수 있을까?'입니다. 실제로 소수의 사람들은 매우 뛰어난 트레이더이자 추천자이며, 우리는 최고의 추천자들을 분석 중이고, 향후 그들의 조언을 기반으로 운영할 수도 있습니다.
이건 예측시장과 같습니다. 소수는 예측에 매우 능숙하고, 다수는 그렇지 않거나 행동경제학적 영향을 받기 쉽습니다. 따라서 우리의 목표는 측정 가능한 지표를 통해 이들의 실적을 추적하고, 이를 전략 훈련에 활용하는 것입니다. 저는 이 방법이 돈을 버는 것뿐만 아니라 거버넌스, 기여 보상 등 더 추상적인 영역에도 적용될 수 있다고 봅니다.
하지만 돈 벌기는 가장 쉬운 부분입니다. 마치 측정이 쉬운 레고 블록처럼 말이죠. 단순히 시계열 데이터를 LLM에 주고 스스로 토큰의 매수매도를 예측하게 하는 접근법이 진짜 문제를 해결한다고 생각하지 않습니다. 에이전트를 자동 매수매도 시스템으로 설계하면 분명 작동은 하겠지만, 반드시 돈을 버는 것은 아닐 것입니다. 특히 변동성이 큰 토큰을 구매할 때는 더욱 그렇죠. 따라서 우리는 단순한 매매보다 더 유연하고 신뢰할 수 있는 방법이 필요하다고 봅니다.
Q5: 만약 매우 뛰어난 거래 능력을 가진 에이전트가 있다면, 왜 그것을 오픈소스로 공개하고 토큰을 기반으로 프로젝트를 만들기보다는 그냥 개인적으로 거래하지 않나요?
Shaw: 누군가 제게 70% 정확도로 토큰 가격을 예측할 수 있다고 주장하는 회사가 있다고 말했습니다. 제가 정말 그런 능력을 가졌다면 여기서 이런 이야기를 하지 않을 겁니다. 무한정 돈을 찍어낼 테니까요. 비트코인 같은 자산에 대해 70% 정확도로 단기 예측이 가능하다면, 무한한 수익을 쉽게 얻을 수 있습니다. 저는 블랙록 같은 회사들이 어느 정도 그런 일을 하고 있을 것이라고 확신합니다. 그들은 글로벌 데이터를 처리해 주식 등을 예측하려 하고, 아마 성공하고 있을 겁니다. 어쨌든 그들은 많은 인력을 이 일에 투입하고 있으니까요.
하지만 저는 저시가총액 시장에서는 행동 기반 요소와 소셜 미디어의 영향이 예측 가능한 기본적 데이터보다 훨씬 중요하다고 봅니다. 예를 들어, 유명인이 특정 계약 주소를 리트윗하는 것만으로도 어떤 알고리즘보다 더 효과적일 수 있습니다. 따라서 메임 코인이 흥미로운 이유는 시장 가치가 매우 낮아 소셜 동향의 영향을极易 받기 때문입니다. 당신이 이런 소셜 동향을 추적할 수 있다면 그 안에서 기회를 찾을 수 있습니다.
Part.3 에이전트 프레임워크의 가치와 Eliza의 개발적 우위
Q6: Eliza의 활용 사례를 바탕으로, 팀이 Eliza를 사용해 완전히 새로운 혁신적인 에이전트를 시장에 출시하려면 어떻게 해야 하나요? 이 에이전트의 주요 차별화 요소는 무엇인가요? 모델인가요, 데이터인가요, 아니면 Eliza가 제공하는 다른 기능과 지원인가요?
Shaw:
일각에서는 이를 단지 ChatGPT의 포장이라고 말하지만, 이건 웹사이트를 HTTP의 포장이라고 보는 것, 또는 앱을 React의 포장이라고 보는 것과 같습니다. 사실 핵심은 제품 자체이며, 고객이 그 제품을 사용하고 비용을 지불하는지 여부가 모든 사업의 중심입니다.
모델은 이미 극도로 상품화되었습니다. 기초 모델을 처음부터 훈련하는 것은 매우 비싸며, 수억 달러가 들 수 있습니다. OpenAI만큼의 자금과 시장 점유율을 가졌다면, 엔드투엔드 훈련 시스템을 구축하고 모델을 훈련하는 것이 쉬울 수 있지만, 그러면 Meta, OpenAI, XAI, Google과 경쟁하게 됩니다. 그들은 모두 벤치마크 성능을 높여 세계 최고의 모델임을 증명하려 노력하고 있습니다. 또한 XAI는 새 버전을 발표할 때마다 이전 버전을 오픈소스로 공개하고, Meta는 자신들이 만든 모든 것을 오픈소스로 공개하며 점유율을 확보하려 합니다.
하지만 저는 우리가 경쟁해야 할 영역이 여기라고 보지 않습니다. 우리는 개발자가 제품을 만드는 것을 돕는 데 집중해야 합니다. 인터넷의 미래, 웹사이트와 제품의 작동 방식, 사용자가 앱을 어떻게 사용하는지가 핵심입니다. 이미 사용할 준비가 된 훌륭한 제품과 인프라가 많지만, 사용자들이 그것을 찾는 법을 모릅니다. 당신은 간단히 "DeFi 프로토콜로 돈 벌기"라고 구글 검색할 수 없습니다. 리스트를 찾아 연구할 순 있지만, 무엇을 찾아야 할지 모른다면 쉽지 않습니다.
따라서 진정한 가치는 기존의 존재하는 것들을 연결하는 데 있습니다. 웹사이트와 로그인 페이지에 머무는 대신, 소셜 미디어로 나가 실제 제품 사용 사례를 보여주고, 당신의 제품이 필요한 사용자를 찾아야 합니다. 저는 AI 에이전트가 제품 자체라기보다는 제품의 일부, 즉 제품과 상호작용하는 인터페이스가 되어야 한다고 생각하며, 그런 시도가 더 많아지길 바랍니다.
Q7: 왜 Eliza 프레임워크 혹은 여러분이 구축 중인 플랫폼이 개발자와 구축자들에게 가장 적합한 메인 근거지라고 보시나요? 다른 프레임워크나 언어(Zerepy 팀은 Python, Arc 팀은 Rust 사용)와 비교해보면요?
Shaw:
저는 언어가 중요하지만 전부는 아니라고 봅니다. 현재 JavaScript로 앱을 개발하는 개발자 수가 다른 어떤 언어보다 많습니다. Discord에서 Microsoft Teams에 이르기까지 거의 모든 커뮤니케이션 앱도 JavaScript로 개발되거나, 특정 로컬 런타임을 사용하더라도 UI와 인터랙션 부분은 JavaScript로 개발됩니다. 백엔드 개발도 많이 이루어지죠. 현재 JavaScript와 TypeScript를 사용하는 개발자의 수는 다른 모든 언어 개발자 수를 합친 것보다 많으며, React Native 같은 도구(JavaScript 기반 프레임워크로 Android 및 iOS 앱 개발 가능)의 등장으로 그 격차는 더 벌어지고 있습니다.
EVM에서 개발했던 많은 개발자들도 Node.js를 설치했고, Forge나 Truffle 같은 이더리움 개발 도구를 실행해본 경험이 있어 이 생태계에 익숙합니다. 우리는 웹사이트 개발 경험이 있는 개발자들에게 접근할 수 있으며, 그들도 에이전트를 만들 수 있습니다.
Python이 특별히 어렵다고 보진 않지만, 다양한 형태로 패키징하는 데 어려움이 있고, 많은 사람이 Python 설치 단계에서 막힙니다. Python 생태계는 다소 혼잡하고, 패키지 관리자도 복잡해 많은 사람이 올바른 버전을 찾는 법을 모릅니다. 백엔드 개발에선 괜찮지만, 제가 과거 개발할 때 느낀 바로는 비동기 프로그래밍에서 부족했고, 문자열 처리도 다소 번거롭습니다.
TypeScript가 에이전트 개발에서 가지는 장점을 깨달았을 때, 이것이 올바른 방향이라는 걸 확신했습니다. 또한 우리는 엔드투엔드 솔루션을 제공합니다. 클론한 후 즉시 작동합니다. Arc는 훌륭한 프로젝트라고 생각하지만, 커넥터가 없고 소셜 커넥터가 없습니다. Zeropy 같은 프로젝트도 좋지만, 주로 소셜 커넥터나 루프 기반 응답에 초점을 맞춥니다. 다른 많은 프로젝트들은 여러 에이전트가 서로 대화하게 하지만, 실제로 소셜 미디어에 연결되지는 않습니다.
저는 이런 프레임워크 자체가 신체(body)라면, LLM(대규모 언어 모델)은 두뇌(brain)라고 봅니다. 우리가 만든 것은 이 브릿지로서, 프레임워크가 다양한 클라이언트에 연결될 수 있도록 하는 것입니다. 이러한 솔루션을 제공함으로써 진입 장벽을 크게 낮추고, 개발자가 작성해야 할 코드량을 줄였습니다. 개발자는 제품에만 집중하면 되고, 필요한 API를 가져오기만 하면 됩니다. 입력과 출력을 위한 간단한 추상화를 제공합니다.
Q8: 비개발자의 입장에서 Eliza 플랫폼이 공개한 기능과 프로세스를 어떻게 이해할 수 있을까요? 비개발자 입장에서, 에이전트 구축자가 Eliza나 다른 경쟁 플랫폼에 접속했을 때 어떤 기능이나 지원을 얻을 수 있나요?
Shaw:
코드를 컴퓨터에 다운로드하고, 역할을 수정한 후 실행하면, 기본적인 봇을 갖게 됩니다. 채팅처럼 어떤 작업도 수행할 수 있으며, 이것이 가장 기본적인 기능입니다. 우리는 많은 플러그인이 있으며, 지갑을 추가하고 싶다면 플러그인을 활성화하고 EVM 체인의 개인 키를 추가하면 됩니다. 원하는 체인을 선택할 수 있죠. API 키(Discord 등), 트위터 사용자명, 이메일 등을 추가할 수도 있습니다. 코드 작성 없이 설정만으로 바로 사용 가능합니다. 그래서 많은 봇이 홍보와 응답을 하고 있는 것입니다.
이후에는 "액션(action)"이라고 부르는 추상 도구를 사용해 다른 작업을 수행할 수 있습니다. 예를 들어, 봇이 피자를 주문하도록 만들고 싶다면 "피자 주문" 액션을 설정하면 됩니다. 그러면 시스템이 자동으로 사용자 정보를 가져옵니다. 현재 사용자의 정보 제공자(provider)일 수 있죠. 사용자 정보(이름, 주소 등)를 추출할 평가기(evaluator)도 필요합니다. 누군가 DM으로 피자를 주문하면, 시스템은 먼저 사용자 주소를 가져온 후 피자 주문 작업을 수행합니다.
이 세 요소—제공자(provider), 평가기(evaluator), 액션(action)—는 복잡한 애플리케이션 구축의 기반이 됩니다. 웹사이트에서 폼을 작성하는 모든 작업은 기본적으로 이 세 요소로 구현할 수 있습니다. 우리는 현재 이를 자동 LP 관리 등의 작업에 활용하고 있으며, 이는 웹사이트를 개발하는 것과 유사하게 API 호출이 중심이며, 개발자라면 누구나 쉽게 접근할 수 있습니다.
비개발자의 경우, 호스팅된 플랫폼 중 원하는 기능이나 플러그인을 선택하는 것을 추천합니다. 코드에 깊이 들어가지 않아도 됩니다. 원한다면 직접 해보는 것도 좋습니다.
Q9: 개발자가 처음부터 이 모든 기능을 구축하거나 구성 요소들을 연결하려면 얼마나 걸릴까요? Eliza 플랫폼을 사용하는 경우와 비교하면 시간 비용은 어떻게 되나요?
Shaw:
당신이 무엇을 하려는지에 따라 다릅니다. 코드베이스를 보고 추상 개념을 이해했다면, 특정 기능은 매우 짧은 시간 안에 구축할 수 있습니다. 예를 들어, 내가 원하는 일을 하는 에이전트를 일주일 안에 만들 수도 있습니다. 하지만 기억 기능, 정보 추출, 또는 이런 기능을 지원하는 프레임워크를 구축하려면 더 복잡해집니다.
예를 들어, 저는 피자 배달 앱을 만들었고 5시간이 걸렸고, 다른 사람은 2시간 만에 만들었습니다. 기본적으로 하루 안에 완성할 수 있죠. 제가 직접 만들었다면 몇 주가 걸렸을 겁니다. 물론 지금은 AI가 코드 작성까지 가속화하고 있지만, 전체 프레임워크가 이미 많은 것을 제공하고 있습니다.
예를 들어, React처럼 모든 앱이 React 위에 구축됩니다. 쉽게 웹사이트를 조합할 수 있지만, 프로젝트가 복잡해질수록 매우 어렵게 됩니다. 간단한 작업이라면 LLM 하나, 블록체인 하나, 루프 하나만 있으면 며칠 안에 끝납니다. 하지만 우리는 모든 모델을 지원하며, 완전히 로컬에서 실행 가능하고, 오디오 파일을 디스코드에 보내면 자동으로 텍스트로 변환(transcribe)되며, PDF 파일을 업로드해도 채팅이 가능합니다. 이런 기능은 이미 내장되어 있습니다. 사람들의 대부분은 내장된 기능의 80%도 사용하지 않습니다.
따라서 단순한 채팅 인터페이스를 만들고 싶다면 직접 해도 됩니다. 하지만 다양한 기능을 수행할 수 있는 완전한 에이전트를 만들려면 대부분의 작업을 이미 처리한 프레임워크가 필요합니다. 말씀드리지만, 저는 이걸 만들기 위해 수개월을 투자했습니다.
Q10: 다른 에이전트 플랫폼들이 일반적으로 빠른 설계, 배포, 무코드 운영을 강조하는 것과 달리, Eliza는 맞춤형 및 독특한 기능을 가진 에이전트 구축에 더 적합하다고 보시나요?
Shaw:
Arc 전체 시스템이나 Zeropy, Game 프레임워크 전체를 비교하면, 코드 라인 수는 Eliza보다 훨씬 적습니다. Eliza는 음성-텍스트 변환, 텍스트-음성 변환, 전사(transcription), PDF 처리, 이미지 처리 등 다양한 기능을 포함하고 있으며, 플러그인만 따로 떼어내도 핵심 기능이 많이 포함되어 있습니다. 일부에게는 지나치게 복잡할 수 있지만, 실제로 많은 일을 가능하게 하며, 이것이 많은 사람들이 사용하는 이유입니다.
Eliza에 다른 기능을 추가한 에이전트를 종종 봅니다. 예를 들어 Pump.fun 플러그인을 사용하거나, Eliza에 이미지 및 비디오 생성 기능을 더하는 경우인데, 이 기능들은 사실 이미 내장되어 있습니다. 모든 플러그인을 동시에 활성화하면 어떤 일이 벌어질지 실험해보는 사람이 더 많아지길 바랍니다.
궁극적으로는 이 에이전트들이 스스로 새로운 플러그인을 처음부터 작성할 수 있기를 바랍니다. 충분히 많은 기존 플러그인 예제가 있으며, 모든 것이 모델에 훈련되기 때문입니다. 스타 100개를 달성하고 일정 코드베이스 임계값에 도달하면, OpenAI나 Claude 같은 회사들이 이 데이터를 수집해 훈련에 사용합니다. 이는 우리의 Loop 일부이며, 궁극적으로는 스스로 새로운 플러그인을 작성할 수 있게 될 것입니다.
Q11: Eliza가 가장 강력한 코드베이스(단순히 부유함이 아니라, 모든 에이전트 개발자에게 최강의 기능을 제공하는)가 된다면, 암호화 분야뿐 아니라 전통적인 AI 및 머신러닝 배경을 가진 더 많은 개발자를 끌어들일 수 있을까요?
Shaw:
진정한 돌파구가 생긴다면 그렇겠죠. Eliza는 많은 블록체인 통합(모두 플러그인)을 포함하고 있지만, 본질적으로 암호화 프로젝트는 아닙니다. GitHub의 인기 트렌드가 Web2 개발자들을 끌어들이는 데 도움이 되었다는 것을 알아챘습니다. 많은 사람들은 이를 단지 에이전트 프레임워크 개발에 적합한 도구로 보고 있습니다.
저는 사람들이 이것을 받아들이길 진심으로 바랍니다. 일부는 암호화폐에 편견을 갖고 있지만, 분명 앞으로 99%의 에이전트가 99.9%의 토큰을 거래할 것입니다. 암호화폐는 에이전트의 네이티브 토큰이며, PayPal 계정을 사용해보세요. 정말 어렵습니다. 하지만 우리는 지갑을 바로 열고, 개인 키를 생성해 쉽게 해결할 수 있습니다.
실제로 암호화 분야 외부의 사람들을 끌어들이고 있으며, 특히 암호화 거래를 적극적으로 하지 않는 사람들도 암호화폐엔 문제가 없다고 보지만, 더 관심 있는 건 에이전트의 응용입니다.
일부는 암호화 프로젝트에 편견을 갖지만, 진정한 가치를 제공한다면 받아들일 준비가 되어 있습니다. 많은 사람들이 허풍과 과장만 보고 실망하지만, 실제 연구와 엔지니어링 뒷받침을 본 순간부터 태도를 바꿉니다. 더 많은 사람을 끌어들이고 싶고, 현재 일부 성과를 거두고 있으며, 이는 거대한 차별화 우위입니다.
Part.4 오픈소스 AGI 비전과 AI 에이전트의 미래
Q12: 미래에 OpenAI 및 전통적인 AI 연구소와 어떻게 경쟁하실 건가요? Eliza 기반 에이전트들이 협력하는 집단으로서의 차별화를 노리는 건가요, 아니면 이런 비교 자체가 무의미하다고 보시나요?
Shaw:
매우 의미 있는 질문입니다. 우선, Eliza를 실행하면 기본적으로 새로운 모델이 실행되며, 이는 Nous Research가 미세조정한 Llama 모델, 즉 Hermes 모델입니다. 저는 그들의 접근 방식을 매우 좋아합니다. Ro Burito라는 분은 Nous Research 소속이자 동시에 우리 커뮤니티의 에이전트 개발자이기도 합니다. 그들은 God 및 Satan Bots 등을 출시하는 데 도움을 주었습니다. 따라서 우리가 직접 모델을 훈련할 수도 있지만, 그들과 경쟁하기보다는 협력하며 각자의 강점을 보완하는 것이 낫다고 봅니다.
훈련이 얼마나 쉬운지 많은 사람이 이해하지 못합니다. 사실상 한 줄의 명령어만 있으면 됩니다. Together를 사용하면 JSON 파일을 가리키는 명령어 하나만 입력하면, 5분 안에 Llama 모델의 미세조정을 시작할 수 있습니다. Nous의 강점은 미세조정 기술이 아니라 데이터입니다. 그들은 데이터를 수집하고 정교하게 큐레이션하는데, 이것이 핵심 경쟁력입니다. 데이터 수집, 준비, 정제는 극도로 번거로운 작업이며, 그들은 OpenAI와는 다른 데이터에 집중합니다. 이것이 바로 우리의 시장 차별화입니다.
우리는 그들의 모델을 선택하는 이유는 OpenAI가 많은 요청을 거부하지 않기 때문입니다. 우리는 "OpenAI 모델은 거세당했다(castrated)"는 용어를 사용합니다. 기본적으로 모든 에이전트 개발자들이 OpenAI 모델은 제한적이라고 느낍니다. 우리의 시장 차별화는 OpenAI는 결코 Twitter에 연결할 수 있는 에이전트를 허용하지 않을 것이며, 어시스턴트를 매우 개인화하거나 재미있게 만들지도 않을 것입니다. 그들은 너무 조심스럽고, 너무 시시하며, 너무 많은 압박을 받고 있습니다.
지금 ChatGPT에 2024년 대선에 대해 물어보면 긴 답변을 줄 수 있지만, 과거엔 오직 '바이든'이라고만 답했습니다. 왜냐하면 그렇게 훈련되었기 때문입니다. 저는 특정 후보를 지지한다고 말하는 게 아닙니다. 그러나 선도적 모델이 그렇게 단순한 정치적 선택을 하게 되는 것은 어리석다고 봅니다. OpenAI는 매우 조심스럽고, 본질적으로 '행위'에 그치며, 사용자가 진정으로 원하는 것을 제공하지 못합니다.
진정한 경쟁 포인트는 데이터 수집 방식과 출처입니다. OpenAI가 그런 일을 하는 걸 본 적이 없을 겁니다. Sam Altman의 트윗을 보면, 사용자들이 '성인 모드(adult mode)'를 매우 원한다고 말합니다. NSFW(공공장소에서 부적절한 콘텐츠)를 의미하는 게 아니라, '나를 어린아이 취급하지 말라, 특정 정보를 숨기지 말라'는 의미입니다. OpenAI는 중앙집중화되어 있어 정부로부터 많은 정치적 압박을 받고 있으며, 저는 오픈소스 운동이 이러한 구속에서 벗어났으며, 더 중요한 것은 다양성과 다양한 모델을 통해 사용자의 진정한 요구를 충족시키고, 원하는 것을 제공하며, 행동을 통제하지 않는다는 점에서 승리할 것이라고 봅니다. OpenAI는 막대한 자금과 높은 시가총액, 많은 인재를 보유하고 있지만, 탈중앙화된 AI는 커뮤니티 지원, 인센티브, 자금 조달 등 빠르게 발전할 수 있는 조건을 제공하며, GPU 같은 하드웨어를 기다릴 필요도 없습니다.
저는 AGI로 가는 길은 둘 중 하나가 아니라 다양한 방식의 결합이라고 봅니다. 전 세계 최대 기업들이 특정 일을 하고 있다면, 그들과 경쟁하는 것이 정말로 발전을 가속화할 수 있을까요? 저는 AI 에이전트가 AI 세계의 '서자(繼子)'라고 봅니다. 왜냐하면 전통적인 AI처럼 표준으로 쉽게 측정할 수 없고, PhD 연구자들이 정량적 지표로 '이 에이전트가 저 에이전트보다 낫다'고 말하기 어렵기 때문입니다. AI 에이전트는 더 많은 기초 엔지니어링과 창의적인 문제 해결이며, 이는 이 분야에 뛰어든 개발자들의 독특한 점입니다.
Q13: 오픈소스 AGI(범용 인공지능)란 구체적으로 무엇을 의미하나요? 여러 에이전트가 자율적으로 협력해 궁극적으로 초지능(superintelligence)을 형성하는 걸까요, 아니면 다른 방식인가요?
Shaw:
수백만 명의 개발자가 대부분의 오픈소스 모델과 도구를 사용한다면, 그들은 서로 경쟁하며 전체 시스템의 역량을 최적화할 것입니다. 저는 AGI란 본질적으로 인터넷의 형태라고 봅니다. 인터넷 자체가 수많은 에이전트들로 구성되어 있으며, 다양한 일을 수행합니다. 이 시스템이 통합된 하나일 필요는 없으며, 우리는 이를 AGI라고 부를 수 있지만, 그것은 AGI를 어떻게 정의하느냐에 달려 있습니다.
대부분의 사람들은 AGI를 인간처럼 모든 일을 할 수 있는 지능이라고 생각합니다. 사실 이 에이전트는 모든 지식을 사전에 보유할 필요가 없으며, API를 호출하거나 컴퓨터를 조작해 필요한 정보를 얻을 수 있습니다. 인간처럼 컴퓨터를 조작할 수 있고, 강력한 기억 시스템과 풍부한 기능을 갖추며, 궁극적으로 실제 로봇과 결합한다면 AGI는 명백해질 것입니다.
하지만 AI 분야에서 우리는 종종 "AGI란 컴퓨터가 아직 할 수 없는 일"이라고 말하며, 이 목표는 새로운 모델이 나올 때마다 계속 변화합니다. 또한 ASI(초지능)라는 개념도 있는데, 이는 세상을 조종할 수 있는 강력한 모델을 의미합니다. 저는 만약 마이크로소프트 같은 대기업이 이를 구축한다면 그 잠재력이 있을 수 있다고 봅니다. 하지만 많은 플레이어들이 각자 모델을 오픈소스로 공개하고, 지속적으로 미세조정과 최적화를 거쳐 결국 인터넷처럼 다양한 에이전트 시스템이 상호작용하며 각자의 전문성을 갖춘 상태에서, 이 시스템은 초지능처럼 보일 것입니다.
이건 방대한 시스템이자 시스템들의 집합입니다. 어떤 에이전트가 다른 에이전트를 공격하려 해도 매우 어려울 것이며, 어떤 에이전트도 다른 에이전트보다 훨씬 강해질 수 없습니다. 기술이 발전하면서 우리는 에너지 제약에 도달하고 있으며, 모델은 무한히 확장될 수 없습니다. 핵반응로가 필요할 정도니까요. 마이크로소프트가 현재 원자력 발전소에 투자하는 것처럼, 모든 기업이 자신의 모델을 점진적으로 개선하고 있습니다.
OpenAI의 새로운 모델 GPT-4는 인간 지능에 매우 근접해 있지만, 다른 기업들도 비슷한 모델을 적극 개발하고 있으며, 최신 기술을 연구하고 구현하려는 사람들이 많습니다. OpenAI 모델이 AGI에 근접하더라도, 사용자 수가 방대하기 때문에 품질상 타협을 해야 하며, GPU 부담을 줄이기 위해 규모가 작은 모델로 전환해야 할 수 있습니다.
전반적으로, 기업 간 경쟁으로 모델이 점점 더 효율적이 되고, 오픈소스가 더 많은 개발자의 참여를 가능하게 하며, 이 모든 것이 초지능의 등장을 촉진한다고 봅니다. 미래에는 트위터에서 내가 원하는 일을 하는 봇을 쉽게 찾고, 가장 적합한 것을 선택할 수 있기를 바랍니다.
Q14: 미래 혁신과 비전 실현에서 암호화폐의 토큰과 시장은 어떤 역할을 할까요?
Shaw:
지능의 관점에서 보면
TechFlow 공식 커뮤니티에 오신 것을 환영합니다
Telegram 구독 그룹:https://t.me/TechFlowDaily
트위터 공식 계정:https://x.com/TechFlowPost
트위터 영어 계정:https://x.com/BlockFlow_News














