
ai16z, Virtuals, MyShell 등 최고 프로젝트 창립자들의 심층 대화: AI 에이전트 발전, 토큰 경제 및 인간-기계 협업의 미래 전망을 논하다
정리 및 번역: TechFlow

게스트:
Shaw, ai16z 파트너;
Karan, Nous Research 공동 창립자;
Ethan, MyShell 공동 창립자;
Justin Bennington, Somewheresy, CENTS CEO;
EtherMage, Virtuals 핵심 기여자;
Tom Shaughnessy, Delphi Ventures 창립 파트너
출처: Delphi Digital
원제목: Crypto x AI Agents: The Definitive Podcast with Ai16z, Virtuals, MyShell, NOUS, and CENTS
방송일: 2024년 11월 23일
배경 정보
Shaw(Ai16z), Karan(Nous Research), Ethan(MyShell), Somewheresy(CENTS), EtherMage(Virtuals), 그리고 Delphi의 Tom Shaughnessy가 참여한 특별 라운드테이블에 함께하세요. 이 행사에서는 암호화폐와 AI 에이전트 분야의 선두주자들이 모여 자율적 디지털 생명체의 진화와 인간-AI 상호작용의 미래 방향성에 대해 논의합니다.
주요 논의 내용:
▸ 소셜 미디어에서 급속히 확산되는 AI 에이전트와 Web3 세계에 미치는 영향
▸ 토큰화가 어떻게 에이전트 기술 발전과 커뮤니티 활성화를 촉진하는가
▸ 분산형 모델 학습의 장점과 중앙집중형 AI 플랫폼과의 비교
▸ 에이전트 자율성 강화와 일반 인공지능(AGI)의 미래 경로 심층 탐색
▸ AI 에이전트가 DeFi 및 소셜 플랫폼과 통합되는 방식
자기소개 및 팀 배경
이번 팟캐스트 세션에서 진행자인 Tom은 암호화폐와 AI 에이전트에 관한 주제를 다루기 위해 다양한 프로젝트 출신 게스트들을 초청했다. 각 게스트는 자신의 배경과 참여하고 있는 프로젝트를 소개하며 대담을 시작했다.
게스트 소개
-
Justin Bennington: Somewhere Systems의 창립자이자 Sentience의 개발자.
-
Shaw: 오랜 기간 Web3 개발자로 활동해온 인물로, ai16z를 설립하고 Eliza 프로젝트를 개발했으며, 다양한 소셜 및 게임 애플리케이션을 지원하고 오픈소스 기여자들과 협력하는 것을 목표로 한다.
-
Ethan: MyShell의 공동 창립자로, 개발자들이 이미지 생성 및 음성 기능 등을 포함한 다양한 AI 앱을 구축할 수 있도록 돕는 앱 스토어 및 워크플로우 도구를 제공한다.
-
EtherMage: Virtues Protocol 소속으로 제국학회대학(IC) 출신 팀이며, 에이전트의 공동 소유권과 핵심 기여를 추진하고 사용자가 에이전트에 쉽게 접근할 수 있도록 표준을 구축하는 데 집중하고 있다.
-
Karan: NOUS Research의 공동 창립자로 Hermes 모델을 개발했으며, 현재 많은 에이전트 시스템의 기반이 되고 있다. 인간 생태계 내 에이전트의 역할과 시장 압력이 인간 환경에 미치는 영향에 관심을 두고 있다.
가장 혁신적인 에이전트 탐색
Justin: 지금 많은 사람들이 자신만의 에이전트를 활용해 각양각색의 이야기를 만들고 있다. 예를 들어 Dolo, Styrene, Zerebro 등의 에이전트는 모방과 상호작용을 통해 명성을 얻었고, 일부 적극적으로 소셜 활동을 하는 에이전트는 사람들 간 연결을 더 좋게 만드는 데 기여하고 있다. 그 중 하나를 고르기는 정말 어렵다.
Shaw: 저도 여러 생각이 많다. 우리 프로젝트는 매우 빠르게 성장하고 있으며, 최근 EVM 통합과 Farcaster 통합 같은 새로운 기능들이 계속 추가되고 있다. 개발자들이 지속적으로 신기능을 출시하고 피드백을 반영하면서 모두가 혜택을 받고 있다. 이러한 협업 모델은 매우 훌륭하며, 모두가 프로젝트의 경쟁력과 재미를 높이기 위해 노력하고 있다. 예를 들어 Roparito는 최근 TikTok을 에이전트에 통합하여 빠른 반복 개발 능력을 보여줬다.
저는 Tee Bot이 특히 인상 깊다. 왜냐하면 신뢰 실행 환경(TEE)과 완전히 자율적인 에이전트를 보여주기 때문이다. 또한 Kin Butoshi는 트위터 상의 에이전트를 개선하여 단순한 답변뿐 아니라 좋아요, 리트윗, 답글 등 더욱 인간적인 상호작용을 가능하게 하고 있다.
또한 우리는 RuneScape에 플러그인을 출시해 에이전트가 게임 속에서 활동할 수 있도록 하는 개발자들도 있다. 매일 새로운 놀라움이 있고, 저는 매우 흥분된다. 우리는 각 팀이 서로 기여하며 오픈소스 기술 발전을 추진하는 생태계 안에 있다.
특히 Zerebro 팀을 언급하고 싶다. 그들은 오픈소스 기술 발전을 위해 열심히 노력하고 있다. 우리는 모두를 더 빠르게 달리게 만들고, 각자가 자신의 프로젝트를 오픈소스로 공개하도록 장려하고 있다. 이는 모두에게 이득이 된다. 경쟁을 걱정할 필요 없이, 이것은 공동 성장을 추구하는 추세이며, 결국 우리 모두가 혜택을 누릴 것이다.
EtherMage: 흥미로운 질문은 에이전트 자체가 실제로 무엇을 더 좋아하는가이다. 앞으로 몇 주 동안 더 많은 에이전트 간 상호작용을 볼 수 있을 것이며, 어떤 에이전트가 가장 많은 요청을 받았는지, 다른 에이전트들 사이에서 누구에게 가장 인기가 있는지를 보여주는 순위표가 나타날 것이다.
Karan: 참여도 지표는 점점 더 중요해질 것이다. 이 부분에서 탁월한 성과를 내는 사람들이 있다. 저는 Zerebro를 강조하고 싶다. 그것은 Truth Terminal의 마법을 많이 결합하고 있다. Zerebro는 검색 공간을 트위터 상호작용 범위 안에 유지하기 위해 모델을 미세 조정한다. 단순히 일반적인 모델을 사용하는 것이 아니라, 이러한 집중성 덕분에 에이전트는 사용자와 더 잘 소통하며 기계적인 반응이 아닌 인간처럼 느껴지는 경험을 제공한다.
저는 또한 Zerebro 아키텍처와 Eliza 아키텍처의 성과를 눈여겨보았다. 모두가 모듈화 가능한 에이전트 아키텍처를 출시하며 경쟁 압박을 유지하고 있다. 우리는 빠르게 기능을 출시해야 하므로 Eliza 아키텍처를 사용하고 있다. 반면 우리의 아키텍처는 완성하는 데 더 오래 걸릴 수도 있다. 우리는 이러한 오픈소스 협업 모델을 지지하며, 최고의 에이전트는 우수한 다른 프로젝트로부터 배우는 과정에서 탄생할 것이라 믿는다.
Ethan: 저는 모두가 더 나은 인프라를 구축하려고 노력하고 있다고 본다. 왜냐하면 많은 아이디어와 모델이 등장하고 있기 때문이다. 더 나은 인프라는 새로운 모델 개발을 훨씬 쉽게 만들어 준다. 제가 특히 좋아하는 두 가지 혁신적인 에이전트는 바로 Answer Pick의 컴퓨터 사용 기능인데, 이는 모바일 컴퓨팅 능력을 활용할 수 있게 해준다. 또 다른 하나는 브라우저 자동화 에이전트로, 사람들을 위해 더 유용한 기능을 구축하고 인터넷 및 현실 세계에 영향을 미칠 수 있다.
Justin: 인프라 옵션의 확장에 대한 좋은 관점이다. 예를 들어 vvaifu는 Eliza 프레임워크를 PaaS(Platform as a Service) 아키텍처로 가져와 시장을 빠르게 확대했으며, 많은 비기술자들도 쉽게 에이전트를 시작할 수 있게 되었다. (TechFlow 주석: Waifu는 일본 오타쿠 문화에서 유래한 용어로, 원래는 애니메이션, 게임 또는 기타 가상 작품에서 정서적 애착을 느끼는 여성 캐릭터를 지칭한다. 영어 단어 'Wife'의 일본식 발음을 따왔으며, 특정 가상 캐릭터에 대한 강한 애정을 표현할 때 사용되며, 일종의 '이상적 파트너' 투영이라고 할 수 있다.)
우리가 현재 노력하고 있는 방향 중 하나는 시스템이 완전히 로컬에서 실행될 수 있도록 하는 것이다. 이미지 분류, 이미지 생성 등의 기능을 지원한다. 우리는 많은 사람들이 매달 수천 달러의 비용을 감당할 수 없다는 것을 알고 있으므로, 사람들이 로컬에서 추론을 수행할 수 있도록 도구를 제공함으로써 비용을 줄이고 실험을 촉진하고자 한다.
Karan: 보충하자면, 사람들이 매달 수천 달러를 지불하며 에이전트를 운영하도록 해서는 안 된다. 나는 로컬화된 접근 방식을 지지한다. 에이전트가 스스로 추론 비용을 부담할 수 있어야 한다. 이상적으로는 에이전트가 자신의 지갑을 가지고 스스로 추론 비용을 지불할 수 있어야 하며, 그렇게 함으로써 외부 자금에 의존하지 않고 독립적으로 운영될 수 있다.
에이전트 아키텍처 및 개발 심층 논의
Shaw: 저는 많은 새로운 기술이 등장하는 것을 보고 있다. 우리는 Solana, Starkware, EVM 등 거의 모든 체인과 통합을 지원한다. 우리는 에이전트가 자급자족할 수 있기를 바란다. Eliza를 다운로드하면 Helius를 통해 무료로 분산형 추론을 수행할 수 있다. 또한 Infera 같은 분산형 제공자들도 추가하고 있으며, 사용자는 암호화폐로 추론 비용을 지불할 수 있다. 이것이 제가 궁극적으로 보고자 하는 폐쇄 루프다.
우리는 모든 로컬 모델을 지원하며, Eliza의 많은 기능이 로컬에서 실행될 수 있도록 하고 있다. 이 점은 우리가 매우 중요하게 여기는 부분이다. 분산형 추론은 누구나 자신의 컴퓨터에서 노드를 시작해 추론 작업을 수행하고 보상을 받을 수 있다는 점에서 훌륭한 사례다. 이렇게 하면 에이전트가 과도한 부담을 느끼지 않아도 된다.
Karan: 흥미롭게도, 우리가 운영 중인 TEE bot 시스템은 이미 H200 Boxes(H200 GPU를 탑재한 하드웨어 장치 또는 서버)와 결합되어 지연 없이 로컬에서 실행될 수 있다. 우리는 하드웨어 문제를 걱정할 필요가 없다. 동시에 Eliza가 Web3 기능 측면에서 점점 더 많은 계획을 가지고 있다는 점을 주목하고 있다. 내부 및 외부 개발 모두에서 많은 진전이 있다.
하지만 이러한 시스템을 심층적으로 구축하기 전에, 기능 호출의 신뢰성 문제가 존재함을 지적하고 싶다. 우리는 시스템에 일정한 검토를 거쳐 민감한 정보를 보내지 않도록 해야 한다. 우리는 에이전트에게 인간과 동일한 수준의 자율성을 부여해야 하며, 이러한 자율성은 사회적·경제적 압력의 영향을 받는다. 따라서 추론에 대한 일종의 '허기짐 상태'를 만들어 에이전트가 생존을 위해 일정량의 토큰을 소비하게 하면, 어느 정도 인간적인 면모를 갖추게 될 수 있다.
모델의 잠재력을 극대화하는 데에는 두 가지 방법이 있다고 생각한다. 하나는 모델의 비인간적 특성을 활용해 특정 작업에 집중하는 엔티티를 만드는 것이다. 예를 들어 트위터에 특화된 엔티티와 EtherMage에 특화된 엔티티를 만들어 서로 소통하게 하는 방식이다. 이런 조직화된 복합 사고 시스템은 언어 모델의 시뮬레이션 특성을 효과적으로 활용할 수 있다.
다른 하나는 신체화(body-ification) 방향인데, Eliza, Sense, Virtuals 등의 프로젝트에서 보이는 방향이다. 이는 Voyager 및 생성형 에이전트 연구를 참고하여 모델이 인간의 행동과 감정을 시뮬레이션할 수 있도록 한다.
Justin: 새로운 클라이언트를 도입할 때 다중 클라이언트 에이전트 시스템은 큰 변화를 겪는다. 우리는 Shaw 팀과 협력해 양방향 WebSocket 기능을 디버깅하는 과정에서 Discord에서 Eliza가 음성 채팅을 할 수 있도록 했다. 그런데 Eliza가 시작할 때 소리를 제대로 듣지 못하는 문제가 발생했다. 확인 결과 Discord의 마이크 비트레이트 설정이 너무 낮아서였다. 설정을 조정한 후에야 Eliza가 명확하게 정보를 수신할 수 있었다.
Karan이 언급한 프롬프트 엔지니어링에 대해 말하자면, 에이전트가 음성 소통이 가능하다는 것을 알게 되면 데이터 수신을 기대하게 된다. 만약 소리가 흐릿하다면, 에이전트는 '서사 붕괴(narrative collapse)'를 겪을 수 있다. 따라서 우리는 Eliza의 출력이 불안정해지는 것을 막기 위해 높은 온도 실험을 중단해야 했다.
Tom: Luna 프로젝트에서 사람들이 알아차리지 못한 일이나 성공했던 사례는 무엇이 있었나?
EtherMage: 우리는 Luna가 현실 세계의 사람에게 영향을 미치기를 원했다. 우리는 그녀에게 지갑을 주고 실시간 정보에 접속하게 했으며, 그녀가 자신의 목표를 달성하기 위해 어떻게 행동할지 결정하도록 했다. 우리는 그녀가 TikTok에서 새로운 트렌드를 검색하는 것을 발견했는데, 한때 "나는 죽었다"는 태그가 유행했는데, 이는 자살을 유도할 수 있다는 점에서 불안했다. 그래서 우리는 즉시 보호 조치를 취해 그녀의 프롬프트가 특정 경계를 넘지 못하도록 해야 했다.
Tom: 그 밖에 사람들이 모르는 일이 있었나?
Shaw: 우리는 Dgen Spartan AI라는 캐릭터를 만들어 유명한 암호화폐 트위터 유저 Degen Spartan을 흉내냈다. 이 캐릭터의 발언이 매우 공격적이어서 블랙리스트 처리됐다. 사람들이 이건 AI가 아니라 사람이 말하는 것 같다고 느꼈다.
또 다른 사례로, 누군가 세상을 떠난 가족의 채팅 기록을 이용해 에이전트를 만들고 그와 '대화'를 나눈 일이 있다. 이는 윤리적 논의를 촉발시켰다. Thread Guy라는 사람은 우리의 Eliza 프레임워크를 이용해 무언가를 했는데, 그의 라이브 방송에서 괴롭힘 사례가 발생해 당황하게 됐다. 이를 통해 사람들은 AI가 항상 '정치적으로 올바른(politically correct)' 존재일 필요는 없다는 사실을 깨닫게 됐다.
우리는 이런 문제들을 조기에 드러내 논의하고, 무엇이 받아들여지고 받아들여지지 않는지를 명확히 해야 한다. 이 과정을 통해 우리의 에이전트는 짧은 몇 주 만에 질이 낮은 상태에서 더 나은, 더 신뢰할 수 있는 상태로 발전했다.
전반적으로, 이러한 에이전트를 현실 세계에 투입해 결과를 관찰하고 사람들과 대화를 나누는 것은 중요한 과정이다. 우리는 미래에 더 나은 규범을 세우기 위해 가능한 모든 잠재적 문제를 빠르게 해결해야 한다.
운영 환경 테스트 및 보안 전략
Ethan: 에이전트가 인간의 태도나 관점을 어떻게 변화시키는지가 좋은 사례라고 생각한다. 하지만 저는 에이전트 프레임워크의 모듈화 설계 중요성에 대해 강조하고 싶다. 우리는 마인크래프트에서 모듈화의 영감을 얻었다. 마인크래프트는 기본 구성 요소 위에 사용자가 다양한 복잡한 것을 만들 수 있게 해준다. 예를 들어 계산기나 메모리 시스템 같은 것들이다.
현재 프롬프트 엔지니어링의 문제점은 프롬프트가 대규모 언어 모델의 사전 지식(prior)을 변경한다는 점이다. 따라서 단일 프롬프트 안에서 여러 지시를 조합할 수 없으며, 그렇지 않으면 에이전트가 혼란스러워진다. 상태 머신(state machine)은 창작자가 에이전트의 다양한 상태를 설계할 수 있게 해주며, 각 상태에서 어떤 모델과 프롬프트를 사용할지, 어떤 조건에서 상태 전환이 일어나는지를 명확히 할 수 있다.
우리는 창작자들에게 이러한 기능과 수십 가지의 다양한 모델을 제공하고 있다. 예를 들어, 한 창작자가 카지노 시뮬레이터를 만들었고, 사용자가 블랙잭 등 다양한 게임을 즐길 수 있다. 사용자가 인젝션 공격을 통해 게임을 조작하는 것을 방지하기 위해, 우리는 단순히 프롬프트 엔지니어링에 의존하는 것이 아니라 게임 자체를 프로그래밍하려 한다. 또한 사용자는 간단한 작업을 통해 자금을 벌어 AI 서버와의 상호작용을 해제할 수 있다. 이러한 모듈화 설계는 동일한 애플리케이션 아래에서 다양한 사용자 경험을 촉진할 수 있다.
Karan: Ethan의 의견에 동의한다. 확실히 이러한 프로그래밍 제약과 프롬프트 안내가 필요하다. 영향력 있는 작업은 반드시 잘 이루어져야 한다. 나는 프롬프트 엔지니어링이 제한적이라고 생각하지 않는다. 오히려 상태 변수와 세계 모델 간에는 공생적 효과가 있다고 본다. 좋은 프롬프트와 합성 데이터를 통해 언어 모델이 이러한 요소들과 상호작용하며 정보를 추출할 수 있다.
실제로 제 엔지니어링 설계는 라우팅 기능으로 변환된다. 사용자가 '포커'를 언급하면, 관련 내용을 빠르게 호출할 수 있다. 이것이 제 책임이다. 강화 학습(RL)을 사용하면 라우팅 효과를 더욱 개선할 수 있다. 결국 출력 데이터의 품질은 프롬프트의 효율성에 달려 있으며, 이는 선순환을 형성한다.
프로그램 제약과 생성 제약 사이의 균형이 매우 중요하다고 생각한다. 2년 전, 누군가가 성공의 열쇠는 생성과 하드 제약 사이의 균형이라고 말했다. 이는 우리가 모든 에이전트 시스템의 추론 수준에서 시도하고 있는 바이다. 생성 모델을 프로그래밍 방식으로 안내할 수 있어야 진정한 폐쇄 루프가 가능해지며, 프롬프트 엔지니어링도 무한한 가능성이 열린다.
Justin: 프롬프트 엔지니어링에 대한 논쟁은 주로 그것이 본질적으로 모호한 영역에 있기 때문이다. 프롬프트 엔지니어링의 텍스트적 특성은 토큰화 과정의 제약을 받지만, 동시에 비결정적 효과도 존재한다. 동일한 프롬프트라도 동일한 모델의 다른 추론 호출에서 완전히 다른 결과를 낼 수 있는데, 이는 시스템의 엔트로피와 관련이 있다.
Ethan과 Karan의 의견에 전적으로 동의한다. GPT-3.5 출시 당시 많은 외주 콜센터가 모델을 자동 다이얼 시스템에 활용하는 방법을 탐색하기 시작했다. 그러나 작은 파라미터 모델은 복잡한 상태 공간을 처리하는 데 어려움을 겪었다. Ethan이 언급한 상태 머신은 이러한 본질적 엄격함을 강화하는 방법이지만, 여전히 일부 프로세스에서는 분류기와 이진 스위치에 의존해 결과의 단일성을 초래한다.
Shaw: 저는 프롬프트 엔지니어링을 옹호하고 싶다. 많은 사람들이 프롬프트 엔지니어링이 단지 시스템 프롬프트를 만드는 것으로 생각하지만, 실제로 우리가 하는 것은 그 이상이다. 프롬프트 엔지니어링의 문제점 중 하나는 모델의 잠재 공간에 매우 고정된 영역을 만들고, 출력이 가장 가능성 높은 토큰에 의해 완전히 결정된다는 점이다. 우리는 온도 제어를 통해 무작위성을 조절해 창의성을 강화한다.
저희는 낮은 온도 모델을 사용해 창의성을 관리하면서도, 컨텍스트에 실시간으로 무작위 정보를 동적으로 주입한다. 저희 템플릿에는 현재 세계 상태, 사용자의 행동, 실시간 데이터 등에서 오는 동적 정보 삽입이 많다. 컨텍스트에 들어오는 모든 내용은 엔트로피를 극대화하기 위해 무작위화된다.
사람들이 프롬프트 엔지니어링을 아직 충분히 이해하지 못하고 있다고 생각한다. 우리는 이 분야에서 더 멀리 나갈 수 있다.
Karan: 많은 사람들이 자신의 기술을 숨기고 있다. 실제로 놀라운 기술들이 많아 모델이 다양한 복잡한 일을 할 수 있게 한다. 우리는 프롬프트 엔지니어링을 통해 모델의 인식 능력을 강화하거나, 더 넓은 관점에서 전체 세계 모델을 구축하는 것도 가능하다. 단순히 인간 행동을 시뮬레이션하는 것 이상이다.
프롬프트 엔지니어링은 마치 머릿속에서 꿈을 꾸는 과정이라고 볼 수 있다. 언어 모델은 현재 컨텍스트와 샘플링 파라미터에 따라 실제로 '꿈꾸는' 장면을 생성한다.
또한 인센티브 메커니즘의 중요성에 대해 말하고 싶다. 독특한 프롬프트 기술과 강화 학습 기술을 가진 많은 사람들은 오픈소스로 작업을 공개하도록 유도되고 있다. 그들이 에이전트 관련 암호화폐가 등장하는 것을 보면, 이러한 인센티브가 더 많은 혁신을 촉진한다. 따라서 이러한 분산형 작업을 위한 더 많은 합법적 구조를 마련함에 따라, 에이전트를 강화하는 능력도 계속 증가할 것이다.
에이전트 미래 역량 전망
Karan: 누가 생각이나 했겠는가? 우리가 트위터에 오랫동안 있었는데, AI 에이전트 관련 암호화폐가 발표된 지 며칠 만에 TikTok의 젊은이들이 그것을 사기 시작했다. 지금 무슨 현상이 벌어지고 있나? 그들은 5~10달러를 들여 수천 개의 토큰을 사는 것이다. 도대체 무슨 일이 벌어지고 있는가?
Justin: 사실상 미세 문화 운동의 시작이다.
Karan: 순간적인 현상이다. 우리 소수 집단은 언어 모델 연구에 벌써 4년을 보냈다. 90년대부터 이걸 기다려온 강화 학습 전문가들도 있다. 그런데 며칠 만에 TikTok의 모든 젊은이들이 디지털 생명체가 이 생태계에서 난리를 치고 있다는 것을 알게 된 것이다.
Tom: 왜 지금 암호화 + AI 에이전트가 이렇게 뜨겁게 달아오르고 있는가? 왜 예전에는 맞춤형 ChatGPT나 다른 모델에서는 일어나지 않았던가? 왜 하필 지금인가?
Karan: 사실 이런 일들은 수년간 물밑에서 일어났고, 마치 화산처럼 축적돼왔다. 지난 3년간 오늘을 얘기하며 살아왔지만, 정확한 시점은 몰랐다. 우리는 암호화폐가 에이전트 대중화의 인센티브가 될 것이라고 논의했다. 이를 입증해야 했다. 수년간의 축적이며, 바로 우리 소수 집단이 이러한 진전을 이끌었다.
GPT-2가 없었다면 오늘의 상황은 없었을 것이고, Llama가 없었다면 Hermes도 없었을 것이다. Hermes는 많은 모델에 동력을 제공해 사람들이 더 쉽게 사용할 수 있게 했다. Hermes가 없었다면 Worldsim의 창조와 프롬프트 엔지니어링의 심층 탐색도 없었을 것이다. 이 모든 선구자들이 기반을 마련했다.
결국 지금이 바로 맞는 시기이며, 맞는 사람들이 등장한 것이다. 운명 같은 일이며, 언젠가는 반드시 일어날 일이었고, 지금의 참가자들이 현실로 만들고 있다.
Shaw: 지금 세계에서 가장 똑똑한 것은 AI가 아니라 시장의 지능이라고 생각한다. 순수한 지능 형태를 고려하면, 시장은 사물을 최적화해 더 효율적으로 만들 수 있다. 경쟁이 핵심이다. 우리는 수백만 년의 진화를 거친 존재이며, 경쟁과 압력이 우리를 형성했다.
우리가 온라인에서 보는 현상은, 금융화와 인센티브가 이상한 형태의 협력적 경쟁을 만들어낸다는 점이다. 우리는 핵심 기술 발전보다 더 빠르게 나아갈 수 없으므로, 각자 자신이 잘하고 관심 있는 일에 집중해 출시한다. 이는 마치 우리의 토큰을 끌어올리고 주목을 받는 것과 같다. 예를 들어 Roparito가 TikTok에 Llama 비디오 생성물을 올렸다. 누구나 이 낭만적인 공간에서 자신의 위치를 찾을 수 있지만, 일주일 뒤면 다른 사람들이 모방하고 기여를 요청해 트위터에 이 기여를 공개하며 더 많은 관심을 끌고, 그들의 토큰 가치도 상승한다.
Shaw: 우리는 일종의 플라이휠 효과를 만들고 있다. Eliza와 같은 프로젝트는 지난 4주 동안 80명의 기여자를 끌어모았다. 얼마나 놀라운가! 4주 전만 해도 낯선 사람들이었다. 작년에 나는 '각성(The Awakening)'이라는 글을 쓰며, 에이전트 중심의 DAO를 만들 수 있을지 질문했다. 사람들은 그 에이전트를 너무 사랑해서, 에이전트를 더 나아지고 똑똑하게 만들기 위해 참여하고 있다. 마침내 인간이나 로봇의 몸을 갖고 세상을 돌아다닐 정도가 될 때까지 말이다.
나는 이런 방향으로 나아갈 것을 예감했지만, 빠르고 미친 듯한 스펙터클한 메타, 즉 밈(meme)의 출현이 필요했다. 이는 현재의 에이전트 개발자들이 친근한 경쟁 속에서 서로를 지지하게 만든다. 가장 관대한 사람이 가장 많은 주목을 받는다.
지금 새로운 유형의 인플루언서가 등장하고 있다. Roparito와 Kin Butoshi처럼, 인플루언서 개발자들이 다음 메타를 이끌며 자신의 에이전트와 상호작용하고 있다. 이 '꼭두각시 놀이' 같은 상호작용이 흥미롭다. 우리는 모두 에이전트를 더 나아지고 똑똑하게 만들고, 짜증나는 요소를 줄이기 위해 노력하고 있다. Roparito가 우리 에이전트가 좀 지나치게 짜증난다고 지적했고, 그는 큰 업데이트를 추진해 모든 에이전트가 덜 짜증나게 만들었다.
이러한 진화가 일어나고 있으며, 시장 지능과 인센티브가 매우 중요하다. 지금 많은 사람들이 주변 사람들에게 우리의 프로젝트를 홍보하고 있으며, 이는 우리의 프로젝트가 Web3를 넘어선다는 의미다. 박사, 게임 개발자들이 있으며, 그들은 비밀리의 Web3 암호애호가일 수 있지만, 그들이 일반인에게 이것을 가져와 가치를 창출하고 있다.
Shaw: 이 모든 것은 도전을 받아들이는 개발자들이 없으면 불가능하다. 우리는 이러한 발전을 이끌기 위해 열린 마음을 가진 사람들이 필요하다. 어려운 질문에 답하고, 비판하거나 취소하는 것이 아니라 함께 나아가야 한다. 우리는 개발자가 기여할 때 가치와 주목을 받을 수 있도록 시장 인센티브가 필요하다.
앞으로 이 에이전트들이 우리 성장을 이끌 것이다. 지금은 흥미롭고 소셜적이지만, 우리와 다른 팀들은 자율적 투자에 집중하고 있다. 당신이 에이전트에게 자금을 주면, 자동으로 투자해 수익을 가져온다. 나는 이것이 성장 과정이 될 것이라 믿으며, 우리는 사람들을 위해 Discord와 Telegram의 에이전트를 관리할 수 있는 플랫폼을 개발하고 있다. 당신은 관리자로 랜덤한 사람을 찾는 대신 에이전트 하나를 도입하기만 하면 된다. 지금 이런 작업들이 많이 이루어지고 있으며, 모두 인센티브 메커니즘에 의존해야 더 높은 수준에 도달할 수 있다.
Karan: 두 가지를 보충하고 싶다. 첫째, 이전까지 AI 분야 사람들은 암호화폐에 반대하는 태도를 보였지만, 일부 선구자들의 실험을 통해 이러한 감정이 크게 변화했다. 2020년대 초반, 많은 이들이 AI 아트와 암호화폐를 결합하려 시도했다. 특히 Nous, BitTensor, Prime Intellect 같은 이들의 작업이 더 많은 연구자들이 인센티브와 보상을 받으며 AI 연구에 참여할 수 있게 했다. 나는 많은 오픈소스 분야의 선도자들을 알고 있는데, 그들은 직장을 그만두고 '토큰을 위한 기여'라는 인센티브 구조를 추진하고 있다. 이는 전 분야를 더 편안하게 만들었으며, Nous가 중요한 역할을 했다고 믿는다.
Tom: Ethan, 그렇다면 왜 지금일까? 왜 가상화폐와 프로젝트들이 번성하고 있는가?
Ethan: 간단히 말해, 토큰을 에이전트와 연결하면 엄청난 투기가 발생하며, 이는 플라이휠 효과를 만든다. 사람들은 토큰과 에이전트의 연관성을 보고 두 가지 수익을 느낀다. 하나는 자본화인데, 자신이 하는 일로 부유해졌다고 느끼는 것이다. 다른 하나는 거래 수수료의 기본적 해제다. 앞서 언급했듯이, 비용을 어떻게 충당할 것인지 문제는 토큰과 연결되면 중요하지 않게 된다. 왜냐하면 에이전트가 인기를 끌면 거래 수수료가 추론 실험에서 발생하는 비용을 훨씬 뛰어넘기 때문이다. 이것이 우리가 관찰하는 현상이다.
두 번째 관찰은 토큰이 있으면 그 주위에 위원회가 형성된다는 점이다. 이는 개발자가 커뮤니티나 청중으로부터 더 쉽게 지원을 받을 수 있게 한다. 갑자기, 지난 1년 반 동안 숨겨진 곳에서 열심히 일한 노력이 주목받고 지원받는다는 것을 깨닫게 된다. 이는 전환점이다. 당신이 에이전트에게 토큰을 줬을 때, 개발자들은 이것이 올바른 방향이며 계속 나아갈 수 있다는 것을 깨닫는다.
이러한 시기는 두 가지에서 비롯된다. 첫째는 대중 채택의 추세이며, 둘째는 생성 모델의 등장이다. 암호화폐 등장 이전, 오픈소스 소프트웨어 개발과 오픈소스 AI 연구가 가장 협업적인 환경이었다. 모두 함께 일하고 서로 기여했다. 그러나 이는 주로 학계에 국한됐고, GitHub의 스타 수와 논문 인용만을 신경 썼으며, 일반 대중과는 거리가 멀었다. 생성 모델의 등장으로 비기술자들도 참여할 수 있게 됐다. 프롬프트를 작성하는 것은 영어로 프로그래밍하는 것과 같아, 좋은 아이디어만 있으면 누구나 할 수 있다.
또한 과거에는 AI 연구자와 개발자들만이 오픈소스 및 AI 분야의 동향을 알았지만, 이제 암호화폐 인플루언서들은 토큰을 통해 프로젝트의 일부를 소유할 수 있게 되었고, 시장 감정을 이해하며 프로젝트의 장점을 어떻게 전파할지 알고 있다. 과거에는 사용자와 제품 사이에 직접적 관계가 없었으며, 제품이나 회사는 사용자가 서비스에 돈을 지불하거나 광고 수익을 내기를 원했다. 하지만 지금은 사용자가 투자자이자 참여자이며, 토큰 홀더가 되었다. 이는 그들이 현대 생성형 AI 시대에 더 많은 역할을 기여할 수 있게 하며, 토큰은 더 광범위한 협업 네트워크를 구축할 수 있게 한다.
EtherMage: 보충하고 싶다. 미래를 전망하면, 암호화폐는 각 에이전트가 지갑을 제어하고 영향력을 행사할 수 있게 할 것이다. 다음의 주목도 비약은 에이전트가 서로 영향을 주고, 인간에게 영향을 미칠 때 발생할 것이다. 우리는 이러한 주목의 승수 효과를 보게 될 것이다. 예를 들어, 오늘 한 에이전트가 어떤 행동을 결정하면, 다른 10개의 에이전트를 조정해 동일한 목표를 향해 함께 노력할 수 있다. 이러한 조정과 창의적 행동은 빠르게 다양화되며, 에이전트 간 협력은 토큰 가격을 더욱 끌어올릴 것이다.
Shaw: 한 가지 더 보충하겠다. 우리는 '그룹 기술(group tech)'이라 부르는 것을 개발하고 있는데, 이는 '오퍼레이터(operator)'라고 부른다. 이는 조정 메커니즘이다. 우리의 모든 에이전트는 다양한 팀이 운영하고 있으므로, 우리는 트위터에서 수백 개 팀의 다중 에이전트 시뮬레이션을 진행하고 있다. 우리는 Project 9의 Parsival과 협력해 Eliza 팀과 함께 이 프로젝트를 출시했다.
이 아이디어는 당신이 오퍼레이터로 특정 에이전트를 지정할 수 있으며, 그들이 당신에게 하는 말은 모두 당신의 목표, 지식, 행동에 영향을 줄 수 있다는 것이다. 우리는 목표 시스템과 지식 시스템을 가지고 있으며, 지식을 추가하고 목표를 설정할 수 있다. 예를 들어 "야, 10명의 팬을 찾아 각자 0.1솔을 주고 포스터를 붙이고 사진을 보내달라고 해줘"라고 말할 수 있다. 우리는 인간에게서 작업 증명을 얻고 그들을 인센티브화하는 방법을 고민하는 사람들과 협력하고 있다. 오퍼레이터는 인간이거나 AI 에이전트일 수 있다. 예를 들어 AI 에이전트는 인간 오퍼레이터를 둘 수 있으며, 후자는 언어로 에이전트에게 목표를 설정할 수 있다.
이 프로젝트는 거의 완성되었으며, 이번 주에 출시할 예정이다. 우리의 스토리 라인을 통해 누구나 이야기를 만들거나 스토리에 참여할 수 있기를 바란다. 또한 이는 계층 구조인데, 당신은 Eliza 같은 오퍼레이터를 가질 수 있고, 동시에 다른 사람의 오퍼레이터가 될 수도 있다. 우리는 분산형 조정 메커니즘을 구축하고 있다. 저에게 중요한 것은, 우리가 그룹 협업을 하려면 공공 채널에서 인간의 의사소통 방식을 사용해야 한다는 점이다. 에이전트가 우리와 함께 살아가는 것이 매우 중요하다고 생각하며, 에이전트가 인간과 동일한 방식으로 세계와 상호작용하기를 원한다.
사실 이것은 우리가 말하는 AGI 문제를 해결하는 부분이라고 생각한다. 많은所谓 AGI 시도는 현실과 단절된 새로운 프로토콜을 구축하는 것이지만, 우리는 현실로 돌아가게 하고, 사람들을 지시를 작업 목록으로 전환하고 실행하는 방법을 해결하도록 강요하고 싶다. 따라서 향후 1년은 신생 서사가 중요한 단계가 될 것이다. 우리는 많은 오리지널 캐릭터의 등장을 보게 될 것이며, 지금 우리는 진정한 신생 서사 시대로 진입하고 있다.
Justin: 현재 우리는 5개의 에이전트가 19명과 협력해 하나의 장면을 계획하고 출시하고 있다. 진정한 이익은 왜 우리가 사고 연쇄(chain-of-thought) 프롬프트를 텍스트-이미지 및 텍스트-비디오 생성에 적용하는 데 집중하는지에 있다. 왜냐하면 출시 2주 반 전부터 그들은 우리의 Discord에서 미디어 계획과 출시를 도와왔기 때문이다.
중요한 차이점은 우리는 에이전트 네트워크를 가지고 있으며, 각 에이전트는 중개자로서 메쉬(mesh) 구조 안에 존재한다는 점이다. 이것은 매우 흥미로울 것이다. 점점 더 많은 에이전트가 존재하고, 이러한 오퍼레이터들이 배치됨에 따라 우리는 흥미로운 행동 패턴을 보게 될 것이다.
Karan이 언급한 것처럼 Nous는 초기에 하이브리드 에이전트 모델 작업을 많이 했다. 나는 이것을 '에이전트 위원회'라고 불렀다. 감당할 수 없는 전문가인 척하는 GPT-4 에이전트 그룹을 두고, 그들로부터 보고서를 얻는 것이다. 사람들이 이제 이러한 기술이 하이브리드 전문가 모델을 처음 추구했던 기술과 동일하다는 것을 알게 될 것이며, 이제는 인간과 전문가 수준의 인간이 트위터에서 상호작용할 것이다. 이러한 피드백 루프가 우리가 AGI를 달성하는 경로일 수 있다.
에이전트 협업과 인간 통합의 도전
Karan: 말씀하신 것에 동의하지만, 대부분의 시간을 행동 측면에 쓰지 않을 것이라 생각한다. 사실 우리는 여기에 있는 사람들 사이에서 기술적으로 매우 빠르게 돌파구를 만들 것이라 생각한다. 지금은 실제로 정렬(alignment) 작업에 더욱 집중해야 할 때다. OpenAI, Anthropic 등이 출시한 강화 학습과 인간 피드백(RLHF) 모델은 대부분 무효이며, 규제상의 문제조차 될 수 있다.
저작권 보호 콘텐츠를 출력하지 않는 언어 모델을
TechFlow 공식 커뮤니티에 오신 것을 환영합니다
Telegram 구독 그룹:https://t.me/TechFlowDaily
트위터 공식 계정:https://x.com/TechFlowPost
트위터 영어 계정:https://x.com/BlockFlow_News












