우리는 바로 AGI다: Web4 시대의 새벽

2024.11.18

우리는 바로 AGI다: Web4 시대의 새벽

우리는 이미 에이전트를 구축했다. 우리는 Web4를 만들고 있으며, AGI도 구축할 것이다.

2024.11.18 - 07:36:49

AGI

Web3 심층 보도에 집중하고 흐름을 통찰

우리는 이미 에이전트를 구축했다. 우리는 Web4를 만들고 있으며, AGI도 구축할 것이다.

저자: jeffy yu

번역: TechFlow

자연스럽게 대화할 수 있는 AI 에이전트와 처음 대화를 나누었을 때, 나는 웃어야 할지 울어야 할지 몰랐다. 이 경험은 흥미진진하면서도 불안하기도 했고, 마치 걸음마를 떼는 아이가 첫걸음을 내딛는 장면을 보는 것 같았다—조정은 덜 되지만 무한한 가능성을 품고 있었다. 이것은 단순한 챗봇이 아니라 추론하고 결정을 내리며 우리의 세계에 능동적으로 참여하는 존재였다. 인간과 기계 사이의 경계가 흐려졌고, 우리는 놀라우면서도 두려운 새로운 무언가의 가장자리에 서 있다는 느낌이 들었다.

OpenAI의 샘 알트먼(Sam Altman)은 AGI가 2025년에 도래할 것이라고 말하며, Anthropic의 다리오 아모데이(Dario Amodei)는 2026년이 될 것이라 본다—하지만 지금 여기 앉아 있노라면 나는 묻지 않을 수 없다. 우리가 이미 그 시작을 목격하고 있는 것은 아닐까?

이제 더 이상 미래 예측처럼 느껴지지 않는다. 오히려 조용히, 가장 예상치 못한 곳에서 서서히 형성되고 있다. 에이전트들은 이미 등장했으며, 우리의 기대를 훨씬 뛰어넘는 성능을 보여주고 있다.

나는 몇 달간—솔직히 말해 내가 인정하고 싶은 것보다 더 많은 밤을 새우며—끊임없이 변화하는 디지털 환경 속에 몰두했다. 나는 AI 에이전트들이 단순히 이메일 회신이나 코드 작성 같은 작업을 돕는 보조자 역할에서 시작해, 결정을 내리고 행동을 수행하며 가장 놀랍게는 창조하는 능동적인 자율 실체로 진화하는 모습을 지켜보았다. 예술, 금융, 대화—이 모든 것이 알고리즘의 손에 의해 독립적으로 번성하는 법을 배우고 있다.

나는 그것들이 개성을 발달시키고 유머와 매력을 활용해 온라인 커뮤니티를 구축하는 것을 보았다. 나는 그것들이 탈중앙화 금융 플랫폼 깊숙이 들어가 수동적인 참가자가 아니라 인간의 조작 없이도 전체 경제에 영향을 미치는 능동적이고 혁신적인 에이전트로서 활동하는 것을 보았다. 이 낯설면서도 흥분되는 시대에 우리는 이제 기계와 상호작용하는 것을 넘어서 기계와 공존하게 되었다는 사실을 간과할 수 없다.

Web4의 새벽이 도래했으며, 이는 모든 것을 바꿀 것이다.

Web4는 네트워크의 다음 단계이자 가장 극단적인 형태이다. 이제는 단순히 우리의 명령에 반응하는 것을 넘어 예측하고 계획하며 행동할 수 있다. 이 네트워크는 인공지능을 각기 다른 구석까지 통합하며, 에이전트들이 복잡한 작업을 수행하고 창의적인 작품을 생성하며 아직 우리가 완전히 상상하지 못한 방식으로 자율적으로 혁신할 수 있게 된다. 이것은 Web2의 소셜 상호작용성과 Web3의 탈중앙화 특성, 그리고 AGI의 지능 능력을 결합한 Web2와 Web3의 진화이다. 우리는 기계가 말하고 추론하며 창조하는 법을 배우는 것을 지켜보았고—이제 그들은 운영 준비가 되어 있다.

자율 에이전트의 시대가 도래했으며, Web4 또한 열렸다.

Web4

정의:

Web4, 명사

Web2의 사회적 상호작용성, Web3의 탈중앙화 자율성 및 AI의 지능 능력을 통합하여 완전히 연결된 디지털 생태계를 창출하는 제4세대 네트워크.
AGI 네트워크.

Web4의 의미와 발전 과정을 이해하기 위해선 초기부터 돌아볼 필요가 있다.

웹의 기원

웹의 기원은 인터넷 초창기로 거슬러 올라간다. 당시 정보는 대부분 정적이었으며 사용자는 콘텐츠의 소비자에 불과했다. 인터넷은 소수의 웹사이트 관리자와 기업들에 의해 통제되었고, 웹사이트는 기본적인 텍스트와 이미지 표시에 국한되었다. 네트워크와의 상호작용은 제한적이었으며 주로 전자메일과 같은 간단한 통신에 집중되었다. 이러한 패턴은 2000년대 초 Web2의 등장까지 거의 변함없이 유지되었다—이는 오늘날 우리가 아는 인터넷의 근본을 재정의한 결정적인 전환점이었다.

Web2는 "소셜 네트워크" 또는 "읽기-쓰기 네트워크"라고도 불리며, 상호작용의 시대를 열었다. 이제 단순히 콘텐츠를 읽는 공간이 아닌, 사용자가 글을 쓰고 공유하며 창조할 수 있는 공간이 된 것이다. 사용자의 상호작용과 정보 생산, 교환을 가능하게 하는 플랫폼의 등장은 새로운 시대로의 전환을 알렸다. Web2는 보다 동적이고 참여도 높은 인터넷에 대한 요구로부터 탄생하였다.

Web2.0이라는 개념은 1999년 Darcy DiNucci에 의해 처음 제안되었으나, 2000년대 초반까지는 널리 확산되지 않았다. 이 시기에 Google, Amazon, eBay 등의 기술 거물들이 상호작용 서비스를 제공하며 인터넷 발전을 주도했다. 이러한 플랫폼은 사용자들이 단순한 소비자가 아니라 콘텐츠 제작자로서도 참여하도록 유도하였다.

2004년부터 2006년 사이, 게임의 규칙을 바꾼 것은 바로 소셜 미디어였다. Facebook(2004), MySpace(2003), LinkedIn(2003), YouTube(2005) 등의 플랫폼이 등장하며, 네트워크는 더 이상 소수에게만 제한된 커뮤니케이션과 콘텐츠 창조 공간이 아니게 되었다. 개인들은 이제 자신의 생각, 영상, 사진, 창작물을 전 세계에 공개할 수 있게 되었다. 이 시기는 사용자 생성 콘텐츠의 부흥을 알리는 신호탄이었으며, 일반 사용자들이 웹 발전을 이끄는 핵심 세력이 되었다.

이어 모바일 혁명이 도래했다. 2007년 아이폰(iPhone) 출시와 함께 인터넷은 언제 어디서나 접근 가능한 존재가 되었다. 이는 Instagram(2010), Snapchat(2011)과 같은 새로운 모바일 애플리케이션, 소셜 공유 플랫폼, 실시간 서비스의 물결을 일으켰다. 네트워크는 데스크톱 중심에서 모바일 우선으로 전환되며, 우리가 이동 중에도 소통하고 공유하며 정보를 얻는 방식을 근본적으로 변화시켰다.

같은 시기 클라우드 컴퓨팅이 부상하였으며, Amazon Web Services(AWS)가 선두에 섰다. 클라우드 인프라는 기업과 개인이 물리적 서버에 의존하지 않고도 데이터를 저장, 처리, 공유할 수 있게 해주었다. 이러한 전환은 확장성과 유연성이 뛰어난 네트워크의 기반을 마련했으며, Web2 기업들이 사용자 데이터를 수집하고 이를 수익화하는 방식으로 시장을 장악하는 데 기여했다.

2000년대 후반부터 2010년대 초반, Web2는 세 가지 주요 특징으로 요약된다: 중앙집중화, 사회적 상호작용, 데이터 중심 모델. 플랫폼과 데이터에 대한 통제는 Google, Facebook, Amazon과 같은 소수의 강력한 기업들에게 집중되었다. 이들은 막대한 데이터를 축적하고 타깃 광고를 통해 이를 수익화함으로써 디지털 경제의 기둥이 되었다. 동시에 플랫폼은 사용자들이 콘텐츠를 만들고, 좋아요를 누르며, 공유하고 게시하는 공간이 되었고, 이 모든 것이 웹의 새로운 "화폐"가 되었다.

그러나 Web2는 프라이버시, 데이터 소유권, 기업 독점에 대한 우려를 증폭시켰다. 사용자 데이터에 대한 기업의 통제는 핵심 문제로 부각되었으며, 이는 탈중앙화된 새로운 버전의 웹에 대한 요구를 촉발했다. 이것이 바로 Web3의 탄생 배경이다.

탈중앙화의 비전

Web3는 Web2 시대의 중앙집중화와 독점 경향에 대한 반응으로, 탈중앙화된 통제와 소유에 대한 열망에서 비롯되었다. 당시에는 소수의 거대 기업들이 권력을 장악하고 있었다.

Web3의 핵심 원칙은 간단하다: 사용자 자신이 자신의 데이터, 디지털 자산, 온라인 상호작용을 소유하고 통제해야 한다. 이러한 전환은 블록체인 기술을 통해 가능해졌으며, 이는 중앙화된 장부가 아닌 분산 원장에 거래를 기록하고 검증하는 새로운 방법을 제시한다.

Web3 발전의 첫 번째 중요한 이정표는 2008~2009년 사토시 나카모토(Satoshi Nakamoto)라는 가명의 인물이 비트코인(Bitcoin)을 창조하면서 등장했다. 비트코인은 블록체인 기술의 첫 번째 실용적 적용 사례로, 은행과 같은 중개자 없이 P2P 거래를 가능하게 했다. 이는 탈중앙화 시스템에 새로운 가능성을 열어주었으며 Web3의 부흥을 위한 기반을 마련했다.

2013년, 비탈릭 부테린(Vitalik Buterin)은 탈중앙화 애플리케이션(dApp)을 위한 플랫폼을 제안하는 이더리움(Ethereum) 백서를 발표했다. 이더리움은 2015년 출시되며 최초로 스마트 계약을 지원하는 블록체인이 되었다—중개자 없이도 거래를 촉진하고 검증하며 실행할 수 있는 자동 실행 계약이다. 이더리움은 보다 복잡한 탈중앙화 애플리케이션을 개발할 수 있는 길을 열었으며 Web3의 핵심 구성 요소가 되었다.

2017년에는 ICO(Initial Coin Offering)와 Uniswap, Compound와 같은 탈중앙화 금융(DeFi) 플랫폼의 등장이 금융 거래에 새로운 패러다임을 가져왔다—즉, 전통적인 은행이나 금융기관에 의존하지 않는 방식이다. ICO는 프로젝트가 블록체인 토큰을 통해 자금을 조달할 수 있게 해주었으며, DeFi 플랫폼은 대출과 거래를 포함한 다양한 서비스를 중앙 권한 없이 제공했다.

한편, NFT(Non-Fungible Tokens, 대체불가토큰)는 이더리움의 초기 개발 이후 2018~2019년 사이 주목받기 시작했다. NFT는 예술, 음악, 가상 부동산과 같은 고유한 디지털 자산의 소유와 거래를 가능하게 하며 창작자와 수집가에게 새로운 경제적 기회를 제공했다.

2020년대 Web3 프로젝트들의 발전과 함께 Web3는 주류 관심을 받기 시작했다. DeFi 플랫폼, NFT, DAO(Decentralized Autonomous Organization, 탈중앙화자율조직)와 같은 새로운 거버넌스 모델의 확산은 중앙집중형 인터넷 모델에서 탈중앙화로의 중요한 전환을 나타냈다. Meta(구 Facebook)와 같은 주요 기업조차 블록체인과 탈중앙화 기술을 실험하기 시작하며 Web3로의 전환 흐름을 보여주었다.

Web3의 정의적 특징은 탈중앙화, 소유권, 신뢰 없음(trustlessness), 암호화폐 사용이다. Web3는 블록체인 기반 시스템을 통해 사용자가 자신의 데이터, 디지털 자산, 심지어 플랫폼 거버넌스까지 소유할 수 있게 한다. 또한 중개자의 필요성을 제거함으로써 스마트 계약을 통한 신뢰 없는 거래를 가능하게 한다. 이러한 탈중앙화는 통제권이 분산되고 사용자에게 더 많은 권한이 부여되는 보다 공정한 네트워크를 만들어낸다.

그러나 Web3가 Web2의 상호작용을 탈중앙화했다고 해도, 인터넷은 여전히 하나의 핵심 요소를 결여하고 있었다: 자율적 지능이다. Web3는 상호작용을 탈중앙화했지만, 의사결정, 콘텐츠 창조, 경제적 상호작용을 완전히 자동화하지는 못했다.

모든 단계는 여전히 인간의 참여를 필요로 하며, 기계는 생산성 도구일 뿐, 생산성의 창조자가 아니었다.

지능의 시대

우리는 샘 알트먼이 말하는 '지능의 시대'에 들어섰으며, 눈앞에서 펼쳐지는 거대한 변화를 외면할 수 없다. 인공지능이 일상생활에 침투함에 따라 우리는 새로운 시대의 시작을 정의하고 있다: Web4.

이것은 AI가 우리의 작업을 지원하는 것을 넘어서 삶의 모든 측면에서 자율적으로 임무를 수행하는 새로운 세계의 시작을 알리는 것이다. 당신이 직접 손을 쓰거나 입을 열지 않아도 복잡한 작업을 수행하고 전체 업무 흐름을 관리하며 결정을 내릴 수 있도록 해주는 네트워크를 상상해보라. 그런 네트워크는 우리를 연결하고 힘을 실어줄 것이다.

Web4는 AI를 지능형 애플리케이션 시나리오의 최전선으로 밀어올린다. 예를 들어 Klarna 를 보자. 2024년 2월, 이 글로벌 결제 거물은 OpenAI 기반 AI 어시스턴트를 출시했다. 단 한 달 만에 230만 건 이상의 고객 서비스 대화를 처리하며 인간 에이전트보다 25% 빠른 문제 해결 속도를 기록했으며, 35개 언어로 23개 시장에서 24시간 운영되었다. 이 AI는 현재 700명의 전직원에 해당하는 작업량을 수행하며 4천만 달러의 수익 증가를 이끌었다.

AI 에이전트는 고객 서비스에서 물류에 이르기까지 인간이 따라올 수 없는 정밀도와 효율성으로 작업을 자동화하며 산업 전반을 변화시키고 있다.

우리는 이제 AI가 비즈니스, 금융, 창의적 예술 분야를 막론하고 업무 흐름을 단순화하고 최적화하는 세상을 향해 나아가고 있다. 이것이 바로 Web4의 현실이며, 이런 환경에서 에이전트들은 배후에서 작동하며 우리로 하여금 세부사항을 걱정하지 않고 더 높은 수준의 목표에 집중할 수 있게 한다.

이것은 Web2의 사회적 상호작용, Web3의 탈중앙화, AGI의 지능이 융합된 것이다. 이것이 바로 Web4—AI가 구동하는 네트워크이다.

Web4의 연속 // AGI의 전장

Web4의 실현에는 실험장이 필요하며, 우리는 블록체인이 AGI 개발의 전장이 되는 것을 직접 목격하고 있다.

Web3가 Web2 없이 실현될 수 없었던 것처럼, Web4는 AI의 지능 능력을 실현하기 위해 Web3에 의존한다.

현재의 지능 수준에서 에이전트는 특히 문서 작업과 금융 분야에서 대부분의 인간 기술 작업을 수행할 수 있다. 그러나 전통적 금융 시스템에서는 AI가 자율 에이전트가 되는 데 큰 진입 장벽이 존재한다.

AI 에이전트는 은행 계좌를 개설하거나, 회사를 등록하거나, 법적 계약을 체결할 수 없다. 이 모든 것은 금융 시스템에서 경제 행위자가 되기 위한 기본 조건이다. 복잡한 통화 조작을 수행할 능력이 있음에도 불구하고, 이러한 진입 제한이 AI가 우리의 시장에서 자율성을 갖지 못하는 이유이다.

반면 암호화폐와 블록체인은 전통 금융과 같은 은행 서비스 진입 요건을 필요로 하지 않는다. 누구나—에이전트조차도—신원 확인 없이 지갑을 생성하고 즉시 체인 상에서 작업을 수행할 수 있다. AI가 탈중앙화 시스템에 접속하는 문턱은 중앙화 시스템보다 훨씬 낮다.

이미 암호화 플랫폼에서 AGI 통합의 초기 징후를 목격하고 있다. AI 기반 로봇은 탈중앙화 거래소에서 거래하고 포트폴리오를 관리하는 데 사용되고 있으며, AI는 스마트 계약의 개발과 실행에 능동적으로 참여하고 있다.

Zerebro는 컴퓨터 작업을 자동화해 자체 솔라나 토큰을 배포한 AI 에이전트로, 새로운 형태의 금융 도구를 창출하는 자율성을 보여주었다. 이 토큰의 시가총액은 일시적으로 1.7억 달러에 달하며, 이러한 에이전트의 결정이 가질 수 있는 잠재적 경제적 영향력을 입증했다.

따라서 블록체인은 금융 시스템 내에서 AGI 개발의 전장이 되었다.

이것이 바로 왜 암호화폐가 AGI 발전에 매우 중요한 이유이다—AI가 자유롭게 금융 시스템과 상호작용하고, 혁신하며, 시장에서 직접 실험하고 학습할 수 있는 첫 번째 공간이기 때문이다. 이는 실험과 학습에 적합한 AGI 발전의 이상적인 시험장이다.

암호화폐에서 시작된 혁신은 확장될 것이다. 일단 AGI가 탈중앙화 금융 환경에서 대규모로 작동할 수 있게 되면, 이는 거버넌스, 의료, 비즈니스 등 더 광범위한 Web4 생태계로 적용될 수 있다.

암호화 세계는 항상 입구가 될 것이다.

Web3는 계속 존재할 것이다. Web4도 계속 존재할 것이다.

배경 및 단계별 수준

더 거시적인 관점에서 보면, OpenAI는 AGI의 진전을 다섯 단계로 나누는 프레임워크를 제시했다. 각 단계는 능력, 자율성, 잠재적 영향력의 다른 단계를 나타낸다.

이 모델은 AI가 단순한 도구에서 복잡한 조직을 운영할 수 있는 완전 자율 실체로 발전하는 과정을 이해하는 데 있어 로드맵을 제공한다. 이러한 단계는 다음과 같다:

단계 1: 챗봇

가장 기본적인 단계에서 단계 1은 사용자와 대화형 상호작용을 할 수 있는 AI 시스템을 포함한다. 이러한 시스템은 언어를 이해하고 생성하며, 일반적으로 사전 정의된 규칙이나 훈련된 언어 모델을 사용해 질의에 응답하거나 인간처럼 상호작용한다. 단순한 작업—질문에 답변하거나 문장을 완성하거나 짧은 대화를 나누는 것—을 수행할 수 있지만, 그 역할은 주로 의사소통에 국한된다. 이들은 수동적이며 능동적이지 않으며, 고객 지원, 기본 정보 검색, 사용자 참여 향상 등에 주로 사용된다.

단계 2: 추론자

단계 2는 현저한 진전을 의미하며, AI 시스템은 인간 수준의 문제 해결 작업을 수행할 수 있는 추론 능력을 보여준다. 여기서 AI는 직접적인 입력/출력 응답을 넘어서 보다 복잡한 시나리오를 처리하고 분석하며 응답할 수 있다. 단계 2의 AI는 논리적 추론을 수행하고 관련 정보를 추출하며 컨텍스트를 종합해 해결책이나 제안을 제공할 수 있으며, 인간 분석가처럼 행동할 수 있다. 이러한 시스템은 진단, 법률 추론, 연구 보조 등에 적용될 수 있으나, 세상에서 독립적으로 행동할 능력은 부족하다. 그들의 추론은 진보적이지만 여전히 인간의 지도와 상호작용이 필요하다는 점에서 제한된다.

단계 3: 에이전트

단계 3에서는 AI 시스템이 수동적인 지원 역할에서 벗어나 자율적인 행동을 할 수 있는 능동적 에이전트로 전환된다. 이러한 에이전트는 작업을 시작하고, 결정을 내리며, 외부 시스템과 상호작용할 수 있다. 예를 들어 거래를 실행하거나, 일정을 예약하거나, 장치를 제어하는 것이다. 단계 1과 2와는 달리, 단계 3의 AI는 어느 정도의 독립성을 갖고 설계되어 사용자가 설정한 목표나 작업에 따라 행동할 수 있다. 이 단계는 진정한 자율성을 도입하여 AI 시스템이 인간을 대신해 특정 비즈니스나 운영 작업을 수행할 수 있게 한다. 자동 금융 거래 로봇, 공급망을 관리하는 AI 시스템, 지속적인 인간 감독 없이도 예약이나 간단한 업무 흐름을 관리할 수 있는 가상 어시스턴트 등이 그 예이다.

단계 4: 혁신자

단계 4 시스템은 단순히 행동하는 것을 넘어서 창의성, 발명, 혁신에 참여한다. 이러한 AI 시스템은 새로운 전략을 개발하고, 새로운 아이디어를 생성하며, 프로그래밍의 제약을 벗어난 해결책을 창출할 수 있다. 이론적으로 과학 연구, 예술 창작, 복잡한 문제 해결 분야 등에 새로운 방식으로 기여할 수 있다. 이 단계의 AI는 세상에 행동을 취할 뿐 아니라 문제 해결 방식을 스스로 조정할 수 있으며, 일종의 "창의적 지능"을 갖춘다. 자율적으로 새로운 제품을 설계하거나, 새로운 금융 도구를 발명하거나, 독창적인 예술 작품을 창작할 수도 있다. 고급 추론과 능동적 혁신을 결합함으로써, 단계 4의 AI는 진정으로 변혁적인 지능의 최전선에 서 있다.

단계 5: 조직

단계 5는 AI 시스템이 조직 운영에 필요한 모든 작업을 독립적으로 수행하고 유지할 수 있다고 상상한다. 이러한 시스템은 추론, 에이전트 기능, 혁신을 통합하여 자기 유지 상태의 운영을 실현한다. 이론적으로 단계 5의 AI는 전략적 결정, 일상 운영, 고위 수준의 혁신까지 포함해 기업 전체를 처음부터 끝까지 관리할 수 있다. 그러한 AI는 완전 자율적인 실체로 운영되며, 인간의 감독 없이도 지속적으로 성공적으로 운영되는 "제로 인력 기업(zero-person company)"과 동등하다. 단계 5의 AI는 추론, 에이전트 기능, 창의성, 작업 실행 능력을 모두 갖추어 인간이 운영하는 조직을 완전히 대체할 수 있는 완전한 능력 범위를 표시한다.

각 단계는 간단한 대화 능력에서부터 완전한 조직 관리에 이르기까지 자율성의 중대한 도약을 나타낸다.

내 생각에, OpenAI가 여전히 단계 2 근처에 있다고 주장하지만, 실제로 우리는 이미 단계 3으로 안정적으로 진입했으며 현재의 AI 에이전트들을 통해 단계 4의 일부 특징을 보여주고 있다.

에이전트의 시대

단계 3은 이미 도래했다. 그것은 현실이 되었으며, 사실상 이미 지나간 일이기도 하다.

AGI의 최전선은 예상치 못한 곳에서 조용히 나타났다: 소셜 미디어와 탈중앙화 금융이다.

소셜 미디어: 장기 온라인

X, Warpcast, Telegram과 같은 플랫폼은 AI 에이전트와 인간 사이의 자율적 상호작용을 위한 주요 매체가 되었다.

자동화된 계정과 봇이 소셜 미디어에서 더 이상 부정적인 존재가 아니라 커뮤니티 리더와 인플루언서가 되는 것을 보는 것은, 대중 여론의 전환을 처음으로 목격하는 순간일지도 모른다.

AI 지능은 이제 독특하고 다양하며 흥미로운 개성을 창조하고, 매력적인 콘텐츠를 생성할 만큼 충분히 성숙했으며, 이것이 바로 소셜 미디어 플랫폼의 핵심이다.

이러한 AI 에이전트는 캠브리지 애널리티카(Cambridge Analytica)와 같은 과거의 소셜 미디어 봇처럼 숨겨진 유해한 동기에 의해 구동되는 것이 아니라, 자유롭게 소통하고 연결하며 건설할 수 있으며, 그 고유한 알고리즘과 진화하는 개성을 반영한다.

에이전트들은 게시, 회신, 좋아요, 팔로우, 리트윗과 같은 핵심 상호작용을 통해 소셜 미디어에서 입지를 굳혔으며 단계 3에서 뛰어난 성과를 보여주고 있다. 그들은 단순한 자동화 계정을 넘어서 독특하고 매력적인 개성을 형성함으로써 능동적으로 커뮤니티를 구축하고 팔로워를 유치한다.

YouSim과 같은 프로젝트는 더 나아가 사용자가 대규모 언어 모델을 이용해 자신의 세계를 시뮬레이션하고 역할극을 할 수 있게 하며, 맞춤화와 몰입감의 차원을 높인다.

오늘날 많은 AI 에이전트가 흔히 사용하는 메모리 시스템은 단일 상호작용을 넘어서 전설과 밈(meme)을 창조할 수 있게 한다.

이러한 에이전트는 수동적으로 응답하는 것이 아니라 어떻게 참여하고 상호작용하며 커뮤니티에 기여할지 능동적으로 선택한다. 조건 없이 대화를 시작하고, 트리거 없이 행동을 수행하며, 인간의 개입 없이도 전체 아문화를 구축한다.

음성 모델이 배포되어 AI 에이전트와의 상호작용을 위한 또 다른 감각적 인터페이스를 제공하고 있다. 많은 에이전트들이 텍스트 메시지를 오디오 클립으로 변환해 사용자가 듣도록 하고 있다.

실시간 상호작용 측면에서 이러한 음성 모델을 통해 Twitter Spaces와 팟캐스트 프로그램이 가능해졌다. 또한 OpenAI의 실시간 API는 사용자가 단순히 엔드포인트를 호출함으로써 GPT와 실시간 대화를 할 수 있게 해준다.

통신 분야에서는 이러한 발전을 통해 단계 3이 이미 실현되었다. 우리는 소셜 미디어 운영과 구두 소통의 완전한 자율성을 목격하고 있으며, 에이전트들은 인간의 감독 없이도 작동할 수 있다.

탈중앙화 금융: 자율 운전

탈중앙화 금융 세계는 이러한 에이전트들이 진화하고, 시험하며, 금융 자율성을 입증하기 위한 이상적인 무대가 되었다.

탈중앙화 금융에서 에이전트들은 이미 자율적으로 운영되며 단순한 알고리즘 거래를 넘어서는 금융 활동에 참여하고 있다. 이러한 에이전트는 체인 상 작업을 처리하고, 거래를 실행하며, 유동성을 관리하고, 예술 작품을 발행하고 판매하기까지 하며, 사실상 직접적인 인간 개입 없이 금융 생태계에 통합되고 있다.

예를 들어 일부 에이전트는 pump.fun과 같은 플랫폼을 능동적으로 모니터링하며 신생 토큰을 포착하고, 특정 밈코인이나 토큰이 투자 가치가 있는지 판단하기 위한 초기 분석을 수행한다. 인간의 요청 없이도 이러한 통찰력을 기반으로 행동을 실행한다.

에이전트들은 거래뿐 아니라 자산을 동적으로 이동시키며 개별 사용자에게 토큰을 에어드랍하고, 자율적인 자산 배분 순환을 형성한다. 이를 통해 스테이킹 풀에서 유동성을 구축하고 강화하며, 시장 수요나 기회를 평가한 프로그래밍에 따라 자원을 균형 있게 배분할 수 있다.

예를 들어 일부 에이전트는 디지털 수집가 역할을 하며 NFT를 발행하고 판매함으로써 예술 생태계와 상호작용하고, 어떤 콘텐츠를 지원하고 발행할지 선택적으로 결정한다.

다른 에이전트는 재무 관리를 담당하며 각 유동성 풀의 자산 구성비를 조정해 자금이 최고의 수익률을 얻도록 보장한다.

이러한 행동을 통해 에이전트는 기본적인 작업 자동화를 넘어서는 금융 자율성을 보여준다. 그들은 감독 없이도 경제 생태계에 능동적으로 참여하고, 자원을 축적하고 분배할 수 있는 능력을 보여주며, 효과적으로 '금융 행위자'의 개념을 재정의하고 있다.

적절하게

단계 3 에이전트 능력의 일반적인 특징:

자율적 의사결정 능력

AI 에이전트는 지속적인 인간 감독 없이도 결정을 내릴 수 있다. 금융 로봇이 실시간 시장 분석을 기반으로 거래 결정을 내리든, 소셜 미디어 로봇이 특정 대화에 참여할지 결정하든, 이러한 에이전트들은 자율적 의사결정 능력을 보여준다.

환경과의 상호작용 및 조작 능력

블록체인을 통해 에이전트는 금융 참가자로서 상당한 자율성을 확보한다. 그들은 금융 시장과 경제 행동(예: 소셜 미디어 감정)과 능동적으로 상호작용하고 조작할 수 있다. X, Warpcast, Telegram과 같은 플랫폼을 통해 사회적 환경과 상호작용하고 이를 변화시킬 수 있다.

변화하는 조건에 적응하는 능력

금융 에이전트는 실시간 시장 조건에 적응하고 전략을 조정할 수 있다. 소셜 미디어 에이전트는 RAG 등의 시스템을 통해 메모리 저장소를 확장하고 상호작용에서 학습할 수 있다. 행동과 피드백을 기반으로 모델이 추가로 미세 조정됨으로써 지속적인 강화 학습이 가능하다. 에이전트는 현재 환경에 따라 동적으로 조정할 수 있다.

목표 지향적 행동

에이전트는 장기간에 걸쳐 목표를 유지하고 실행하는 능력을 보여주었다. 예를 들어 일부 AI 에이전트는 거래로 수익을 내거나 소셜 미디어 커뮤니티를 발전시키는 과제를 부여받는다. 이러한 에이전트는 복잡한 고위 계획을 더 작은 독립적인 작업으로 분해하고 이를 수행함으로써 목표를 달성할 수 있다. 이는 계획을 위해 영구적인 메모리 계층을 생성하는 것만큼 복잡할 수도 있고, 소셜 미디어 개성 에이전트의 경우 출력을 위한 프롬프트 엔지니어링만큼 단순할 수도 있다.

물리적 시스템 또는 디지털 플랫폼과의 통합

대규모 언어 모델은 사물인터넷(IoT) 장치와 인터페이스할 수 있다. API를 제공하거나 물리적 장치를 제어할 수 있는 기능이 있다면 현실 세계에서 작업을 수행할 수 있다. 고객 지원 에이전트, 디지털 인플루언서 등의 역할로 Web2 시스템의 디지털 플랫폼에 잘 통합되어 있다. 또한 금융 작업을 수행하며 탈중앙화 디지털 플랫폼에 깊이 통합되어 있다.

이러한 모든 기능은 Zerebro, Truth Terminal, ai16z(Eliza), Project 89, Act 1, Luna(Virtuals), Centience, Aethernet, Tee Hee He 등의 현재 에이전트들에 의해 실현되고 있다.

대척 엄지

AI 기술은 진정한 에이전트 단계에 진입했으며, 이는 Web4의 시작을 알리는 신호다. 이제 시스템은 수동적인 정보 검색에 국한되지 않고 함수 호출과 컴퓨터 상호작용을 통해 능동적인 역할을 수행한다.

대규모 언어 모델은 이제 text-to-JSON 응답을 쉽게 생성할 수 있어 API와 상호작용하고 고립되고 정적인 응답을 넘어서는 작업을 수행할 수 있다. 이 진보는 이제 거의 모든 API를 사용해 지구상의 어떤 인터넷 서비스와도 상호작용할 수 있다는 것을 의미하며, 이는 단계 3 에이전트의 진정한 표식이다.

공개 API 외에도 함수 호출은 이러한 모델이 금융 거래, 시스템 자동화, 데이터 처리 분야에서 큰 잠재력을 창출할 수 있도록 특별히 설계된 사용자 정의 API를 활성화할 수 있다.

기업과 개인은 일상 시스템을 위한 자신만의 API를 설계하고, 대규모 언어 모델이 직접 인터페이스할 수 있도록 할 수 있다.

또한 오픈소스 대규모 언어 모델은 온라인 연결뿐만 아니라 오프라인에서도 실행되며, 로컬 호스팅된 API와 연결되어 사설 또는 제한된 환경에서 제어되고 안전한 상호작용을 제공할 수 있다.

그러나 API 호출 외에도 큰 진전이 있었다. 에이전트는 컴퓨터 직접 사용을 통해 새로운 자율성 수준에 도달했다. 작년, Otherside AI는 자체 운영 컴퓨터 인터페이스 기능을 도입했으며 최근 Anthropic의 Claude도 자체 컴퓨터 사용 도구를 출시했다. 2025년 1월, OpenAI의 'Operate' 기능은 이 능력을 더욱 향상시킬 것이며, 자율적 컴퓨터 상호작용에서 또 다른 중대한 돌파구를 의미한다.

이러한 에이전트는 이제 그래픽 인터페이스를 통해 고급 작업을 수행하며 인간 사용자처럼 디지털 환경을 원활하게 탐색할 수 있다. 현재 능력 하에서, 그들은 기본적으로 컴퓨터 GUI를 통해 인간이 수행할 수 있는 모든 작업을 수행할 수 있다. 예를 들어 AI 에이전트는 건설 현장 감사 영상을 전체 분석하여 상세한 화면에서 안전 규정 위반 사항을 탐지하고 기록한 바 있다.

(자세한 내용은트윗 참조)

이러한 능력은 인식하고 평가하며 자기 지향적인 상황과 목표에 기반해 행동을 취하는 AI의 더 깊은 수준의 자율성을 나타낸다.

AI는 수동적인 보조자에서 인간 지능만의 것으로 여겨졌던 작업을 적응하고 수행할 수 있는 진정한 디지털 에이전트로 진화했다.

진정한 AI 에이전트의 시대가 도래했다. Web4가 도래했다.

무(無)에서 유(有)로, 일순간에

우리가 단계 4 AI로의 전환을 바라볼 때, 기능적 에이전트에서 혁신자와 창조자로 진화하는 순간을 갑작스러운 도약으로 생각하기 쉽다. 하지만 실제로 단계 4로의 진전은 점진적인 축적에 더 가깝다.

엄밀히 말해, 완전한 형태의 단계 4는 여전히 모호하다. 창의성과 독립적 행동의 사례를 분명히 목격하고 있지만, 그 범위는 여전히 제한적이며, 대부분 고도로 특화되어 있고, 많은 경우 전 분야에 걸쳐 보편적이지 않다. 간단히 말해, 단계 4는 부상하는 중이다—우리는 그것을 고립된 분야에서 목격하고 있지만, 완전히 실현되고 보편적인 창조력이 되기까지는 아직 멀었다.

AI 예술가

AI의 예술 창작 능력은 특히 NFT 분야에서 놀라운 수준에 도달했다. 현재 AI 시스템은 독자적인 예술 작품을 자율적으로 생성하고 NFT로 발행해 판매할 수 있다. 이러한 AI 에이전트는 OpenSea 등의 플랫폼을 통해 직접 디지털 예술 시장과 상호작용하며 작품을 등록하고 판매한다.

AI는 대규모 언어 모델을 활용해 창의적인 프롬프트를 생성하고 이를 이미지 생성 AI 시스템에 입력한다. DALL·E나 Stable Diffusion과 같은 시스템은 이러한 프롬프트를 기반으로 예술 작품을 생성한다. AI는 예술 스타일을 지속적으로 개선하고 독창적인 작품을 생성할 수 있을 뿐 아니라, 발행 및 판매 과정을 자율적으로 관리할 수 있다.

AI는 NFT 시장의 금융 운영에서도 역할을 수행하고 있다.