
Manus 최신 대화 전문: 에이전트 결제 시도, 회사 RRR 약 1억 달러
저자|Li Yuan
편집|정우

싱가포르로 이주한 Manus는 범용 AI 에이전트에 대한 고민을 멈추지 않았다.
오늘 싱가포르에서 열린 Stripe Tour 행사에서, Manus 공동설립자이자 최고 과학자인 계익초(Peak)가 Stripe 아태 및 일본 지역 영업 책임자 폴 하라핀(Paul Harapin)과 대담을 나누었다.
이 자리에서 Manus AI는 최근의 경영 실적을 공개했다. 현재 수익 연율(RRR, Revenue Run Rate)이 이미 9천만 달러에 도달했으며, 곧 1억 달러를 돌파할 예정이다.
Manus AI의 샤오훙은 즉각(커먼스페이스)에서도 특별히 설명했다. RRR은 당월 수익 × 12를 의미하며 실제 현금 수입(Cash Income)과 동일하지 않다. 많은 AI 제품들이 연간 구독 옵션을 제공하는데, 이는 선수금으로 간주되어야 하며 수익으로 기록될 수 없다고 말했다. "이런 [잘못된 방식]으로 공개한다면 1.2억 달러보다 큰 숫자도 산출할 수 있다"고 샤오훙은 덧붙였다.
경영 데이터 외에도, 계익초는 Manus 팀이 범용 에이전트의 다음 단계를 어떻게 생각하고 있는지, 그리고 AI 에이전트와 AGI의 미래 차이점이 무엇인지 공유했다.
"지금 사람들은 거의 모든 것을 에이전트라고 부릅니다. 예를 들어 마이크 하나도 누군가는 '환경 감지를 갖춘 음성 수집 에이전트'라고 부르죠." 계익초는 농담처럼 말했다.
그는 또한 범용 에이전트의 능력을 확장하기 위한 두 가지 주요 방향을 제시했다. 첫째, 다중 에이전트 협업을 통해 실행 규모를 넓히는 것(예: 대규모 조사 중 수백 개의 병렬 하위 에이전트 생성). 둘째, 에이전트에게 더 넓은 '도구 영역'을 열어주는 것으로, 소수의 사전 설정된 API에 능력을 국한하지 않고 프로그래머처럼 오픈소스 생태계를 활용하고 라이브러리를 설치하며 시각화 후 이미지를 보고 스스로 점검하고 수정하는 것이다.
계익초는 또한 오늘날 디지털 세계가 여전히 '사람을 위한' 패러다임에 따라 구성되어 있다고 언급했다. API가 없는 웹페이지, CAPTCHA, 절차의 '게임화' 등이 많은 마찰을 일으키며, 병목현상은 모델 지능보다는 생태계와 제도적 제약에 가깝다고 말했다.
이는 바로 Manus가 Stripe 활동에 참여하는 이유 중 하나이기도 하다. 양사는 에이전트 내에서 결제를 완료하고, '조사-결정-주문/정산'을 폐쇄 루프로 연결하여 인프라 협업을 통해 세상의 마찰을 해소하려 하고 있다.
다음은 대담의 핵심 내용을 기술공원(GeekPark)이 편집 정리한 것이다.
질문: 관객들에게 당신 자신을 간단히 소개해주시겠어요? 최근 쓰신 '컨텍스트 엔지니어링' 관련 블로그 포스트는 정말 고무적이었고, 여기 계신 AI 에이전트 개발자들이라면 반드시 읽어야 할 필독서라고 생각합니다. 제가 매번 엔지니어들과 점심을 먹으러 가면 항상 그 이야기뿐이라, 이제는 다른 곳에 앉아야 할 지경이에요(웃음). 하지만 현장에서 Manus에 대해 잘 모르시는 분들을 위해, 당신의 경력과 비전을 공유해주실 수 있나요?
답변: 감사합니다, 폴. 반갑습니다. Manus는 범용 AI 에이전트를 구축하고 있습니다.
많은 연구기관과 기업들이 사실상 '두뇌'를 만들려 합니다—즉 거대 언어 모델을 개발하죠. 하지만 저희는 소비자의 입장에서 보면 이것이 실제로 좋지 않다고 생각합니다. AI는 진정으로 행동을 취하고 일을 완수할 수 있어야 하기 때문에, 저희는 Manus를 만들었습니다.
저희 접근법은 AI가 인류 역사상 가장 위대한 발명품 중 하나인 범용 컴퓨터를 사용할 수 있도록 하는 것입니다. AI에게 컴퓨터를 주면 인간이 할 수 있는 모든 일을 수행할 수 있게 됩니다. Manus는 실제로 작업을 완료할 수 있습니다. 예를 들어 발표 자료를 만들어주거나 여행 일정을 계획하거나, 심지어 소셜 미디어 운영까지 가능합니다—물론 실제로 그렇게 하진 말라는 조언입니다.
저희 사용자들은 Manus를 매우 좋아합니다. 저희는 3월에 Manus를 출시했고, 현재 약 9천만 달러의 수익 연율(RRR)을 달성했으며, 곧 1억 달러를 넘길 예정입니다.
이것은 저희처럼 작은 스타트업 기업에게 매우 큰 성과라고 생각합니다. 더 중요한 것은, 이는 AI 에이전트가 더 이상 연구 분야의 유행어에 머무르지 않고 실제로 적용되고 뿌리를 내리고 있다는 증거라는 점입니다.
저희가 Manus를 구축하는 과정에서 겪었던 작은 이야기를 나누고 싶습니다.
저희는 사실 에이전트 코딩(Agent coding) 응용 프로그램에서 많은 영감을 얻었습니다. 예를 들어 Cursor 같은 AI 프로그래밍 제품은 이미 많은 관심을 받았었죠.
엔지니어로서 저희는 자연스럽게 Cursor를 사용했습니다. 하지만 놀라운 것은 회사 내 비기술직 동료들도 Cursor를 많이 사용한다는 것이었습니다. 물론 그들은 소프트웨어를 개발하는 것이 아니라, 데이터 시각화를 하거나 글을 쓰는 용도로 사용했습니다. 그들은 왼쪽의 코드 부분을 무시하고 AI와 대화만으로 작업을 완료했습니다.
이를 통해 저희는 이런 방식을 일반화하여 프로그래머가 아닌 사람들에게도 권한을 부여해야 한다는 것을 깨달았습니다. 이것이 바로 AI의 한 가지 사용 사례입니다.
질문: 점점 더 많은 사람들이 AI 에이전트와 AGI에 대해 이야기하는 것을 듣게 됩니다. 이 두 개념을 좀 더 명확하게 구분해줄 수 있으신가요? AI 에이전트와 AGI가 귀하와 Manus에게 각각 어떤 의미인지요?
답변: 저희는 이것이 매우 좋은 질문이라고 생각합니다.
지금 사람들은 거의 모든 것을 '에이전트'라고 부릅니다. 예를 들어 마이크 하나도 누군가는 '환경 감지를 갖춘 음성 수집 에이전트'라고 말합니다.
하지만 적어도 저희는 에이전트가 응용형 AI의 하위 집합이라고 주장합니다. 잠깐 물러나서 일반적인 AI 응용 프로그램 유형을 살펴보는 것이 좋겠습니다.
대부분의 사람들은 이미 두 가지 유형에 익숙합니다. 하나는 ChatGPT 같은 챗봇이고, 다른 하나는 MidJourney나 Sora 같은 생성형 도구입니다. 이러한 시스템에서는 보통 두 가지 역할만 존재합니다. 사용자와 모델입니다. 당신이 모델과 상호작용하여 출력 결과를 얻는 것이죠. 반면 에이전트는 사용자와 모델 외에 세 번째 핵심 요소—환경(environment)—를 도입한다는 점에서 다릅니다.
'환경'이라는 개념은 에이전트의 유형에 따라 달라질 수 있으며, 예를 들어 설계형 에이전트의 경우 환경은 캔버스나 코드 조각일 수 있고, Manus의 경우 우리의 목표는 에이전트가 가상 머신이나 인터넷 전체에 나타나도록 하는 것입니다. 이를 통해 에이전트는 환경을 관찰하고 다음 단계를 결정하며 행동을 통해 환경을 변화시킬 수 있습니다. 이것이 바로 에이전트를 강력하게 만드는 점입니다.
예를 들어 Manus에서 당신은 요구사항을 표현하면, 에이전트는 브라우저를 열고 웹페이지를 게시하거나 항공권을 예약해줍니다. 저는 이 사례를 매우 좋아합니다. 왜냐하면 항공권 예약은 간단해 보이지만, 사실상 AI가 현실 세계를 직접 변화시키는 행위이기 때문입니다. 결과물은 모델의 출력이 아니라 당신 손에 쥔 항공권이며, AI가 진정으로 당신의 세계에 개입한 것입니다. 이것이 바로 우리가 말하는 에이전트입니다.
간단히 말해, 에이전트란 사용자를 대신하여 환경과 상호작용하는 AI 시스템입니다.
AGI의 경우, 이 단어도 자주 언급되며 많은 사람들이 이를 초지능(superintelligence)과 동일시합니다. 저희는 AGI란 특별한 설계 없이 다양한 작업을 수행할 수 있는 AI 모델의 일반적 능력을 활용하는 시스템이라고 생각합니다.
저희는 '에이전트 코딩'이 사실상 AGI로 가는 길 중 하나라고 봅니다. 이는 수직적 분야의 능력이 아니라, 컴퓨터에 이를 부여하면 컴퓨터 상에서 거의 모든 일을 할 수 있기 때문입니다. 따라서 우리에게 AGI의 조건이란 이러한 능력이 발휘될 수 있도록 충분히 완벽한 환경을 구축하는 것입니다.
질문: 오늘날 AI는 실제로 어느 상황에서 진정한 효과를 발휘하고 있습니까? 미래에는 어디에서 효과를 발휘할까요? 언제 아이폰 모멘트(iPhone moment)가 올까요?
답변: 에이전트 측면에서 본다면, 단지 모델 능력만 본다면 현재의 플래그십 모델은 이미 매우 놀랍고 거의 '초인' 수준입니다. 수학 경시대회나 논리적 추론에서 대부분의 인간을 능가할 수 있습니다.
하지만 저는 여전히 모델이 '병 속의 두뇌'와 같다고 생각합니다. 진정한 힘을 발휘하려면 현실 세계와 상호작용하고 현실에 접촉해야 합니다. 안타깝게도 문제가 여기서 시작됩니다.
예를 들어 AI에게 일상적인 작업을 시키면, 반복적인 과제에서는 매우 능숙합니다. Deep Research 같은 제품은 정보를 집계하여 결과를 제공할 뿐이며, 출력은 단순히 거기에 나타날 뿐입니다.
예를 들어 지금 거의 모든 것은 인간을 위해 설계되어 있습니다. 물리적 세계뿐만 아니라 디지털 세계도 그렇습니다. 웹 도구들은 마치 소규모 게임처럼 되어 있으며 API나 표준 인터페이스를 제공하지 않습니다. CAPTCHA는 어디에나 존재하며 에이전트를 계속 막아섭니다.
따라서 저는 AI가 폐쇄적이고 독립적인 과제에서는 잘 작동하지만, 현실 세계에 접속할 때 장애물을 맞닥뜨린다고 생각합니다.
미래에 언제 아이폰 모멘트가 올까요? 저는 이것이 기술적 문제라기보다는 제도적 제약에 가깝다고 생각합니다. 이것은 저희 같은 에이전트 스타트업이 단독으로 해결할 수 있는 일이 아닙니다.
저는 이것이 점진적인 전환을 필요로 하며, 전체 생태계가 함께 진화해야 한다고 봅니다. 또한 Stripe 같은 기업이 인프라 수준에서 힘을 기울여야 합니다. 예를 들어 저희는 새로운 Stripe의 Agentic 결제 API를 통합하고 있습니다. 모두가 함께 노력하고 있습니다.
질문: 그럼 사용자가 Manus를 사용할 때의 특정한 시나리오에 대해 좀 더 구체적으로 이야기할 수 있을까요? 사용자들은 어떻게 사용하고 있으며, 이 과정에서 어떤 힘이 드러나는지요?
답변: 네, 저희는 현재 세대의 에이전트에서 왔지만 이미 많은 훌륭한 사용 사례를 목격하고 있습니다.
예를 들어 저희가 최근 싱가포르로 이주하면서 주택을 찾기 위해 부동산 중개인을 고용해야 했습니다. 실제 인간 에이전트죠(웃음).
하지만 지금 그 중개인들이 이미 Manus를 사용하고 있습니다. 고객의 요구에 따라 회사 위치와 직원들이 살고 싶어 하는 지역을 분석하고, 이에 맞는 추천안을 생성합니다.
이것이 흥미로운 이유는 '롱테일 수요'에 해당하기 때문입니다. 일반적으로 이런 구체적인 시나리오를 위해 특화된 AI 제품은 없습니다. 그러나 Manus는 범용 에이전트이기 때문에 이러한 수요를 충족시킬 수 있습니다. 우리는 롱테일 수요가 매우 주목할 가치 있다고 생각합니다.
거시적으로 보면 롱테일일 수 있지만, 개별 사용자에게는 이것이 바로 일상 업무입니다. 이런 시나리오는 특히 가치가 큽니다.
이것은 오늘날의 검색 엔진 판도와 비슷합니다. 일반적인 콘텐츠를 검색할 때 Google이든 Bing이든 결과 품질은 거의 비슷합니다. 그런데 왜 사람들이 특정 검색 엔진을 선택할까요? 아마도 특정 순간에 더 적절한 결과를 제공하기 때문일 것입니다. 아주 개인화되거나 전문화된 콘텐츠를 검색할 때는 차이점이 더욱 뚜렷해집니다. 따라서 우리는 범용 에이전트의 강점이 바로 여기에 있다고 생각합니다.
그렇다면 이를 더 나아지게 하려면 어떻게 해야 할까요? 저희는 오랫동안 이것을 고민했습니다. 왜냐하면 모든 것은 결국 프로그래밍과 연결되어 있다고 생각하기 때문입니다. AI에게 컴퓨터를 준다면, 그것이 환경과 상호작용하는 방식은 사실상 프로그래밍을 통해 이루어지기 때문입니다.
저희는 두 가지 방향에서 개선할 수 있다고 생각합니다. 첫째는 규모화(scale)입니다. 하지만 만약 당신이 에이전트의 능력을 백 배로 확대할 수 있다면 어떨까요?
최근 Manus는 '와이드 리서치(Wide Research)'라는 신기능을 출시했습니다. 기본 아이디어는 하나의 에이전트가 수백 개의 에이전트를 파생시켜 함께 과제를 수행하도록 허용하는 것입니다. AI가 작은 일을 도와주는 것은, 대부분 당신 스스로도 할 수 있는 일입니다. 하지만 과제가 너무 방대해서 한 사람이 도저히 처리할 수 없는 경우, 예를 들어 대규모 조사를 수행해야 할 때, 수백 개의 에이전트가 병렬로 작업하면 매우 강력해집니다.
둘째로, 우리는 에이전트가 컴퓨터를 더 유연하게 사용할 수 있도록 해야 합니다. 예를 들어 AI 에이전트에게 사전 설정된 도구만 주면, 그들의 행동 공간은 그 도구들로 제한됩니다. 하지만 당신이 프로그래머라면, 오픈소스 커뮤니티의 모든 자원을 활용할 수 있다는 점을 상상해보세요.
예를 들어 3D 프린팅을 할 때 모델의 매개변수를 직접 수정하는 것은 어렵지만, GitHub에서 적절한 라이브러리를 찾아 설치하면 문제를 해결할 수 있습니다. Manus에서는 범용성을 최적화하고 있으며, '도구의 네트워크 효과(Network Effect of Tools)'라는 개념을 제안했습니다.
흥미로운 사례가 하나 있습니다. 많은 사용자가 Manus를 이용해 데이터 시각화를 하고 있습니다. 아시아에서는 가끔 문제가 발생하는데, 예를 들어 그래프에서 중국어를 표시할 때 폰트 오류가 생길 수 있습니다. 일부 전문 사용자는 출력 시 한국어일 경우 어떤 폰트를 사용해야 하는지 하드코딩 규칙을 작성할 수도 있습니다. 하지만 이런 방식은 시스템을 점점 더 경직되게 만듭니다.
저희는 시스템에 아주 간단한 기능을 추가했습니다. 바로 '이미지 보기'입니다. 결과는 놀라웠습니다. 오늘날의 모델은 이미 충분히 똑똑하기 때문에, 시각화 이미지를 생성한 후 스스로 점검하고 오류를 인식한 뒤 자동으로 수정합니다. 도구의 유연성을 높이는 것이 하드코딩된 규칙보다 더 많은 문제를 해결할 수 있다는 것을 발견했습니다.
질문: 참 흥미로운 시대입니다. 저는 매우 흥분되며, 마치 다시 서른 살이 되고 싶은 마음입니다(웃음). 의학 연구에 대해서도 말씀드리고 싶은데, Manus가 이 분야에서도 강하다는 것을 알고 있습니다. 의료 연구에 Manus를 사용하는 사용자들을 관찰하신 바 있나요?
답변: 많은 사람들이 이미 Manus를 사용해 연구를 하고 있으며, 의학 연구에 국한되지 않습니다. 지금은 '딥 리서치'라고 불리는 제품이 많지만, 정보를 대량 수집하고 분석을 수행한 뒤 markdown 파일이나 문서 하나를 제공하는 정도인데, 이는 훨씬 부족합니다.
많은 경우 연구자들이 진정으로 필요한 것은 상사나 팀에 직접 제출할 수 있는 결과물입니다. 그래서 저희는 Manus에서 연구 결과 출력을 강화했습니다. 예를 들어 의학 연구에서는 종종 공식 보고서, 예를 들어 슬라이드 형식의 보고서를 생성해야 합니다. 따라서 연구자의 요구를 충족시키기 위해 AI 출력 능력을 최적화해야 합니다. 이것이 바로 '도구화된 경험(toolized experience)'입니다.
현재 많은 사용자들이 먼저 Manus로 연구를 수행한 후 바로 웹사이트를 생성합니다. 이는 전통적인 웹사이트 구축 방식과 전혀 다르다고 느낄 것입니다.
웹사이트를 만드는 자체는 사실 그리 어렵지 않습니다. 어려운 것은 데이터의 신뢰성과 정확성을 어떻게 보장하느냐는 점입니다. 따라서 한 번의 대화, 하나의 공유된 컨텍스트 안에서 전체 프로세스를 완료하는 것이 가장 좋다고 생각합니다. 이렇게 하면 당신의 연구와 통찰이 최종 결과물로 원활하게 전환됩니다. 이것이 바로 저희가 Manus에서 하고 있는 일입니다.
질문: 많은 국가들이 AI 시대에 인간의 미래와 경제적 영향에 대해 논의하고 있습니다. 일자리 대체에 대해 어떻게 생각하시며, 어떤 새로운 일자리가 등장할 것이라고 보시나요?
답변: 저희 친구들과 투자자들도 자주 이 질문을 합니다. 저희가 Manus를 출시했을 때, 처음에는 이런 에이전트를 만들면 사람들이 많은 시간을 절약하고 쉽게 돈을 벌 수 있을 것이라 생각했습니다.
하지만 실제로는 이 비전이 완전히 실현되지 않았다는 것을 발견했습니다. 다수의 사용자 조사를 통해, 사용자들이 사용 후 오히려 더 많이 일한다는 것을 알게 되었습니다. 왜냐하면 효율성이 높아져서 본래 잘하던 일을 더 많이 할 수 있게 되었기 때문입니다. 이것이 첫 번째입니다.
둘째로, 저희는 Manus가 완전히 새로운 공간을 열고 있다고 생각합니다. 저희는 계속해서 가상 머신과 클라우드 컴퓨팅에 대해 이야기합니다. 저희는 Manus가 일종의 '개인 클라우드 컴퓨팅 플랫폼' 역할을 하고 있다고 봅니다. 클라우드 컴퓨팅은 이미 수십 년 동안 존재해왔지만, 더 많은 것은 엔지니어의 특권이었습니다. 프로그래밍을 통해 클라우드의 힘을 호출할 수 있었던 것은 저희뿐이었죠. 일반 지식 노동자들은 사용할 수 없었습니다.
하지만 지금은 Manus 같은 AI 에이전트가 등장하여, 사람들이 자연어로 명령을 내리면 AI가 이를 수행할 수 있게 되었습니다. 이는 완전히 새로운 생산성을 해방시키는 것입니다. 이것이 바로 저희가 제공하는 것입니다.
마지막으로 '대체'에 관해 말씀드리자면, 저는 실제로 매우 어렵다고 생각합니다. 예를 들어 부동산 중개인들은 매일 Manus를 사용해 일상 업무를 수행합니다. 하지만 AI는 중개인이 고객과 대면할 때의 의사소통 방식을 절대 대체할 수 없습니다. 저희는 AI 기업이지만, Manus 출시 영상의 대본조차 Manus가 작성했지만, 영상에 등장하는 사람은 저였습니다. 왜냐하면 이것은 신뢰의 문제이기 때문입니다. 그리고 신뢰는 절대로 AI에게 완전히 맡길 수 없습니다.
TechFlow 공식 커뮤니티에 오신 것을 환영합니다
Telegram 구독 그룹:https://t.me/TechFlowDaily
트위터 공식 계정:https://x.com/TechFlowPost
트위터 영어 계정:https://x.com/BlockFlow_News














