
a16z 내부 리뷰: AI 소셜 제품은 근본적으로 성립되지 않을 수도 있다
출처: a16z
정리: Z Finance

이미지 출처: a16z
지난 10년간 모든 소비자 제품의 폭발적인 성장은 거의 항상 새로운 사회적 패러다임의 재구성과 함께했다. 페이스북의 친구 동기에서부터 틱톡의 알고리즘 추천까지, 우리는 점차 제품을 통해 자기를 정의하고 정체성을 표현하는 법을 배워왔다.
그 시절의 제품은 '사람이 표현하고, 제품이 보조하는' 형태였다. 그러나 지금 AI는 조용히 역할을 뒤집고 있다. 더 이상 사람의 도구가 아니라, 표현의 주체이자 연결의 매개체, 심지어 감정의 수용체로 자리잡기 시작한 것이다. ChatGPT에서 Veo3, 11 Labs에서 Character.AI에 이르기까지, 우리는 단순히 "효율성 향상"으로 오인되지만 실은 "인간의 역할 외주화"라는 깊은 변혁을 목격하고 있다.
이번 에피소드에서는 Erik Torenberg가 진행하는 대담에서 Justine Moore, Bryan Kim, Anish Acharya, Olivia Moore가 전례 없는 판단을 제시한다. 오늘날의 AI 제품은 더 이상 '도구처럼 작동하는 도구'가 아니라 '사람처럼 작동하는 도구', 나아가 '사람 그 자체를 대체하는 제품'이 되고 있다는 것.
사용자들은 월 200달러라는 고액 구독료를 지불한다. **왜냐하면 그것이 더 강해서가 아니라, '당신 대신 해주고', 심지어 '당신 대신 존재해 주기 때문**이다. Veos는 8초 만에 맞춤형 영상을 생성할 수 있고, ChatGPT는 사업 계획서 작성, 심리 상담, 감정 고백까지 대신할 수 있으며, 11 Labs는 당신만의 독특한 음성 정체성을 만들어낸다. 이 모든 것이 이제 당신이 직접 할 필요가 없으며, 심지어 '당신'일 필요조차 없게 된다.
AI 소비의 부상 뒤에는 극도로 위험한 신호가 있다. 표현이 형식화되고, 사회적 관계가 시뮬레이션되며, 정체성이 재편되는 것이다.
우리는 오늘날 여전히 Reddit, Instagram, Snapchat을 통해 AI로 생성된 '나'를 공유하지만, 이 플랫폼들은 옛 병에 담긴 새 술일 뿐이다. 진정한 AI 네이티브 소셜 네트워크는 아직 등장하지 않았다. 왜냐하면 AI는 '상태'를 생성할 수 있지만, '감정적 긴장감'을 창출할 수는 없으며, 동반의 환각은 제공할 수 있지만, 현실적인 연결 속에서 통제 불가능한 갈등과 취약함을 대체할 수는 없기 때문이다.
이 모든 것은 세 가지 충격적인 판단을 낳는다:
첫째, AI 제품의 본질은 사용자를 향상시키는 것이 아니라, '사용자가 누구인가'를 재구성하는 것이다;
둘째, AI 동반자의 부상은 사회적 관계의 시작이 아니라 종말이다;
셋째, AI 분신의 보급은 표현의 확장이 아니라 인격 경계의 소멸이다.
예견 가능한 미래에 가장 성공적인 AI 제품은 단순한 도구형 제품이 아니라, 인격형 제품이 될 것이다. 그것은 당신을 이해하고, 모방하며, 대표하고, 인도하며, 궁극적으로는 당신을 대체하게 될 것이다.
이는 효율의 승리가 아니라 존재의 질적 변화다.
AI 소비 혁명: 고가 구독과 사회적 재구성
Erik Torenberg: 이번 소비 분야 팟캐스트에 참여해주셔서 감사합니다. 페이스북, 트위터, 인스타그램, 스냅, 왓츠앱, 틴더, 틱톡 등 몇 년마다 혁신적인 제품이 등장하곤 했습니다. 그런데 최근 몇 년 사이 이런 흐름이 갑자기 멈춘 듯한 느낌이 듭니다. 정말 멈췄을까요? 아니면 어떻게 문제를 재정의해야 할까요? 현재 상황을 어떻게 보시며, 앞으로 어디로 나아갈까요?
Justine Moore: 저는 ChatGPT가 지난 몇 년간 가장 큰 소비자 시장 성공 사례라고 생각합니다. 또한 이미지, 영상, 오디오 분야에서 미드저니(Midjourney), 11 Labs, Blackforce Labs 같은 돌파구를 마련한 제품들도 많이 나타났죠. Veo와 같은 제품도 등장했지만 흥미로운 점은, 이들 대부분이 앞서 언급하신 소셜 속성이나 전통적인 소비자 제품 특징을 갖추지 못했다는 것입니다. 아마도 AI가 여전히 초기 단계라, 현재 대부분의 신제품과 혁신은 연구팀이 주도하고 있기 때문일 겁니다. 이들은 모델 학습에는 매우 능숙하지만, 역사적으로 모델 위에 소비자 제품 레이어를 구축하는 데는 서툴렀습니다. 긍정적으로 보면, 이제 모델이 충분히 성숙해져 오픈소스나 API를 통해 개발자들이 이를 기반으로 더 전통적인 소비자 제품을 만들 수 있게 되었습니다.
Bryan Kim: 매우 흥미로운 질문입니다. 저는 지난 15~20년을 돌아보면서 생각해봤습니다. 말씀하신 구글, 페이스북, 우버 등의 거대 기업들을 보면 인터넷, 모바일, 클라우드 컴퓨팅 등을 결합했을 때 정말 놀라운 회사들이 등장했습니다. 모바일 클라우드 기술은 이미 성숙기에 접어들었고, 이 플랫폼들은 10~15년 동안 존재하며 다양한 세분 시장이 어느 정도 탐색되었습니다. 과거에는 사용자가 애플이 새로 선보이는 기능에 적응해야 했지만, 지금은 기반이 되는 모델이 지속적으로 업데이트되어야 하므로 이것이 첫 번째 차이점입니다.
두 번째 차이점은, 말씀하신 바와 같이 과거의 승자들은 정보 분야(예: 구글)에 집중됐고, 지금은 ChatGPT가 명백히 이 방향을 이어받고 있습니다. 실용 도구 분야에서는 박스(Box)나 드롭박스(Dropbox) 같은 제품을 놓쳤지만, 지금은 더 많은 소비자 앱이 등장하면서 여러 회사들이 이러한 사용 시나리오를 두고 경쟁하고 있습니다. 창의적 표현 분야도 마찬가지이며, 창의적 도구가 끊임없이 출현하고 있죠. 현재 결핍된 것은 소셜 연결성인데, AI는 아직 소셜 그래프를 재구성하지 못했습니다. 이것은 비어 있는 영역으로, 향후 발전을 지켜봐야 합니다.
Erik Torenberg: 매우 흥미롭네요. 페이스북이 벌써 거의 20년이 됐습니다. Justine가 방금 언급한 회사들 중 OpenAI 외에 다른 회사들이 10~20년 후에도 계속 존재할 수 있을까요? 우리가 논의하는 이 회사들은 어떤 방어력을 가졌다고 보십니까? 그리고 지금 서비스 중인 모든 시나리오들이 10년 후에 신생 기업들에게 대체될까요, 아니면 여전히 이들 기업이 주류 시장을 장악할까요?
Anish Acharya: ChatGPT의 비즈니스 모델 질은 과거 소비자 제품 주기의 유사 기업보다 훨씬 높다고 말할 수 있습니다. 최고 요금제는 월 200달러이며, 구글의 소비자 제품 최고 요금은 월 250달러입니다. 물론 여기에는 방어적 네트워크 효과 등의 문제가 있지만, 이는 초기 비즈니스 모델의 결함을 보완하기 위한 방법일 수 있습니다—이러한 요소가 없다면 비즈니스 모델의 질은 더 나빴을지도 모릅니다. 지금은 사용자에게 직접 고액을 청구함으로써, 우리가 과거에 이 문제를 지나치게 복잡하게 만들었다는 것을 보여주는 것일 수 있습니다.
Erik Torenberg: 혹시 비즈니스 모델의 질이 낮았기 때문에 오히려 더 강한 잔존률이나 제품-시장 지속성이 생겼을 가능성은요?
Anish Acharya: 확실히 그렇습니다. 과거에는 즉각적인 수익 창출이 불가능한 상황에서도 기업 가치를 축적할 수 있다는 이야기를 만들어내야 했지만, 지금은 이 모델 기업들이 직접 수익을 내고 있습니다. 또한 Justine가 언급한 점도 주목할 만합니다. 모든 기반 모델들이 서로 다른 방향으로 발전하고 있습니다. Claude, ChatGPT의 횡단 모델, Gemini 모델이 서로 대체 가능할까요? 이는 가격 경쟁을 의미할까요? 하지만 실제 사용자는 각기 다른 시나리오를 가지고 있으며, 실제로 관찰되는 현상은 가격 인하가 아니라 인상입니다. 따라서 깊이 들여다보면, 이미 흥미로운 방어 전략이 일부 존재하고 있음을 알 수 있습니다.
Bryan Kim: 가격이 하락하지 않고 상승하는 현상은 매우 흥미롭습니다. 전통 시대에서 AI 시대로 넘어오면서, 소비자 기업의 수익 모델이 근본적으로 변화했고, 이제 즉각적인 수익 창출이 가능해졌기 때문입니다. 저는 잔존률 지표에 대해 항상 생각해왔습니다—Olivia가 제 견해를 수정해줄 수 있겠지만—AI 시대 이전에 소비자 구독 모델을 논의할 때, 우리는 정말로 사용자 잔존률과 수입 잔존률을 구분했을까요? 당시에는 요금 구조가 안정적이었고, 사용자가 요금제를 업그레이드하는 경우가 거의 없었기 때문입니다. 하지만 지금은 사용자 잔존률과 수입 잔존률을 반드시 구분해야 합니다. 왜냐하면 사용자들이 요금제를 업그레이드하기 때문입니다. 그들은 크레딧 포인트를 구매하고, 초과 사용하며, 결국 지출 금액이 지속적으로 증가합니다. 따라서 수입 잔존률이 사용자 잔존률보다 훨씬 높은데, 이는 전례 없는 현상입니다.
Olivia Moore: 과거 최고 수준의 소비자 구독 제품은 연간 약 50달러 정도였는데도 이미 고가로 여겨졌습니다. 하지만 지금은 사용자들이 월 200달러를 기꺼이 지불하며, 심지어 일부 사례에서는 가격이 너무 낮다고 느껴 더 많이 내고 싶어하기까지 합니다.
Erik Torenberg: 어떻게 이런 현상을 설명할 수 있을까요? 사용자들은 도대체 무엇을 얻어서 이렇게 높은 비용을 지불할 의향이 있는 걸까요?
Olivia Moore: 제 생각에 이 제품들은 사용자 대신 일을 수행하기 때문입니다. 과거의 소비자 구독 제품은 개인 재무, 건강, 운동, 엔터테인먼트 분야에 집중되었고, 자기 계발이나 오락에 도움이 되지만 가치를 얻기 위해 사용자가 많은 시간을 투자해야 했습니다. 그러나 지금 Deep Research와 같은 제품은 사용자가 스스로 시장 보고서를 만들기 위해 필요한 10시간의 작업을 대신해 줍니다. 많은 사람들에게 이런 효율성 향상은 월 200달러를 지불할 만큼 충분히 가치 있으며, 일 년에 한두 번만 사용하더라도 마찬가지입니다.
Justine Moore: Veo3의 경우, 월 250달러를 지불하고도 기꺼이 사용하는 이유는 마법의 상자 같기 때문입니다—열기만 하면 원하는 영상을 얻을 수 있으니까요. 비록 8초밖에 안 되지만 효과는 놀랍습니다. 등장 인물이 말을 하고, 사용자는 친구에게 보여줄 수 있는 놀라운 콘텐츠를 만들 수 있으며, 예를 들어 친구 이름이 포함된 맞춤형 메시지를 제작하거나 트위터 등에 게시할 수 있는 완전한 스토리를 창작할 수도 있습니다. 이렇게 개인화된 콘텐츠를 창작하고 다중 플랫폼에 공유할 수 있는 제품은 소비자에게 부여하는 권한 측면에서 과거 어떤 제품보다 훨씬 더 강력합니다.
Anish Acharya: 모든 소비 분야가 소프트웨어에 의해 대체될 것 같습니다.
Erik Torenberg: 구체적인 예를 들어주시겠어요?
Anish Acharya: Olivia가 말했듯, 엔터테인먼트 분야는 창의적 표현 소프트웨어에 의해 재편되고 있습니다—오프라인에서 해야 했던 창작이 이제는 완전히 소프트웨어로 처리됩니다. 생활비를 지출하는 인간관계 중개(mediation) 분야도 소프트웨어에 의해 대체되고 있습니다. 삶의 모든 측면이 모델을 매개로 하게 될 것이며, 사람들은 이를 위해 기꺼이 비용을 지불할 것입니다.
AI 소셜 혁명: '디지털 자아'의 부상과 전통 플랫폼의 돌파구
Erik Torenberg:Brian, 새로운 AI 시대에도 여전히 소셜 연결성이 부족하다고 말씀하셨고, 사람들이 여전히 인스타그램, 트위터 같은 전통 소셜 네트워크에 의존하고 있다고 했습니다. 그렇다면 돌파구는 어디에서 나올까요?
Bryan Kim: 소셜 분야는—제가 매우 기대하는 분야인데—자세히 살펴보면 그 핵심 본질은 상태 업데이트입니다. 페이스북, 트위터, 스냅 모두 예외 없이 "지금 내가 뭐 하고 있지?"를 보여줍니다. 상태 업데이트를 통해 사람들이 연결을 형성하는 것이죠. 이 상태 업데이트의 매체 형태는 끊임없이 진화해왔습니다. 텍스트 상태에서 실제 사진, 그리고 짧은 동영상으로까지요. 현재 사람들은 리얼스(Reels) 같은 짧은 동영상 형식으로 연결을 맺고 있으며, 이는 소셜 연결의 한 시대를 구성하고 있습니다. 문제는 이제 AI가 어떻게 이 연결을 혁신할 수 있을까 하는 것입니다. 어떻게 AI를 통해 더 깊은 인간관계와 삶의 인식을 형성할 수 있을까요? 사진, 영상, 오디오 같은 기존 매체 형태에 초점을 맞춘다면, 모바일 시대에 이미 그 가능성은 거의 다 발굴되었다고 볼 수 있습니다.
흥미로운 점은, 제가 구글을 10년 넘게 사용했지만 ChatGPT가 저를 구글보다 더 잘 알고 있을지도 모른다는 것입니다—제가 입력하는 내용이 더 많고, 더 많은 컨텍스트를 제공하기 때문입니다. 이런 '디지털 자아'를 공유할 수 있게 된다면, 어떤 새로운 형태의 인간관계가 탄생할까요? 특히 표층적인 소셜 관계에 지친 젊은 세대에게는 매우 매력적인 다음 세대 소셜 형태가 될 수 있습니다.
Justine Moore: 이미 그런 사례를 목격하고 있습니다. 예를 들어, "내 데이터를 기반으로 ChatGPT가 내 다섯 가지 장단점을 요약해줘" 혹은 "내 본질을 나타내는 초상화를 생성해줘", 또는 "내 인생을 만화로 그려줘" 같은 바이럴 콘텐츠가 퍼지고 있죠. 사용자들은 이를 전 세계에 공유합니다—제가 게시한 지 몇 분 안에 수십 명이 자신의 버전을 공유했습니다. 흥미로운 점은, AI 창작 도구로 인해 발생하는 소셜 행동이 현재는 여전히 전통적인 소셜 플랫폼에서 주로 발생한다는 것입니다. 예를 들어 페이스북은 지금 AI 생성 콘텐츠로 넘쳐납니다.
Bryan Kim: 어떤 사용자 그룹은 아직 이 사실을 인지하지 못할 수도 있습니다.
Justine Moore: 페이스북은 중장년층 사용자의 AI 콘텐츠 집산지가 되었고, 반면 Reddit과 Reels는 젊은 세대의 AI 창작물을 담고 있습니다.
Olivia Moore: 저도 완전히 동의합니다. 첫 번째 AI 소셜 네트워크의 형태가 무엇일지 항상 궁금했습니다. 우리는 "AI가 개인 사진 생성하기" 같은 시도를 봐왔지만, 문제는 소셜 네트워크가 진정한 감정적 몰입을 요구한다는 것입니다. 만약 모든 콘텐츠가 취향에 따라 생성된다면(완벽한 이미지, 행복한 상태, 멋진 배경), 진실한 상호작용의 감정적 긴장감은 사라지게 됩니다. 따라서 저는 진정한 원주민 AI 소셜 네트워크는 아직 등장하지 않았다고 생각합니다.
Bryan Kim: '모방(cumorphic)'이라는 표현이 딱 맞습니다. 많은 AI 소셜 제품들은 로봇/AI가 인스타그램이나 트위터 피드를 모방하는 식인데, 이런 '모방'적 혁신은 본질적으로 'AI로 구식 형태를 복제하는 것'입니다. 진정한 돌파구는 모바일 패턴을 벗어나야 할지 모릅니다—뛰어난 AI 제품은 모바일 기기와 호환되어야 하지만, 최첨단 모델은 엣지 컴퓨팅/디바이스 측 배포에서 여전히 돌파구가 필요하며, 이는 새로운 형태를 낳을 수 있습니다. 저는 미래의 가능성에 매우 기대하고 있습니다.
Erik Torenberg: 인간 추천은 분명 중요한 응용 분야입니다—비즈니스 파트너 찾기, 친구 사귀기, 데이트 등 말이죠. 기존 플랫폼들은 이미 방대한 사용자 데이터를 축적하고 있습니다.
Anish Acharya: AI 네이티브 LinkedIn 시도를 관찰하는 것은 매우 시사적입니다. 전통적인 LinkedIn은 단순히 지시 정보—"나는 이것을 안다"—만 제공하지만, 새로운 기술은 진짜 지식 저장소 아카이브를 만들 수 있습니다. 예를 들어 "디지털 버전의 Erik"과 대화하여 모든 지식을 얻는 것이죠. 미래의 소셜 관계는 이렇게 될 수 있습니다—모델이 사용자를 깊이 이해한다면, '디지털 분신'을 배치하여 상호작용할 수 있을 것입니다.
기업이 먼저 가는 AI의 비결: 혁신 속도와 세분 시장
Erik Torenberg: 여러분은 일부 AI 제품이 소비자보다 기업에서 더 빨리 채택된다고 언급했는데, 이는 과거 기술 사이클과 다릅니다. 이 현상은 무엇을 의미할까요?
Justine Moore: 매우 흥미로운 점입니다. 저는 BK와 함께 11 Labs에 투자했고, A라운드 직후 바로 참여했습니다. 초기에는 소비자 사용자들이 먼저 몰려들어 재미있는 영상/음성 콘텐츠를 만들거나, 자신의 목소리를 복제하거나, 게임 모드를 개발했습니다. 하지만 대부분의 경우 제품이 아직 진정한 대중 소비자에게 닿지는 못했습니다—미국인이라면 누구나 11 Labs를 스마트폰에 설치하거나 구독하는 것은 아닙니다. 그러나 이 회사는 이미 대규모의 기업 계약을 체결했으며, 대화형 AI, 엔터테인먼트 분야에서 다수의 주요 고객을 확보하고 있습니다.
이 현상은 여러 AI 제품에서 나타납니다: 소비자 측에서 바이럴 전파를 거친 후, 기업 판매 전략으로 전환되는 것이죠—이는 이전 세대 제품과는 근본적으로 다릅니다. 지금은 기업 구매 담당자들이 AI에 대한 강제적 요구사항(예: AI 전략 수립, AI 도구 사용)을 갖고 있어, 트위터, Reddit, AI 관련 정보를 주시하며 소비자 제품을 발견하면, 이를 비즈니스 시나리오에 어떻게 적용할 수 있을지 고민하게 되고, 결과적으로 기업의 AI 전략을 추진하는 '조력자'가 됩니다.
Bryan Kim: 저도 비슷한 AI 혁신 활용 사례를 들어봤습니다. 기업이 소비자 측에서 바이럴 전파를 일으킨 후, Stripe의 거래 데이터를 활용해 익명의 결제 기록을 AI 도구에 입력하여 사용자가 소속된 회사를 특정합니다. 특정 회사의 사용자 수가 임계값(예: 40명 이상)을 넘기면, 기업 측이 적극적으로 접근해 "귀사 직원 40명 이상이 저희 제품을 사용하고 있는데, 기업 협업을 고려해보시겠습니까?"라고 물어보는 식입니다.
Erik Torenberg: 처음 말씀하신 많은 기업과 제품 사례들 말입니다. 이들이 모두 '마이스페이스 시대'의 초기 탐색자들일까요, 아니면 장기적 가치를 지닌 것일까요? 20년 후에도 오늘의 이 기업들을 계속 논하게 될까요?
Justine Moore: 물론 현재 중요한 소비자 중심 AI 기업들이 모두 지속 발전하길 바랍니다. 하지만 현실은 그리 낙관적이지 않을 수 있습니다. AI 시대와 이전 소비자 제품 사이클의 핵심 차이점은: 모델 레이어와 기술 역량이 여전히 빠르게 진화하고 있다는 것입니다. 종종 우리는 이러한 기술의 잠재력 한계조차 아직 도달하지 못했습니다. 예를 들어 Veo3가 발표된 후, 갑자기 다중 캐릭터 대화, 원생 오디오 처리 등 멀티모달 기능을 구현할 수 있게 되었고, 텍스트 LLM은 비교적 성숙했지만 모든 분야에서 지속적인 향상 여지가 있습니다. 관찰 결과, 기업이 '기술/품질의 최전선'에 머무른다면—즉 가장 진보된 모델이나 통합 능력을 보유한다면—MySpace/Friendster와 같은 운명을 되풀이하지는 않을 것입니다. 기술 진화 과정에서 잠시 뒤처지더라도, 업데이트를 통해 다시 정상으로 복귀할 수 있기 때문입니다.
지금 더 흥미로운 것은 세분 시장의 등장입니다: 이미지 분야에서는 더 이상 단일 최고 모델이 없습니다. 디자이너, 사진작가, 다양한 지불 그룹(월 10달러 vs 월 50~100달러) 모두 자신에게 최적화된 솔루션을 갖추고 있습니다. 각 수직 분야의 사용자 참여도가 매우 높기 때문에, 지속적인 혁신만 한다면 여러 승자들이 장기간 공존할 수 있습니다.
Bryan Kim: 저도 완전히 동의합니다. 영상 분야도 마찬가지입니다—광고 영상, 삽입 광고 영상 등이 모두 세분화되어 있습니다. 어제 본 기사에 따르면, 서로 다른 모델이 제품 프레젠테이션, 인물 촬영 등 다양한 시나리오에 특화되어 있다고 하더군요. 각 세분 시장 모두 잠재력이 큽니다.
Erik Torenberg: 기업의 경쟁 우위와 경쟁 장벽에 대한 논의는 AI 시대에 어떻게 달라졌나요? 어떻게 이 문제를 바라봐야 할까요?
Bryan Kim: 최근 이에 대해 깊이 반성했습니다. 전통적인 경쟁 우위(네트워크 효과, 워크플로 내 통합, 데이터 축적)는 여전히 중요하지만, 관찰 결과 '먼저 경쟁 우위를 구축하려는' 기업들이 승자가 되는 경우는 드뭅니다. 우리가 주목하는 분야에서 승리는 일반적으로 규칙을 깨고 빠르게 반복하는 기업들입니다—놀라운 속도로 새 버전, 새 제품을 출시하죠. 현재 AI 초기 단계에서는 속도가 곧 경쟁 우위입니다. 소음 속에서 주목을 받기 위한 채널 속도든, 제품 반복 속도든, 이것이 승부를 좌우합니다. 왜냐하면 빠른 행동은 사용자 인식 점유율을 선점하고, 이를 실제 수익으로 전환하며, 지속 가능한 성장을 위한 긍정적 순환을 만들어낼 수 있기 때문입니다.
Erik Torenberg: 매우 흥미롭습니다. Ben Thompson은 약 10년 전 'Snapchat의 생강빵 집 전략(Gingerbread House Strategy)'이라는 제목의 블로그 글을 썼는데, 핵심 주장은 "Snap이 할 수 있는 어떤 기능이든 Facebook은 더 잘 만들 수 있지만, Snap은 지속적으로 새로운 아이디어를 출시할 것이다. 이 혁신 속도를 유지한다면, 그것 자체가 경쟁 우위가 될 수 있다"는 것이었습니다. 이를 생강빵 집 전략이라고 불렀죠.
Bryan Kim: 저는 궁극적으로 사용자 접근성과 네트워크 효과가 작용한다고 봅니다. Snap 역시 이 점에서 강점이 있습니다—Z세대와 젊은 사용자들의 핵심 커뮤니케이션 플랫폼 자리를 차지하고 있기 때문입니다.
Erik Torenberg: 새로운 제품이 네트워크 효과를 어떻게 구축할 수 있을까요?
Bryan Kim: 현재 대부분의 제품은 여전히 창작 도구 단계에 머물러 있어 "창작-소비-네트워크 효과"의 폐쇄 루프를 형성하지 못하고 있습니다. 진정한 네트워크 효과는 아직 나타나지 않았지만, 우리는 11 Labs와 같은 새로운 형태의 경쟁 우위를 보고 있습니다—엄청난 반복 속도와 뛰어난 제품력을 바탕으로 기업 시장에 진입해 워크플로에 깊이 통합된 모델입니다. 이 모델이 형성되고 있으며, 전통적인 의미의 네트워크 효과는 여전히 관찰 대상입니다.
Olivia Moore: 11 Labs는 전형적인 사례입니다. 며칠 전 AI 생성 영상에 음성을 입히려 했는데, 이들은 선도적 우위, 최고의 모델, 큰 사용자 기반으로 인한 데이터 플라이휠 덕분에 지금은 음성 라이브러리를 구축했습니다—사용자들이 수많은 맞춤형 음성과 캐릭터를 업로드했죠. 여러 음성 공급업체를 비교해봤을 때, 특정 유형(예: 늙은 마법사 목소리)이 필요하면 11 Labs는 25가지 선택지를 제공하지만, 다른 플랫폼은 2~3가지밖에 없을 수 있습니다. 아직 초기 단계지만, 이 모델은 전통적인 플랫폼 네트워크 효과와 유사하며, 전혀 새로운 형태는 아닙니다.
음성 AI: 기업용 음성 AI 수요 폭발
Erik Torenberg: 우리는 음성 상호작용을 아주 일찍부터 주목해왔습니다. 초기에 상상했던 것 중 어떤 부분이 이미 실현되었고, 미래 트렌드는 어떻게 될까요? Anish, 처음에 왜 음성 상호작용에 그렇게 큰 기대를 걸었나요?
Anish Acharya: 초기에 우리를 자극한 것은 음성이 인간 상호작용 역사 전체를 관통하는 기본 매체임에도 불구하고, 기술 응용의 핵심 매개체가 된 적이 없다는 점이었습니다. 과거 기술은 항상 성숙하지 못했습니다—Voice XML에서 음성 애플리케이션, 90년대의 Dragon NaturallySpeaking까지 흥미로웠지만 기술적 기반이 되기엔 부족했습니다. 생성형 모델의 등장으로 음성이 원생 기술 요소가 되었고, 이 중요한 생활 영역은 여전히 탐색할 여지가 큽니다. 반드시 많은 AI 네이티브 애플리케이션이 탄생할 것입니다.
Olivia Moore: 저는 초기에 음성에 대한 기대가 더 소비자 측면에서 왔다고 봅니다—예를 들어 하루 종일 온라인 상태인 포켓 코치/심리치료사/연인이 있는 상상을 하죠. 이런 상상이 이제 실현되기 시작했고, 이미 여러 제품이 관련 기능을 구현하고 있습니다. 하지만 놀라운 점은 모델이 발전함에 따라 기업용 응용이 더 빠르게 성장하고 있다는 것입니다. 금융기관 등 고도로 중요한 분야에서 음성 기술이 인공 고객센터를 대체하거나 보완하는 데 신속히 도입되고 있습니다. 이전에는 규정 준수 문제가 있었고, 고객 연간 이탈률이 무려 300%에 달하며, 해외 아웃소싱 콜센터 관리도 매우 어려웠습니다.
진정한 돌파구를 만든 소비자용 음성 경험은 아직 준비 중입니다. 이미 초기 사례가 있습니다. 예를 들어 사용자가 ChatGPT 고급 음성 모드를 새로운 방향으로 확장하거나, granola처럼 하루 종일 음성 데이터를 수집해 가치를 창출하는 제품이 있습니다. 소비 시장의 매력은 예측 불가능성에 있습니다—최고의 제품은 종종 갑작스럽게 등장하죠. 그렇지 않으면 이미 개발되었을 테니까요. 앞으로 1년간 음성 소비 분야의 혁신을 기대해볼 만합니다.
Anish Acharya: 맞습니다. 음성은 AI가 기업 시장에 진입하는 돌파구가 되고 있습니다. 현재 대부분의 사람들이 인지하지 못하는 점은, AI 음성이 고객센터처럼 위험이 낮은 시나리오에만 적합하다고 생각한다는 것입니다. 하지만 우리의 관점은—비즈니스 협상, 영업 제안, 고객 설득, 관계 유지 등 기업의 일상/주간/연간 가장 중요한 대화들이 모두 AI가 주도하게 될 것이며, AI가 이 분야에서 더 뛰어난 성과를 내기 때문입니다.
Erik Torenberg: 사람들은 언제쯤 AI 생성 '디지털 분신'과 지속적이고 효과적인 상호작용을 시작할까요? 예를 들어 AI Justine, AI Anish, AI Erik과 대화하는 시나리오 말입니다.
Justine Moore: 이미 초기 형태를 목격하고 있습니다. Delphi 같은 기업은 지식 기반을 기반으로 인물의 AI 복제체를 만들 수 있으며, 사용자는 조언이나 피드백을 얻을 수 있습니다. Brian이 앞서 언급했듯, 핵심 질문은—유명인만 문자/음성(앞으로는 영상)으로 상호작용할 수 있는 AI 분신을 갖는 것이 아니라, 모든 사람에게 이를 개방하면 어떻게 될까? 소비자 분야에서는 종종 생각합니다. 많은 사람이 독특한 기술이나 통찰을 갖고 있는데, 예를 들어 고등학교 시절 유머 감각이 뛰어났던 친구가 코미디 요리 쇼를 만들 수 있었지만 기회를 놓쳤을 수도 있고, 누군가의 멘토가 귀중한 인생 조언을 갖고 있는데, AI 복제체/인격을 통해 그들의 영향력을 전에 없던 방식으로 확장할 수 있을까?
현재 관찰되는 응용은 주로 유명인/전문가에 집중되어 있거나, 또 다른 극단—이미 알려진 가상 캐릭터(Character.ai가 음성 모드를 추가한 초기 형태)—에 국한되어 있습니다. 새로운 기술을 시도할 때 사용자는 친숙한 캐릭터와 상호작용하는 것을 선호합니다—좋아하는 애니메이션 캐릭터처럼 말이죠. 하지만 미래에는 이 둘 사이의 공백을 메울 것입니다—완전히 허구적인 캐릭터도 아니고, 유명인도 아닌, 모든 실제 개인을 아우르는 AI 분신 말입니다.
Olivia Moore:저는 사람들의 학습 방식이 다르며, AI 음성 제품이 이러한 다양성을 잘 충족할 수 있다고 봅니다. Masterclass은 최근 흥미로운 베타 테스트를 시작했습니다: 기존 강좌의 강사를 음성 에이전트로 전환해 사용자가 맞춤형 질문을 할 수 있도록 한 것입니다. 제 이해로는, 이 시스템이 RAG 기술을 통해 강사의 모든 강의 콘텐츠를 분석해 높은 수준의 맞춤화된 정확한 답변을 제공합니다. 저는 매우 흥미롭게 여깁니다—저는 이 회사의 팬이지만, 12시간짜리 강의를 끝까지 보기에는 인내심이나 시간이 부족했지만, Masterclass 음성 에이전트와 2~5분간 대화를 나누며 유용한 아이디어를 얻을 수 있었습니다. 이는 실제 인물이 실용적인 AI 복제체로 전환되는 전형적인 사례를 보여줍니다.
허구와 현실의 공생: AI 분신과 인간 창작자
Anish Acharya: 더 깊은 질문은—사용자가 관심 있는 인물의 복제판과 대화하고 싶어 할까, 아니면 완전히 허구적인 '완벽한 이상형' 합성체와 상호작용하고 싶어 할까? 후자는 더 탐구 가치가 있을 수 있습니다—이 '완벽한 매칭 상대'는 실제로 존재하지만 만나지 못했을 수도 있고, 기술이 이를 구체화할 수 있을 것입니다. 이런 존재 형태는 어떤 모습일까요? 이것이 더 깊이 생각해볼 방향입니다.
Erik Torenberg: 깊이 생각해볼 만한 점은—어떤 시나리오에서는 여전히 인간이 업무를 수행해야 하고, 어떤 시나리오에서는 AI 대체를 더 받아들일 것인지—이 경계선이 어떻게 정해질지입니다.
Anish Acharya: Olivia가 언급한 Masterclass 사례는 본질적으로 단방향 감정 연결의 연장입니다. 특정 인물의 복제체와 대화하는 가치는, 구체적인 대상과 교류하고 싶은 사용자의 욕구를 충족시키는 데 있으며, '가장 이상적인 낯선 사람'이라는 추상적 개념과의 상호작용에는 없습니다.
Bryan Kim : 이건 ChatGPT 관련 바이럴 트윗을 떠올리게 합니다—뉴욕 지하철에서 누군가 전화로 ChatGPT와 계속 대화하며 마치 여자친구와 얘기하는 것 같았다는 거죠.
Justine Moore: 또 다른 사례가 있습니다. 한 부모가 아이가 45분 동안 계속해서 토마스 소형 기관차에 대해 묻자 지쳐서 음성 모드를 켜고 휴대폰을 아이에게 줬습니다. 2시간 후 돌아와보니 아이는 여전히 ChatGPT와 토마스 소형 기관차에 대해 깊이 논의하고 있었고—아이는 상대가 누구인지 신경쓰지 않았습니다. 다만 이 '사
TechFlow 공식 커뮤니티에 오신 것을 환영합니다
Telegram 구독 그룹:https://t.me/TechFlowDaily
트위터 공식 계정:https://x.com/TechFlowPost
트위터 영어 계정:https://x.com/BlockFlow_News












