
디프시크의 영광 아래: 외로운 '육대 용'
저자: 우천어
인간의 기쁨과 슬픔은 서로 통하지 않는다. 2016년을 인공지능 원년으로 삼아 AI 산업은 이미 여러 차례 재편을 겪었으며, ChatGPT의 호기를 타고 DeepSeek는鲇鱼처럼 대규모 모델 시장을 흔들었다. 동일한 시기에 설립된 '빅모델 6대 스타트업'이라 불리는 다른 기업들과 비교하면 그들의 운명은 마치 동쪽에선 해가 뜨고 서쪽에선 비가 오는 형국이다.
DeepSeek가 연말에 출시한 저비용·고성능 모델 DeepSeek-V3가 GPT-4o 수준임을 입증하며 업계를 놀라게 한 후, 1월 20일 R1 모델을 발표했고, 출시 6일 만에 애플 앱스토어 글로벌 다운로드 순위 1위에 올랐으며, 한 달 만에 누적 다운로드 수가 1.1억 건을 넘었다. 이 기간 동안 주요 클라우드 업체들은 빠르게 오픈소스 버전의 V3와 R1을 상용화했고, 바이두 검색, 위챗 등 제품들도 적극적으로 DeepSeek를 도입하고 있다.
반면 DeepSeek와 거의 동시에 출시된 Kimi의 전 세계 강화학습 모델 k1.5, 그리고 계보별 추론 모델 Step R-mini는 o1 수준에 근접하는 성능을 보였음에도 불구하고, 여전히 DeepSeek의 폭발적인 언론 관심 속에 묻혀버리고 말았다.
DeepSeek의 화려한 행보와 대조적으로 '6대 스타트업'은 잇달아 부정적인 소식을 전하고 있다. 제로원(Zero One)의 추가 분할, 다크매터(Dark Matter)의 예산 문제 및 중재 사건 미해결, MiniMax의 또 다른 고위 임원 퇴사 등...
그 이면에는 실망한 VC들도 있다. 실제 자금을 투입한 프로젝트 중 어느 하나도 DeepSeek만큼의 열기를 끌어내지 못했다. 현재 '6대 스타트업' 중 4곳은 이미 반년 이상 신규 펀딩 소식이 없다. 업계에서는 2024년에 이미 두 곳이 낙오됐다고 평가했고, 2025년엔 다음 낙오자는 누구일까?
단 세 곳만이 여전히 대규모 모델에 집중
DeepSeek의 돌풍은 예고된 것이었다. 2023년 11월 2일 첫 번째 모델 DeepSeek Coder를 출시한 이후 1년여 만에 10개 이상의 다양한 버전을 선보였다. 특히 작년 5월 출시된 V2 모델은 GPT-4 Turbo와 유사한 성능을 제공하면서도 가격은 GPT-4의 1%에 불과해 '가격 도살자', 'AI계의 핑둬둬'라는 별칭을 얻었으며, 대규모 모델 업계 최초의 가격 경쟁을 촉발하기도 했다.
2025년 1월 27일 DeepSeek는 ChatGPT를 제치고 중국 및 미국 애플 앱스토어 무료 앱 순위 1위에 오르며 전 세계적인 주목을 받았다. 이러한 성과를 이끈 것은 추론 중심의 대규모 모델 DeepSeek-R1이다. DeepSeek가 공개한 정보에 따르면, R1은 다수의 권위 있는 테스트에서 o1 정식판과 유사한 점수를 기록했으며 일부 항목에선 이를 초과하기도 했다.
순위 외에도 오픈소스 전략과 가성비 조합은 DeepSeek의 인기 급상승에 결정적인 역할을 했다. DeepSeek의 영향을 받아 이전까지 폐쇄형 개발을 고수했던 바이두 창업자 리옌홍도 결국 오픈소스에 합류했고, OpenAI 창업자 샘 알트먼은 "우리 회사는 오픈소스 전략에서 계속 잘못된 쪽에 있었다"고 반성하기도 했다.
'빅모델 6대 스타트업' 중 MiniMax는 1월 15일 처음으로 오픈소스 모델을 공개했으며, 창업자 옌쥔제는 《완뎬》과의 인터뷰에서 "첫 창업 때 경험 부족이 많았고, 다시 선택할 수 있다면 첫날부터 오픈소스를 했을 것"이라고 밝혔다. 나머지 다섯 기업 중 지푸(Zhipu)만이 가장 일찍부터 오픈소스와 폐쇄형 개발을 병행해왔다. 거의 2년간의 시행착오를 거쳐 '6대 스타트업'의 방향성은 이미 크게 벌어졌다.
제로원은 기초 대규모 모델 기업 중 첫 번째로 대규모 구조 조정을 공식 발표한 회사다. 사전 훈련 알고리즘 팀과 인프라 팀을 해체하고 일부 직원들이 알리바바로 이직한 후, 알리바바 클라우드, 쑤저우 고신구와 각각 산업용 대규모 모델 공동 연구소 및 기지를 공동 설립한다고 발표했다.
인력 면에서도 모델 훈련 책임자 황원하오, 대규모 모델 API 플랫폼 책임자 란위촨, 생산성 제품 책임자 차오다펑 등이相继 퇴사했다. 생존을 위해 버티고자 하는 제로원이지만, 이번 대규모 모델 경쟁에서의 몰락은 감출 수 없다.
백촨(Baichuan) 스마트는 2024년 의료 분야에 집중하겠다고 명확히 했으며, 최근 첫 'AI 소아과 의사'를 출시했다. B2B 상업화 측면에선 그리 순탄하지 않아, 공동창업자이자 상업화 책임자 홍타오는 연말 이전에 퇴사했다. 백촨 직원에 따르면 성과가 기대에 못 미치며 "이제 DeepSeek가 있기 때문에 올해의 압박감은 더욱 커지고 있다"고 전했다.
B2B 상업화 책임자의 퇴사는 MiniMax의 웨이웨이도 마찬가지다. 웨이웨이는 이전 인터뷰에서 "많은 B2B 고객들이 대규모 모델 기업의 수익을 지탱할 정도로 쉽게 돈을 내지 않는다. 고객의 실제 시나리오에서 결과를 맞추기 위해 연구개발 능력과 알고리즘 능력을 기반으로 도와줄 수밖에 없다"고 말하며, 대규모 모델의 상업화가 결코 쉽지 않음을 입증했다.
이러한 상황에서 여전히 대규모 모델 기술 혁신과 AGI 추구에 집중하고 있는 기업은 다크매터, 지푸, 계보별 스타라이트(Stepfun)뿐이다. DeepSeek의 영향을 받아 계보별 스타라이트 역시 오픈소스 진영에 합류했으나, DeepSeek가 주로 텍스트 모델에 집중하는 것과 달리, 계보별 스타라이트가 새롭게 공개한 것은 두 가지 멀티모달 모델—Step-Video-T2V, Step-Audio—이다.
2월 23일 새벽, 다크매터는 최신 논문 《Muon is Scalable for LLM Training》을 발표하고 MoE 모델 Moonlight를 오픈소스로 공개했다. 활성화 파라미터는 단 3B에 불과하다. 많은 업계 관계자들은 이를 '오픈소스 주간을 가로채는 것'이라 평가하는데, 이전에 DeepSeek가 5일 연속 오픈소스 프로젝트를 공개하겠다고 밝힌 바 있기 때문이다.
다크매터에게 가장 시급한 문제는 아마도 막대한 광고비를 투입한 Kimi 제품일 것이다.
광고비 쏟아부어도 1위 달성 어려워
'빅모델 6대 스타트업'과 마찬가지로 DeepSeek도 동명의 C2C 제품을 보유하고 있으며, 출시 첫 주에는 시장에서 큰 주목을 받지 못했다. QuestMobile이 언론에 공개한 데이터에 따르면, 2025년 1월 13일부터 19일까지 DeepSeek 앱의 주간 다운로드 수는 28.5만 건에 불과해 두바오(452만 건)와 Kimi(155.7만 건)에 크게 뒤처졌다.
2025년 1월 20일 R1 출시 이후 DeepSeek의 다운로드 수는 급격히 증가하기 시작했으며, Sensor Tower 조사에 따르면 발표 후 18일 동안 다운로드 수가 1600만 건을 넘어섰고, 이는 OpenAI의 ChatGPT 초기 발매후 900만 건의 거의 두 배에 달한다.
방문량 급증으로 DeepSeek 서버가 일시적으로 다운되기도 했으나, 그럼에도 불구하고 성장세는 여전히 강력했으며, 월간 다운로드 수는 1.1억 건을 돌파했다. 이제 DeepSeek의 존재감을 무시할 수 없게 되었고, 2월 13일 자이트(ByteDance) 내부 전사 회의에서 CEO 량루보는 DeepSeek를 언급하며 따라잡는 속도가 느렸음을 반성하고, 올해는 지능형 서비스 출시를 추구하겠다고 밝혔다.
텐센트의 위챗은 그레이스케일 테스트를 통해 DeepSeek의 AI 검색을 도입했고, 사용량이 예상을 초과하자 AI 앱 위안바오(Yuanbao)를 호출해 위챗 검색을 지원했다. 2월 22일, 텐센트 위안바오가 자이트 두바오를 제치고 중국 애플 무료 앱 다운로드 순위 2위로 상승했으며, DeepSeek는 계속 1위를 유지했다.
'1위와 2위 형님'이 단 한 달 만에 교체되면서, 광고비를 쏟아 부어 성장을 추구하던 두바오와 Kimi의 장점은 더 이상 유효하지 않게 되었다. 두 기업의 차이점은 전자가 '황금 열쇠'를 물고 태어난 귀족이며, 후자는 '새로운 창업 귀족'이라는 점이다. 이전 언론 보도에 따르면 아이폰 채널에서만 Kimi의 하루 광고비는 약 20만 위안, 두바오는 248만 위안에 달했다.
DeepSeek의 영향 아래 다크매터는 최근 제품 광고 예산을 대폭 삭감하고 여러 안드로이드 채널 및 제3자 광고 플랫폼과의 협력을 중단한 것으로 알려졌다. 내부 관계자가 《AI 광년》에 전한 바에 따르면, 확실히 홍보 전략을 조정했으며 "자연 증가는 있지만, DeepSeek의 성장세와 비교하면 미미하다"고 한다.
Kimi가 현재 겪는 문제는 이것뿐만 아니다. 「암류 웨이브스」의 단독 취재에 따르면 오랫동안 보류되었던 Kimi 중재 사건은 예상대로 합의되지 않고 다음 절차로 넘어갔다. 관련자에 따르면, 서클 인텔리전스의 기존 주주와 양즈린 등 양측은 각각 1월 말과 2월 하순 HKIAC(홍콩국제중재센터)에 수수료를 납부했으며 현재 법정 구성도 완료되었다. 이 사건의 핵심 인물인 장위퉁은 별도의 소송을 당할 가능성도 있다.
C2C 제품에 동일하게 큰 기대를 걸고 있는 또 다른 기업은 MiniMax다. 이는 자사의 스타 제품 Talkie가 2024년 상반기에 미국에서 다운로드 수 4위의 AI 앱이 되며 성과를 거뒀기 때문이다. 하지만 좋은 시기는 오래가지 못했고, 12월 중순 Talkie는 미국 앱스토어에서 조용히 사라졌으며, 안드로이드 플랫폼은 영향을 받지 않았다.
계보별 스타라이트, 제로원, 지푸 AI, 백촨 스마트도 모두 자체 AI 애플리케이션을 보유하고 있으나, AI 제품 순위에 따르면 2025년 1월 월간 활성 사용자 수 상위 20위 안에 이들 네 기업과 관련된 제품은 단 하나도 없다. 이전 백촨 스마트 직원은 《AI 광년》에 "백샤오잉의 사용자 유지율과 성장률이 매우 낮은 것도 놀랍지 않다. 우리는 기본적으로 광고를 하지 않고, 다른 기업들이 광고비를 들여 사용자 교육을 마무리하도록 하고 있다"고 말했다.
현재 DeepSeek, 텐센트 위안바오, 자이트 두바오가 애플 무료 앱 다운로드 순위 상위 3위를 점유하고 있다. '빅모델 6대 스타트업'이 순위권에 진입하기 위해서는 경쟁이 더욱 치열해질 수밖에 없다. 현재 7위를 차지한 나노서치(Nano Search)의 저훙이(Zhou Hongyi)는 직접 나서 '제품 홍보'를 하고 있다.
또 다른 간과할 수 없는 경쟁자는 알리바바다. AI 애플리케이션 통의(Tongyi)가 알리바바 스마트 인포메이션 그룹에 편입된 후, 최근 알리바바의 C2C AI 사업은 대규모 채용을 시작했으며, 수백 개의 포지션이 AI 대규모 모델 관련 제품 및 기술 개발에 집중되고 있다. 앞에는 늑대, 뒤에는 호랑이—이것이 바로 현재 '빅모델 6대 스타트업'의 현실적인 처지를 잘 나타낸다.
기술 이야기가 더 이상 낭만적이지 않고, 상업화 성과가 기대에 못 미치며, 제품의 월간 활성 사용자 수 증가와 투자 비용이 비례하지 않는 상황에서 '빅모델 6대 스타트업'의 이상은 풍부하지만 현실은 뼈아프다.
다음 라운드 펀딩 문턱 상승
대규모 모델의 사전 훈련에 막대한 비용이 든다는 사실은 업계 공식이다. 리카이푸는 한 번의 사전 훈련 비용이 약 3~4백만 달러 정도라고 밝혔으며, 비용이 낮은 Yi-Lightning도 2,000장의 GPU를 사용해 한 달 반 동안 훈련을 진행하며 3백만 달러 이상을 소비했다.
저비용을 표방하는 DeepSeek조차 초기 투자는 가늠하기 어려울 정도였으며, 제3자 기관 SemiAnalysis의 추산에 따르면, DeepSeek는 실제로 방대한 컴퓨팅 파워를 보유하고 있다. 총 6만 장의 엔비디아 GPU 카드를 보유하고 있는데, 여기에는 A100 1만 장, H100 1만 장, '특수판' H800 1만 장, '특수판' H20 3만 장이 포함된다.
"범용 대규모 모델의 훈련 비용은 순수한 컴퓨팅 파워만으로도 약 10억 달러 정도로 추정된다. 이는 데이터와 인건비라는 또 다른 두 가지 고비용 요소를 제외한 금액이다. 현재 전 세계적으로 대규모 모델 분야의 인재는 매우 희귀하다." 장먼벤처캐피탈 창업 파트너이자 전 마이크로소프트 벤처캐피탈 대중화구역 책임자인 두펑 박사는 본 기자에게 이렇게 말했다.
이처럼 막대한 투자가 필요하기 때문에 오랫동안 업계에선 '대규모 모델 기업 투자 입장권은 1억 달러'라는 말이 유행했다. 이 말의 이면에 숨겨진 또 다른 신호는 대규모 모델 스타트업이 펀딩을 받지 못하면 생존 자체가 어렵다는 점이다.
2023년 '백 모델 전쟁'이 시작된 후 거의 매달 펀딩 소식이 나오곤 했으나, AI 거품 논란이 커지면서 2024년 9월부터 대규모 모델 '6대 스타트업'에게 수억 달러 규모의 뜨거운 자금이 흘러들어가지 않았다. 2025년 설 연휴 전, 지푸와 계보별 스타라이트가 차례로 '겨울나기 자금'을 확보했다. 전자는 30억 위안 규모의 신규 펀딩을 완료했고, 후자는 수억 달러 규모의 B라운드 펀딩을 마쳤다.
'6대 스타트업' 중 나머지 4곳은 지난 펀딩 소식 발표 후 반년 이상이 지났다. MiniMax는 작년 3월 6억 달러 규모의 B라운드 펀딩을, 백촨 스마트는 작년 7월 50억 위안 규모의 A라운드 펀딩을, 제로원은 작년 8월 수억 달러 규모의 신규 펀딩을, 다크매터는 작년 8월 3억 달러 펀딩을 각각 완료했다.
설 연휴 기간 중 DeepSeek는 전 세계적으로 폭발적인 인기를 끌며 언론이 DeepSeek와 창업자 량원펑을 극찬했다. 벤처투자계에서는 DeepSeek가 과연 펀딩을 시작할지, 그리고 그 밸류에이션은 얼마일지에 대한 소문이 최근 끊이지 않고 있다.
이전에는 알리바바가 100억 달러의 밸류에이션으로 10억 달러를 투자해 10% 지분을 확보한다는 소식이 있었으나, 알리바바 부사장 옌차오는 곧바로 SNS를 통해 "알리바바가 DeepSeek에 투자한다는 외부 소문은 허위 정보다"라고 부인했다. 이후 외신은 "DeepSeek가 처음으로 외부 자금 조달을 고려 중"이라고 보도했으나, DeepSeek 관계자는 펀딩 관련 모든 소문이 허위라고 일축했다.
"많은 투자자들이 직접 또는 연결을 통해 량원펑을 만나려 하고 있다. 나는 그의 밸류에이션이 현재 '빅모델 6대 스타트업'을 훨씬 뛰어넘을 것으로 예측한다." 중징캐피탈의 한 투자자는 "DeepSeek가 기준점이 되었고, 이제 '6대 스타트업'이 1차 시장에서 신규 펀딩을 받기 위한 문턱은 분명히 더 높아졌다"고 말했다.
사실 대규모 모델 창업 붐이 일어난 이래 업계는 '6대 스타트업'이 모두 독립적인 '대규모 모델 기업'으로 살아남을 것이라고 믿는 사람은 거의 없었다. '6대 스타트업'의 창업자들 자신도 공개 석상에서 유사한 의견을 표현한 바 있다. 예를 들어 MiniMax 창업자 옌쥔제는 미래 전 세계에 단 5개의 대규모 모델 기업만 남을 것이라고 생각한다고 말했다.
"중국에는 반드시 자체적인 ChatGPT가 생길 것이다. 이것은 검색엔진과 같다. 우리만의 규정 준수 요구사항이 있다. 그러나 중국판 ChatGPT는 5개 기업 중에서만 나올 것이다: BAT + 자이트 + 화웨이." 셔니(迅雷) 창업자이자 원왕캐피탈의 청하오는 본 기자에게 이렇게 말했다.
계속되는 폭발적 인기 속에서 원래부터 분화 양상을 보이던 '6대 스타트업'은 더욱 빠른 재편을 맞게 될 것이다.
TechFlow 공식 커뮤니티에 오신 것을 환영합니다
Telegram 구독 그룹:https://t.me/TechFlowDaily
트위터 공식 계정:https://x.com/TechFlowPost
트위터 영어 계정:https://x.com/BlockFlow_News














