
"나는 여러 차례 양원펑에게 DeepSeek가 펀딩을 받아야 한다고 조언했다"
저자: 류설난, 투중망

폭발적인 인기를 끈 DeepSeek는 역사에 기록될 만하다. 몇 년 후 사람들이 이 순간을 되돌아볼 때, 결론은 아마도 2022년 말 OpenAI가 ChatGPT를 출시한 이후 중국 AI 발전의 주류 서사는 항상 "추격"이었지만, DeepSeek의 등장으로 그 "추격"이 "혁신"과 "보급", 심지어는 "재구성"과 "초월"로 바뀌었다는 것이다.
하지만 벤처 캐피탈(VC) 업계는 실망스러운 입장이다. '대규모 모델 6小龙'을 포함해 VC들이 지원하는 대형 모델 스타트업들 중 어느 하나도 DeepSeek만큼의 글로벌 관심을 받지 못했기 때문이다. 거의 동시에 발표된 Kimi의 강화학습 신모델 k1.5는 OpenAI에 이어 세계에서 처음으로 다중 모달 o1 유사 모델로서 여러 측면에서 o1 수준에 근접하거나 오히려 초월했음에도 불구하고 큰 파장을 일으키지 못했고, DeepSeek의 열광적인 여론 속에 묻혀버리고 말았다.
모든 것은 아마도 DeepSeek 창립자 양원펑이 뉴스 연합 방송에 등장해 총리의 귀빈이 된 시점에서부터 시작되었을 것이다. 그가 회의에서 무슨 말을 했는지는 아마도 가장 중요한 것이 아닐지도 모른다. 여론이 궁금한 것은 왜 갑자기 앞머리를 길게 늘어뜨린 80년대생 한 명이 고위층의 주목을 받게 되었는가 하는 점이다. 친구들의 SNS를 살펴보니, 어라? 양자화 펀드를 운영하고 있네. 더 궁금해진다.
AI 산업을 장기간 추적해온 1차 시장 관찰자로서, 여론의 확산 속도는 내 예상보다 느렸지만 그 강도는 내 상상을 훨씬 뛰어넘었다. 1월 20일 일요일 밤 양원펑이 뉴스 연합 방송에 등장한 후 일주일 동안 여론이 확산되었고, 전 세계를 뒤흔든 'DeepSeek R1 550만 달러 훈련 비용' 소식은 금요일 날 NVIDIA 주가를 3.12% 하락시키는 데 그쳤지만, 바로 다음 주 월요일에는 A주 창업판에 -2.73%의 장대 음봉을 만들어냈다. 당시 나는 이렇게 평가했다. DeepSeek가 NVIDIA에게는 뺨을 때렸지만, 돌아서서는 A주를 훨씬 더 세게 걷어찼다고.
역풍은 금세 찾아왔다. 1월 27일 당일 NVIDIA는 장 초반 급락하며 약 17% 하락했고, 전 세계 컴퓨팅 파워 시장은 울부짖으며 '늑대가 왔다'고 외쳤다. DeepSeek야말로 그 늑대였다. 물론 개인의 영예와 굴욕 따위는 별 의미 없고, 실수하는 것도 흔한 일이지만, 중국 VC 업계는 AI 컴퓨팅 파워 외에 가장 큰 '희생양'이 되어 버렸다. 언론은 양원펑과 그의 이상주의에 최대한의 찬사를 아끼지 않았지만, 동시에 중국 VC들에게는 극도의 수치와 비난을 가했다. 예를 들어 샤오홍슈에는 'DeepSeek는 다시 한번 중국 VC가 웃음거리임을 증명했다'는 제목의 게시물이 올라왔고, 더욱 불행하게도 좋아요 수천 개를 받았다.

하지만 그래도 나는 분명히 말하고 싶다. 도덕적 비난은 매우 저급하다. 지금 단계에서 '왜 VC들이 DeepSeek에 투자하지 못했는가'를 논의하는 것은 감정적인 분출 이외에는 별다른 의미가 없다. 투자하지 못했으면 못한 것이고, 어떤 객관적이거나 주관적인 이유를 댄다 해도 모두 변명처럼 들릴 뿐이다. 더 깊은 성찰은 매우 필요하겠지만, 그것은 지금 당장 할 일이 아니다. 국내 1차 시장을 종합적으로 보면 LP에서 GP까지, 그리고 자금 조달, 투자, 관리, 회수에 이르는 각 단계에서 많은 '고질적인 문제'들이 단시간에 해결되기 어렵고, 대부분은 VC/PE들이 결정할 수 있는 사항조차 아니다.
내가 시급히 논의되어야 한다고 보는 것은 현재와 미래의 문제이며, 적어도 세 가지 질문을 포함해야 한다. 지금 DeepSeek에 투자할 수 있을까, 그리고 그 가치 평가는 얼마인가? DeepSeek는 이전에 이미 투자된 다양한 AI 프로젝트에 어떤 영향을 미칠 것인가? DeepSeek가 촉발한 AI 산업의 변화가 VC들의 다음 단계 AI 자본 배치에 어떤 긍정적인 지침을 제공할 것인가?
일, DeepSeek 펀딩? 양원펑의 '태극권'
DeepSeek의 가치 평가와 투자 가능 여부에 관해서는 최근 며칠 사이에 이미 많은 소문이 돌고 있다. 어제 저녁에는 알리바바가 100억 달러의 기업가치로 10억 달러를 투자해 10% 지분을 확보한다는 소식이 있었다. 이에 대해 알리바바 부사장 옌차오는 곧바로 자신의 SNS를 통해 "외부에서 유포된 알리바바의 DeepSeek 투자 정보는 허위 정보"라고 부인했다. 그러나 이번 거래에 접근했다는 한 투자자는 투중망에 "지금 상황이 민감해서 그들도 말하기 곤란하고, 조금 더 기다려야 한다"고 전하며, 부인된 이 거래에도 여전히 변수가 있을 수 있음을 시사했다.
그 이전에도 한 AI 투자자가 투중망에 DeepSeek가 투자자들과 접촉 중이라고 밝히며, 제시된 기업가치는 80억 달러라고 전했다. 위에서 언급된 '알리바바가 100억 달러의 가치를 매겼다'는 '거짓 소문'과 차이가 있지만, 80억 달러이든 100억 달러이든 DeepSeek의 가치 평가는 이미 '대모델 6小龙' 중 가장 높은 미니맥스(40억 달러)를 훨씬 뛰어넘었다.
투중망이 입수한 정보에 따르면, 최근 며칠간 많은 투자자들이 직접 또는 간접적으로 양원펑에게 펀딩을 본격적으로 시작했는지 확인하려 했고, 가치 평가도 대략 위의 범위를 중심으로 이루어졌지만, 양원펑은 이를 인정하거나 부정하는 명확한 답변을 하지 않고 주로 '태극권'을 펼쳤다. 또한 많은 투자자들이 DeepSeek의 IR 담당자에게 펀딩 진행 여부를 문의했지만, 어제까지 모두 부정적인 답변을 받았다.
또 다른 정보로는 DeepSeek 내부에서도 '양원펑에게 여러 번 DeepSeek가 펀딩을 해야 할지 말아야 할지를 권유했다'는 것이다. 이는 적어도 두 가지를 의미한다. 첫째, 펀딩 여부에 대해 DeepSeek 내부에서도 의견이 일치하지 않을 수 있으나, 결정권은 반드시 양원펑에게 있으며, 오직 그만이 보물을 여는 열쇠를 쥐고 있다는 점. 둘째, 양원펑은 최근 일부 투자자나 산업 자본과 접촉했을 가능성이 크지만, 극소수의 인맥 안에서만 유지되고 있다는 점.
예를 들어 대규모 모델 투자에 대해 여러 차례 경멸적인 태도를 보였던 주 총은 분명히 이 인맥 안에 있지 않다. 비록 DeepSeek로 인해 대모델에 대한 그의 태도가 바뀌어 "나라면 꼭 투자하겠다"고 말했지만, 투중망이 DeepSeek 펀딩 소식을 들었는지 물었을 때 받은 답변은 "모른다"였다. 하지만 주 총은 역시 주 총답게 VC가 DeepSeek 펀딩에 참여해야 하는 핵심 포인트를 정확히 잡았다. "이미 가격은 중요하지 않다. 중요한 것은 여기에 참여하는 것이다."
이야기가 길어졌지만, 요컨대 현재 VC 업계는 DeepSeek의 펀딩 가능성에 대해 매우 높은 기대를 가지고 있다. 여러 투자자들은 C단 트래픽 처리, 급증하는 대역폭 및 컴퓨팅 비용, 향후 계속된 규모 확대, 그리고 무엇보다도 지속적인 혁신 능력을 유지하기 위한 인재 유지를 포함한 여러 측면에서 DeepSeek의 펀딩 필요성을 투중망에 설명했다.
물론 다시 말하지만, 열쇠는 양원펑과 DeepSeek가 더 큰 서사를 펼칠 가능성을 결정할 수 있는 사람의 손에만 있다. 이후 남은 것은 시간 문제일 뿐이다. 다만 개인적으로는 DeepSeek가 좀 더 오랫동안 버틸 수 있기를 바란다. 시간이 길어질수록 그 사이의 전략적 교착이 더욱 흥미로울 것이며, 한 투자자가 SNS에서 말했듯이 "DeepSeek가 private company to build public good의 순수함을 유지한다면, 이러한 우아함은 드물다."
이, "어떻게든 일부 지분이라도 받아내야 한다"
DeepSeek가 설 전후로 주목받기 시작하면서 대규모 모델 투자자들의 심정은 복잡했다. 기쁨은 중국의 대규모 모델 기업이 이렇게 빨리 세계 수준을 따라잡았다는 점이고, 공포는 전체 AI 투자의 논리가 거대한 변화를 겪을 수 있다는 점이다.
"적어도 국내에서는 DeepSeek가 이미 이 전쟁에서 승리했다. 현재 진행 중인 펀딩의 기업가치는 이미 80억 달러에 달해 업계에서 가장 높은 평가를 받고 있으며, 이제는 다투거나 정방향으로만 투자할 수밖에 없다." 한 AI 투자자가 나에게 말했다.
DeepSeek는 이전에 펀딩을 공개하지 않았으며 초기 자금은 환팡 양자화에서 지원했다. 양원펑이 인터뷰에서 밝힌 바에 따르면 그는 투자자를 찾으려 했지만, 자신이 연구에 집중하려는 생각과 VC의 상업화 중심 요구가 맞지 않아 포기했다. 반대로 폭발적인 인기를 얻은 후 DeepSeek는 투자자들에게 둘러싸이게 되었다.
날 선 칼날을 드러낸 이상, 숨기고자 해도 쉽지 않다. 앞선 투자자의 시각에서 보면 지금 펀딩은 형세상 어쩔 수 없는 선택이다. "현재 DAU가 2000만으로 치솟았고, 트래픽이 너무 급격하게 유입되어 명백히 감당이 안 된다. 만약 DeepSeek가 모델 개발만 하고 앱을 만들지 않는다면 문제없지만, 앱을 만들었기에 현재 매일 수백만, 심지어 수천만 원을 지출하고 있다. 서버, 네트워크 리소스 등의 문제를 반드시 고려해야 한다. 또한 이미 단일 지점을 성공적으로 구현했고, 이제는 규모를 확대해야 하는데, scale up도 돈이 든다."
하지만 이 소식은 관련 당사자로부터 인정받지 못했다. 최근 문의하러 온 투자자들에게 DeepSeek의 펀딩 담당자는 여전히 "펀딩 계획이 없다"고 답했다. 어제 밤 '알리바바가 100억 달러의 기업가치로 10억 달러를 투자해 DeepSeek 지분 10%를 인수하려 한다'는 소식도 알리바바 부사장에 의해 명확히 부인되었지만, 이는 알리바바 미국 주식이 장전에 6% 이상 급등하는 것을 막지 못했다.
수십억을 투자할 수 있는 국유 자본과 대기업이 DeepSeek 펀딩에 가장 가능성이 높은 후보로 여겨지고 있다. 흥미로운 디테일 중 하나는, 환팡 항저우 본사가 위치한 후이진 국제빌딩이 저장성 금융지주와 같은 건물의 다른 동에 있다는 점인데, 현재 이곳에는 기자들과 투자자들로 가득 차 있다. DeepSeek 베이징 사무실이 위치한 롱커빌딩은 또 백두 투자와 같은 건물에 있다.
한 성급 국유 투자자의 말에 따르면, 최근 그들의 기관은 '상하를 막론하고' DeepSeek 측과 접촉하며, 어떻게든 "일부 지분을 무릎 꿇고라도 받아내고 싶다"고 했지만, DeepSeek는 입을 꾹 다물고 있으며, 현재 펀딩 창구를 열지 않았다고 단언하고 있다.
사실 AI 업계 사람들에게 DeepSeek는 그리 신비롭지 않다. 코로나 팬데믹 기간에 A100 1만 장을 비축했다는 전설은 널리 알려져 있다. 투자자들을 통해 입수한 정보에 따르면, 2023년 초 DeepSeek는 여러 대규모 모델 기업과 투자기관을 만나봤으며, 샤오홍슈 창업자 마오원차오도 그 중 하나였다. 그러나 올해 1월 DeepSeek는 샤오홍슈와 협력했고, 현재 DeepSeek가 입주한 공식 소셜 미디어는 샤오홍슈, X, 위챗 공식 계정뿐이다. 분명히 양원펑은 샤오홍슈에 특별한 애정을 가지고 있다.
양원펑의 말과 마찬가지로, 대화 후 양원펑과 VC들은 서로 목표가 다르다는 것을 알게 되었다. "VC는 LP의 돈을 관리하는 것이며 모두 돈을 벌어야 하므로, 결국 뜻이 맞지 않는다." 2023년 7월 양원펑은 항저우 딥서치(DeepSeek) 인공지능 기초기술연구 유한회사를 설립하여 일반 인공지능과 대규모 모델 개발에 집중했다. 운좋게도 바이트댄스가 AI 개발에 투자하기 시작한 시기도 바로 그 무렵이었다.
또 다른 디테일은 2022년경 양자화 펀드가 정책적으로 지속적으로 타격을 받으면서 환팡의 운용 규모도 계속 줄어들었다는 점이다. 양원펑은 DeepSeek를 설립하기 전 VC 외에도, 자체적으로 대량의 GPU 컴퓨팅 클러스터를 보유하고 있었고, 자신의 돈도 있어서 이를 활용해 여유 있는 컴퓨팅 파워를 '활용'하려 했으며, 이를 위해 전략 투자 담당 직원 두 명을 채용했다. 저공 비행 등을 포함한 수많은 기술 프로젝트를 검토했지만, 환팡의 결론은 "밖에서 할 수 있는 일은 우리가 스스로도 할 수 있다", 대부분의 프로젝트는 "의미가 없다"는 것이었고, 결국 "하나도 투자하지 않았다". 이후 양원펑의 기술 이상주의 정신에 기반해 DeepSeek가 탄생하게 된 것이다.
대규모 모델 시장의 변화는 빠르게 일어나고 있으며, DeepSeek는 곧 시장을 요동치게 할 메기 역할을 하게 될 것이다. "내가 다양한 AI 프로젝트를 볼 때, 기본적으로 상대방이 어떤 기반 모델을 사용하고 있고 어떤 모델이 좋은지 묻는데, 2024년에는 일반적인 피드백이 통의, 두바오, 그리고 DeepSeek였다." 한 투자기관의 파트너 에릭(가명)이 나에게 말했다.
DeepSeek의 대중적 보급은 두 가지 모델에서 비롯되었다. 1월 13일 DeepSeek는 V3 대규모 모델을 사용하는 앱 버전을 출시했는데, 이는 완전히 오픈소스인 MoE(혼합 전문가) 모델이다. DeepSeek 보고서에 따르면 V3 모델의 훈련 비용은 고작 600만 달러로, Llama 3의 1%에 불과하다. 1월 20일 DeepSeek는 오픈소스 대규모 모델 R1을 발표했으며, 매우 낮은 훈련 비용으로 OpenAI 최신 O1 모델과 유사한 성능을 달성했다. 하루 후 DeepSeek는 미국과 중국 애플 앱스토어 무료 다운로드 순위 1위에 올랐다.
"누구도 DeepSeek가 이렇게 인기를 끌 줄은 예상하지 못했을 것이다. V3를 발표했을 때 업계는 주목했지만, 당시 앱이 출시되지 않아 C단을 폭발시키지는 못했다. 앱이 출시된 후 일반 대중이 제품 효과가 좋다고 느끼면서 DeepSeek는 자연스럽게 거리의 대화거리가 되었다. 자연 트래픽과 구매한 트래픽의 차이는 이때 명확히 드러났다." 한 기관의 파트너 제레드(가명)가 말했다.
어떤 제품의 인기는 천시지리인화(天時地利人和)가 모두 필요하며, 시점이 매우 중요하다. 에릭의 시각에서 현재 AI의 성장 곡선은 이미 완만해졌고, 사전 훈련 데이터는 거의 소진되었으며, 대규모 언어 모델의 능력은 더 이상 쉽게 상승하지 못하고 있다. 따라서 OpenAI의 O1과 DeepSeek의 R1을 대표로 하는 추론 모델로 전환해야 한다. "이 시점에서 상한선을 더 높이기 위해 계속 거액을 투자할 것인지, 아니면 5%의 진보를 추구하지 않고 비용을 기존의 1/10로 낮출 것인지? DeepSeek가 대표하는 비용 절감 노선은 마침내 적절한 시점에 등장했다."
삼, '육룡'이 차별화 전략을 선택하지 않으면 더 이상 펀딩하기 어려울 것
"국내 대규모 모델 훈련의 종합 비용(데이터, 인건비, 전력, 컴퓨팅 파워)은 미국보다 낮으며, DeepSeek는 뛰어난 엔지니어링 능력으로 비용을 극한까지 통제했다. 앞으로 두 분기 동안 DeepSeek는 업계의 기준선이 될 것이며, 비용 절감은 대세다. 상한선을 5% 높이기 위해 10배의 돈을 더 쓰는 것은 자본과 상업적 관점에서 볼 때 가치가 없다." 제레드는 말했다.
대규모 모델은 과거에 막대한 자금을 소모했으며, 연구개발 비용의 감소는 우선 해당 기업의 가치 평가 논리를动摇시킨다.
에릭은 DeepSeek가 해외에서 이토록 높은 공포감을 일으킨 이유는 바로 대기업들의 가치 평가가 재평가되어야 하기 때문이라고 말했다. "과거에는 모두 대규모 모델이 본질적으로 자본의 경쟁이라고 믿었으며, 그래서 2023년 5월 이전에 1억 달러를 받지 못하면 국내에서 대규모 모델 사업을 하지 말라는 말이 나왔다. 하지만 이제 그렇게 많은 돈이 필요하지 않다는 것을 알게 되었을 때, 대규모 모델 기업들의 가치 평가는 더 이상 버티기 어려울 것이다. 장기적으로 가치 평가는 당신이 창출하는 가치에 기반하지만, 단기적으로는 사람들이 당신의 장벽이 얼마나 높다고 생각하느냐에 달려 있다."
왕룽진은 DeepSeek의 등장이 기존 대규모 모델 기업의 가치 평가에 어떤 영향을 미칠지 아직 판단하기 어렵지만, 그들의 극도로 낮은 비용은 업계에 충격을 주고 있다고 말했다. 만약 대규모 모델 기업들이 다른 방법으로 훈련 또는 추론 비용을 줄이는 혁신을 할 수 있다면 가치 평가에 미치는 영향은 비교적 제한적일 수 있다. "국내 기업들이 다른 방식으로 유사한 효과를 달성할 가능성도 배제할 수 없으며, 이 점도 기대해볼 만하다."
제레드의 입장은 다소 비관적이다. 그는 '육룡'이 차별화 전략을 선택하지 않으면 더 이상 펀딩하기 어려울 것이라고 믿는다. 대기업은 자본의 뒷받침이 있어 계속 싸울 수 있지만, 스타트업이 단일 프로젝트에서 1위를 다투지 못한다면 거의 의미가 없다. "물론 차별화가 있고 돈을 많이 태우지 않는다면 살아남는 것도 하나의 방법이다."
사실 '육룡'은 이미 서로 다른 길로 분화되고 있다. 일부 기업은 여전히 대규모 모델 훈련에 막대한 자금을 소비하고 있는데, 작년에 한 기업의 수익이 약 3억 위안이었지만 비용은 20억 위안이 넘었다는 정보를 입수했다. 일부 기업은 포기했다. 예를 들어 Lingyiwanwu는 알리윈과 '산업 대모델 공동 연구소'를 설립하며 초대규모 모델 훈련을 포기하고, 파라미터가 적당하고 더 빠르며 저렴한 모델을 계속 훈련하여 이를 기반으로 수익을 낼 수 있는 애플리케이션을 개발하고 있다.
"사전 훈련 결과가 오픈소스 모델보다 못할 때 모든 기업은 사전 훈련에 집착해서는 안 된다." <연차> 인터뷰에서 리카이푸는 이렇게 말했다. 일부 기업은 다중 모달에 더 많은 노력을 기울이고 있는데, 예를 들어 MiniMax가 그렇다. 또 다른 기업은 특정 산업에 집중하고 있는데, 예를 들어 백촨은 의료 대규모 모델 개발에 초점을 맞추고 있다. 제레드는 결국 이러한 대규모 모델 기업들의 가치 평가가 재구성될지 여부는 상업화 성과에 달려 있다고 보며, DeepSeek도 펀딩 시 동일한 상업화 문제에 직면할 것이라고 말했다.
사, DeepSeek에 대한 공감과 견해 차이
DeepSeek는 이미 일부 사람들에게 '국운'의 상징으로 여겨지고 있지만, 투자자들 사이에서는 여전히 독보적인 위치에 설 수 있을지에 대한 견해 차이가 존재한다.
제레드는 대기업이 DeepSeek와 같은 혁신을 만들어내기 어렵다고 믿는다. 이유는 대기업이 자원이 과잉되다 보니 누구도 비용을 극한까지 최적화하는 데 신경쓰지 않기 때문이다. 동시에 내부 경쟁이 심해 사람을 경쟁시키는 데 치중하고, 일 자체에 집중하지 않는다. KPI는 일반적으로 '얼마나 많은 DAU를 달성했는가'로 단순화되며, 이는 트래픽을 구매하는 것으로도 달성 가능한 목표이기 때문에 기술 혁신을 실질적으로 추진하기 어렵다. 반면 헤지 펀드 출신은 자원과 비용을 매우 중요하게 여기며, 항상 엔지니어링 혁신을 통해 비용을 절감하는 방법을 고민하는데, 이는 대기업의 유전자와 스킬셋과 다르다.
하지만 에릭은 스타트업 중에서 DeepSeek가 장기적으로 1위를 유지할 수 있다고 보지만, DeepSeek가 알리바바나 바이트댄스의 대규모 모델보다 뛰어나다고 단정하기는 어렵다고 생각한다. 채택된 기술 패러다임을 보면 이론적으로 OpenAI의 O1 패러다임 상한선이 DeepSeek의 R1보다 높다. "비용을 절약할 것인지, 아니면 높은 상한선을 추구할 것인지, 이것은 선택의 문제다. 국내 상황을 보면 모두 능력이 뛰어나지만, 초점이 다를 뿐이다. 두바오와 통의는 다중 모달 모델을 개발했고, DeepSeek는 더 집중적이며 언어 모델만 개발하고 있으며, 가장 강력한 점은 비용 절약에 있다."
춘절 기간 동안 쉔위안 캐피털 창립 파트너 왕룽진은 계속 DeepSeek의 기저 논리를 연구하기 위해 자료를 찾고 있었다. 그의 시각에서 DeepSeek는 애플리케이션, 엔지니어링, 아키텍처 등 여러 측면에서 많은 혁신을 이루었다. 시장에서 논의되는 참고 사례에 대해서도 그는 별 문제가 아니라고 생각했다. OpenAI의 트랜스포머는 Google에서 비롯되었고, 애플의 iOS는 부분적으로 후지제록스를 참고했으며, 마이크로소프트의 GUI도 제록스 알토를 참고했다. 모두 거인의 어깨 위에 서서 한 걸음 더 나아간 것이다.
외신의 묘사는 더욱 흥미롭다. 일부 언론은 OpenAI와 DeepSeek의 서로 다른 길을 17세기 영국 내전 당시 '틀렸지만 낭만적인' 왕당파와 '옳지만 거부감을 주는' 라운드헤드파 사이의 갈등에 비유했다. 인공지능 왕당파는 AGI를 위해 어떤 대가를 치르더라도 추구하지만, 인공지능 라운드헤드파는 보다 현실적인 목표에 집중하며 특정 문제를 가능한 효율적으로 해결하는 데 주력한다. 해외 대규모 모델 펀딩 관련 최신 소식은 일랴 수츠키버가 설립한 Safe Superintelligence가 200억 달러의 기업가치로 펀딩을 협상 중이라는 점이다—여전히 비싼 가격이다.
업계를 뒤덮고 있는 것은 여전히 한줄기 미궁이다. "몇 년 연속, 대규모 모델은 해마다 초반에 사람들을 놀라게 하는 새로운 진전을 보였고, 보통 초반과 후반의 사건들이 연결되지 않기 때문에 지금은 누구도 연말에 무슨 일이 벌어질지 예측할 수 없다." 제레드가 말했다.
에릭은 R1이 대표하는 후기 훈련 모델 패턴이 막 시작됐다고 보며, DeepSeek는 중간에 갈림길을 제시했을 뿐, 어떤 방향으로 갈지는 아직 모르지만, 확실한 것은 스타트업에 대한 수요가 급격히 증가할 것이라는 점이다. 그의 시각에서 DeepSeek의 더 중요한 의미는 새로운 가치관을 가져왔다는 점이다. "그들의 목표는 얼마나 많은 돈을 벌 것인지가 아니라, 가치 있는 혁신을 만들어낼 수 있는가 하는 것이다. 이 가치관은 중국 기업, 특히 대기업이 깊이 생각해볼 만하다."
인터뷰에서 양원펑이 말했듯이, "앞으로 하드코어 혁신이 점점 더 많아질 것이다. 사회가 하드코어 혁신을 하는 사람들을 성공시키게 되면 집단적 사고방식이 바뀔 것이다. 우리는 다만 여러 사실과 과정이 더 필요할 뿐이다." 지난 40년간 부동산과 인터넷의 부의 창출 운동은 모두 기저 기술 혁신에서 비롯된 것이 아니었다. 오직 사람들이 보상과 노력 사이에 일정한 관계가 있다는 것을 보게 될 때, 투기가 더 이상 중국 상업 사회의 최대 가치관이 되지 않을 것이다.
"2025년은 AI 애플리케이션이 폭발하는 해가 될 것이다."
이 말은 내가 작년 말 투자자들과 FA들로부터 가장 많이 들은 의견이었으며, 일부 투자자들은 명확히 2025년에는 AI 애플리케이션만 본다고 말했다.
춘절 이후 DeepSeek라는 불씨가 붙으면서 투자자들과 기업들은 AI 애플리케이션에 대한 기대가 더욱 커졌다. 그러나 흥분之余, 그들의 눈빛에는 어둠이 가시지 않는다. 기회가 왔다는 것은 알지만, 어디에 기회가 있는지 보이지 않는다?
DeepSeek가 가져온 변화에 직면해 대부분의 기업이 전략적 차원에서 조정을 하지 못한 것은 인정해야 한다. 하지만 행동을 보면 모두 급히 DeepSeek 관련 회의를 소집하고 있다. 일부 투자자는 출근 후 이틀 연속 DeepSeek 회의를 열었으며 이미 긴급 배치를 완료했다고 말했다.
DeepSeek를 언급하면 많은 사람들의 첫인상은 높은 가성비다. 단지 이 점만으로도 업계는 여전히 합의에 도달하지 못했다.
Traini CEO 선린자이는 "기술의 과도한 평등은 반드시 좋은 것은 아니다. 혁신의 동력을 잃을 수 있다. 현재로선 2025년은 폐쇄형 쉘에서 개방형 쉘로 전환하는 해가 될 것이며, 그 결과 동질화된 제품들이 쏟아져 나오고 여전히 수익 창출 방법을 찾지 못할 가능성이 있다. 현재 파인튜닝(Fine-tuning)을 할 수 있는 기업은 생각보다 많지 않고, 지속적으로 수행하며 혁신하는 기업은 더욱 적으며, 데이터와 인재가 부족하다."고 말했다.
물론 그는 모델이 작아지고 경제성이 향상되면 애플리케이션에는 분명 긍정적인 영향을 준다고 인정한다. 그러나 애플리케이션 측면에서 기술은 가장 큰 제약이 아니라 산업에 대한 이해라고 말했다.
사실 현재 프롬프트만으로도 많은 애플리케이션의 요구를 충족시킬 수 있지만, 좋은 제품을 만든 것은 아니다. iOS가 폐쇄적이어서 안드로이드 시스템이 생겼지만, 안드로이드 위에 많은 휴대폰 브랜드가 나타난 것은 아니다. 안드로이드 플랫폼 위에서 성장한 소프트웨어 애플리케이션이 iOS와 그 애플리케이션을 대체하지도 못했다. Llama의 능력도 매우 강력하여 대부분의 애플리케이션 요구를 충족시킬 수 있지만, 우리가 기대하는 것과는 여전히 멀다.
더 많은 사람들은 DeepSeek가 애플리케이션 측면에서 가져올 긍정적인 면을 보기 원한다. 예를 들어 일부 투자자들은 DeepSeek 등장 이후 애플리케이션 제조업체는 애플리케이션 자체의 전후단 사용자 경험에만 집중하고 시나리오에 따라 다듬기만 하면 되므로 기초 수준의 많은 투자를 절약할 수 있다고 지적했다.
합사 창립자 겸 CEO 마춘촨은 AI의 발전은 전기의 발전과 같아 매우 많은 애플리케이션 제조업체를 탄생시킬 것이며, 이는 기초 능력이라고 말했다. DeepSeek의 등장은 이러한 기초 능력의 비용을 시장가격 수준으로 만들었다고 설명했다.
그는 추가로 설명했다. 과거에 AI를 사용하기를 주저했던 많은 분야가 이제는 탐색과 혁신을 시도할 수 있게 되었으며, 현재 AI의 컴퓨팅 파워 소비 비용은 고객 가치나 출력 결과에 비해 이미 아까운 것이 아니다. 예를 들어 영수증 인식 분야에서 우리는 과거에 소량으로만 적용할 수 있었지만, 지금은 거의 제로 비용이 되어 마음껏 적용할 수 있게 되었다.
지적해야 할 점은, C단 애플리케이션이냐 B단 애플리케이션이냐가 VC들에게 더 매력적인가를 묻는다면, 나는 투자자들로부터 일관된 답을 받았다—즉, B단 애플리케이션이 투자 효율성 측면에서 더 낫다는 것이다.
투자 업계 외부의 기업 내부 인력조차도 올해 DeepSeek 관련 프로젝트가 투자 시장에서 매우 인기를 끌 것이라고 보고 있다. 그들의 시각에서 완전히 오픈소스인 DeepSeek는 많은 세분화된 시나리오 모델의 탄생을 가속화할 것이기 때문이다.
첫째, B단 사용자가 가장 지불 능력이 있다. 또한 모든 B단 애플리케이션은 여전히 기존 기업 소프트웨어의 사고방식을 따르고 있다. 즉, 각 분야마다 자체 대규모 모델이 생길 것이라는 의미다. 이는 서로 다른 분야의 데이터베이스와 지식베이스가 다르기 때문이다.
하지만 현재의 문제는 애플리케이션 제조업체가 자체적으로 모델을 만들지 않으면 수요와 효과를 보지 못한다는 점이며, 더욱 중요한 것은 애플리케이션 스타트업은 대규모 모델과 다르게 투자자들이 기업에게 많은 시간과 자금을 실험에 쓰도록 허용하지 않는다는 점이다.
또한 현재 어떤 시나리오가 폭발할지 예측할 수 없지만, 이런 세분화된 애플리케이션이 등장하는 속도가 빨라지고 있다는 점은 말할 수 있다.
둘째, 비용이 낮아졌다. 이전에는 실험실에서만 가능한 일이 모든 곳에 적용될 수 있게 되었다. 즉, 현재 AI가 아직 커버하지 못한 많은 시나리오들이 매우 낮은 비용의 AI를 통해 개조될 수 있게 된 것이다.
국과가화 고급 파트너 루자칭의 시각에서 특색 있는 애플리케이션이 등장한다면 금세 규모를 키울 수 있다. 특히 응용 시나리오를 갖춘 상장사의 경우, 과거에 산업 애플리케이션을 구축하려면 수백 대의 서버가 필요했지만, 지금은 단 10대만으로도 가능하며 비용이 급격히 감소했다.
셋째, AI 애플리케이션은 분명히 점점 더 많아질 것이며, 시장의 주목을 더 많이 받게 될 것이다. 왜냐하면 현재 애플리케이션은 아직 진정한 대규모 상업화를 실현하지 못했기 때문이다.
C단 제품을 선택하지 않는 이유는 투자자들 사이에 공감대가 있기 때문이다—C단 애플리케이션은 결국 대기업들의 영역이 될 것이며, 이전에도 그런 흔적이 있었다.
애플리케이션 계층 외에도 하부의 하드웨어 계층에서도 거대한 변화가 일어나고 있다. 예를 들어 DeepSeek가 가져온 트래픽 홍수를 감당하기 위해 각 지역에서 건설된 유휴 컴퓨팅 센터들이 다시 활성화되고 있으며, 관련 종사자들은 이러한 컴퓨팅 센터가 현재 수익을 창출하고 있다고 말했다. DeepSeek 자체도 이전 저장성에서 건설한 데이터센터 덕분에 혜택을 받고 있다. DeepSeek에 근접한 한 투자자의 말에 따르면, 설 전 폭발적인 인기를 얻은 후 저장성은 많은 유휴 데이터센터를 저렴한 가격으로 DeepSeek에 제공했다.
한 클라우드 서비스 업체의 체감에 따르면 DeepSeek R1 버전을 출시한 후 사용자 등록 수가 매우 눈에 띄게 증가했으며, 하루 이틀 만에 등록 수가 한 단계 급증해 약 10~20배 수준으로 증가했다. 이러한 등록 사용자는 크게 두 부류로 나뉘는데, 하나는 개인 개발자로 자신들의 혁신 아이디어를 검증하려는 것이며, 다른 하나는 기업 개발자로 AI를 비즈니스에 결합해 혁신 애플리케이션을 만들려는 목적이다.
이 분야에서도 업계는 일부 비공감대를 가지고 있다.
"DeepSeek의 등장은 단기적으로 컴퓨팅 파워 논리를 뒤엎을 수 있지만, 장기적으로 보면 AI와 애플리케이션의 번영은 필연적으로 전체 수요 증가를 가져오며, 컴퓨팅 파워는 여전히 가치가 있다. 물론 국산 GPU 입장에서는 다소 부정적이다. 저제조 공정 칩을 사용할 수 있게 되면서 시장에 존재해야 할 기업 수가 줄어들고, 향후 상장 가능한 기업도 한两家만 남을 것이다. 다른 국산 대규모 모델 기업들에게도 부정적이다." 루자칭은 이렇게 판단했다.
또 다른 반도체 투자자는 "이것은 반도체 업계에 절대적인 호재다. 핵심은 낮은 컴퓨팅 파워 칩으로도 훌륭한 훈련 효과를 낼 수 있다는 점이며, 이는 많은 반도체 업체들이 관련 주문을 받을 수 있다는 의미다. 동시에 훈련 비용이 낮을수록 인공지능이 애플리케이션 분야에 침투하는 데 도움이 된다."고 말했다.
스마트카 산업 체인에 집중하는 투자 기관으로서 왕룽진은 DeepSeek가 스마트 운전 구도에 영향을 미칠지, 다른 기업들의 빠른 반복을 유도해 새로운 길을 열어 관련 기업의 가치 평가를 재조정할지에도 주목한다.
DeepSeek가 가져온 변화와 기회에 대해 나는 위의 논의를 훨씬 넘어서는 것이라고 믿는다. 더욱 중요한 것은 DeepSeek의 부상이 단지 기술적 반복을 넘어 국내에서 현재 가장 부족한 것—즉 '자신감'을 이끌어냈다는 점이다. 나는 '사피엔스'에서 '이야기하기'와 '이야기를 믿기'에 관한 관점을 떠올리지 않을 수 없다. 인류 사회는 수천 년간 오래된 서사가 무너지고 새로운 서사가 구축되는 나선형 발전을 반복해 왔다. 낙관적으로 보면, 아마도 DeepSeek는 중국 경제가 각 계층에서 다시 한 번 자신감을 모으는 전환점일지도 모른다.
TechFlow 공식 커뮤니티에 오신 것을 환영합니다
Telegram 구독 그룹:https://t.me/TechFlowDaily
트위터 공식 계정:https://x.com/TechFlowPost
트위터 영어 계정:https://x.com/BlockFlow_News














