
딥시크, 왜 서방 AI 종사자들을 모두 위기감을 느끼게 할까?
작자: Carl Franzen
편역: TechFlow
며칠 전까지만 해도, DeepSeek라는 중국 AI 기업에 대해 들어본 사람은 가장 전문적인 기술 애호가들(저 역시 그 중 한 명이지만) 외에는 거의 없었다. 이 회사는 2015년에 설립된 양적 분석 회사인 독특한 이름의 High-Flyer Capital Management 산하에 있다. 그러나 지난 며칠 사이, 이 회사는 실리콘밸리에서 가장 주목받는 기업이 되었을 가능성이 크다.
이는 주로 새로운 대규모 언어 모델(LLM)인 DeepSeek-R1의 출시 덕분이다. 이 모델은 OpenAI의 최신 최고 모델 o1과 유사한 방식으로 "추론"을 수행할 수 있는데, 어려운 질문에 답하거나 복잡한 문제를 해결할 때 수초 또는 수분이 걸리며, 단계별 혹은 '사고의 연쇄(chain of thought)' 방식으로 스스로의 분석을 성찰한다.
게다가 DeepSeek-R1은 다양한 제3자 벤치마크 테스트(다양한 주제에서 AI가 질문에 얼마나 잘 답변하는지를 측정하는 평가)에서 OpenAI의 o1과 동등하거나 더 높은 점수를 받았으며, 약 500만 달러의 훈련 비용과 미국(OpenAI 본사 소재지)이 엄격히 금수 조치한 수준보다 훨씬 적은 수의 그래픽 프로세서(GPU)만 사용했다는 보고가 있다.
그러나 o1과 달리, o1은 유료 ChatGPT Plus 구독자(월 20달러) 및 월 200달러의 Pro 등급 이상의 고급 구독자에게만 공개되는 반면, DeepSeek-R1은 완전히 오픈소스로 공개되었다. 이 때문에 Hugging Face의 AI 코드 공유 커뮤니티에서 가장 인기 있고 활발한 모델 순위 상단으로 급부상했으며, 그 이유를 설명해 준다.
또한 완전히 오픈소스이기 때문에, 사람들은 이 모델을 다양한 특정 작업에 맞춰 미세조정하고 재학습하여 모바일 기기에서도 실행 가능한 정도로 작게 만들거나 다른 오픈소스 모델과 결합해 사용하기도 한다. 개발 목적이라 하더라도 DeepSeek의 API 비용은 OpenAI의 동급 o1 모델보다 90% 이상 저렴하다.
더욱 인상적인 것은, 소프트웨어 엔지니어가 아니어도 누구나 사용할 수 있다는 점이다. DeepSeek는 미국 사용자를 위해 무료 웹사이트와 모바일 앱을 제공하며, R1 기반 챗봇 인터페이스는 OpenAI의 ChatGPT와 매우 유사하다. 하지만 DeepSeek는 다시 한번 OpenAI를 앞서 나간다. 바로 이 강력한 추론 모델을 웹 검색과 연결한 것이다—현재 OpenAI는 아직 이를 구현하지 못했으며(웹 검색은 현재 기능이 약한 GPT 시리즈 모델에서만 이용 가능하다).
뚜렷한 아이러니
OpenAI가 처음에 AI를 대중에게 민주화하겠다는 목표를 세웠다는 점을 고려하면, 여기엔 다소 흥미롭거나 불안하게 느껴지는 아이러니가 존재한다. Nvidia의 선임 연구 매니저 짐 팬(Jim Fan)이 X(전 트위터)에서 말한 것처럼: "우리는 비미국 기업이 OpenAI의 원래 사명—진정으로 열린 첨단 연구를 통해 모든 사람에게 역량을 부여한다는—을 계승하고 있는 시대에 살고 있다. 이건 말이 안 된다. 하지만 가장 흥미로운 결과가 결국 가장 현실적인 경우가 되곤 한다."
X 사용자 @SuspendedRobot는 (DeepSeek가 ChatGPT가 생성한 Q&A 출력물과 기타 데이터를 기반으로 학습했다는 보도를 인용하며) 이렇게 말했다. "OpenAI는 전체 인터넷에서 데이터를 훔쳐 자신을 더욱 부유하게 만들지만, DeepSeek는 그들로부터 훔친 다음 그것을 무료로 대중에게 돌려준다. 영국 민담 하나가 떠오른다."
메타(Meta), 오픈소스 Llama 실패로 위기에 처하다?
하지만 팬만 DeepSeek의 성공을 눈여겨본 것은 아니다. 다양한 엔지니어, 사상가, 리더들과의 대화와 읽은 내용을 종합하면, DeepSeek-R1의 오픈소스 공개 가능성, 뛰어난 성능, 그리고 기존 생성형 AI 리더들을 급작스럽게 도전한 사실은 실리콘밸리 전역은 물론 그 밖의 지역에도 충격을 주고 있다. 제가 과장된 제목처럼 "모두"가 열광하고 있지는 않더라도, 적어도 기술 및 비즈니스 커뮤니티 내에서는 핫한 화제거리다.
실리콘밸리의 익명 소문 공유 앱인 블라인드(Blind)에 올라온 메시지 하나가 널리 퍼지고 있는데, 메타(Meta)가 DeepSeek의 성공으로 인해 위기에 빠졌다는 것을 암시한다. DeepSeek가 메타가 자체 Llama 모델을 통해 오픈소스 AI의 왕이 되려는 노력을 너무 빠르게 초월했기 때문이다.

"이것은 게임의 룰을 완전히 바꿨다"
X 사용자 @tphuang은 설득력 있는 관점을 제시했다. "DeepSeek는 최정상 계층을 제외한 모든 곳에서 AI를 상품화해 버렸다. 첫 번째 이미지가 내게 확 깨닫게 해줬다. R1은 미국의 인건비보다 훨씬 저렴하다. 즉, 앞으로 5년 이내에 많은 일자리가 자동화로 대체될 것이라는 의미다." 이후 그는 DeepSeek의 R1이 왜 OpenAI의 o1보다 사용자에게 더 매력적인지 설명했다.
"o1은 거대한 세 가지 문제점이 있다:
1) 너무 느리다
2) 너무 비싸다
3) 최종 사용자가 통제권을 갖지 못하며 OpenAI에 지나치게 의존한다.
R1은 이러한 모든 문제를 해결한다. 기업들은 자체적으로 Nvidia GPU를 구입해 모델을 실행할 수 있으며, 추가 비용이나 OpenAI 서버의 느린 응답/응답 불가 문제를 걱정할 필요가 없다."
@tphaung은 또 이런 철학적인 질문을 던졌다. "DeepSeek가 LLM 분야의 안드로이드(Android)가 될 수 있을까?"
네트워크 기업가 아르노 베르트랑(Arnaud Bertrand)은 X를 통해 DeepSeek 성공의 충격적인 영향을 직설적으로 말했다. "이것이 게임의 룰을 바꾼 정도는 아무리 강조해도 지나치지 않다. 이것은 단순히 AI의 문제가 아니라, 미국이 중국 기술 발전을 막으려는 잘못된 시도에 대한 거대한 아이러니다. 이런 제한이 없었다면 DeepSeek는 존재하지 않았을지도 모른다(속담처럼 '필요는 발명의 어머니'다)."
검열 문제
그러나 일부는 DeepSeek의 급속한 부상에 경고 신호를 보내며, 중국에서 운영되는 스타트업이기 때문에 해당 국가의 법률 및 콘텐츠 검열 요건을 반드시 따를 수밖에 없다고 지적한다. 실제로 필자가 미국에서 iOS용 DeepSeek를 직접 사용해 본 결과, 특정 질문에는 답변하지 않는 것을 발견했다.
언론매체 일원으로서 나는 표현의 자유와 언론의 자유를 매우 소중히 여기며, 이것이 내가 확고히 지지하는 근본적인 가치 중 하나임을 밝힌다.
하지만 동시에 OpenAI의 모델과 제품들(예: ChatGPT 포함) 역시 인간의 성행위 및 성인/NSFW 콘텐츠 관련 질문—비록 일반적인 질문이라 할지라도—에 대해 답변을 거부한다는 점을 인정하지 않을 수 없다.
물론 이것은 완전히 동등한 비교는 아니다. 어떤 사람들에게는 외국 기술에 의존하는 것에 대한 거부감이 DeepSeek의 궁극적 가치와 실용성에 회의를 품게 만들 수 있다. 하지만 그 성능과 낮은 비용은 부정할 수 없는 사실이다.
미국에서 수입되는 상품의 16.5%가 중국산인 지금, 모델 코드를 무료로 다운로드하고, 오프라인에서 사용하며, 보안된 환경의 장치에서 실행하고, 마음대로 미세조정할 수 있는 상황에서 단지 검열 우려나 보안 리스크만을 이유로 DeepSeek-R1 사용을 경계하긴 어렵다.
나는 DeepSeek를 둘러싼 열띤 논의 속에 '서구의 몰락'과 '중국의 부상'에 대한 실존적 위기 정서가 감돌고 있음을 분명히 느낀다. 누군가는 미국 사용자들이 TikTok이 잠정적으로 금지되었을 때 샤오홍슈(Xiaohongshu) 앱에 가입했던 일을 언급하며, 당시 그들이 거기서 공유된 영상 속에서 보여지는 중국의 생활 수준에 놀랐던 경험을 떠올렸다. DeepSeek-R1의 등장은 바로 이런 내러티브 속에서 이루어졌으며, 이 맥락 속에서 중국은(많은 지표에서 실제로 그렇듯이) 부상하고 있고, 미국은(많은 지표에서 실제로 그렇듯이) 쇠퇴하고 있어 보인다.
첫 번째 충격이자 마지막이 아닌 세계적 중국 AI 모델
이것은 실리콘밸리 거물들의 주도권을 위협하는 마지막 중국 AI 모델이 되지 않을 것이다—OpenAI처럼 일반 인공지능(AGI, 대부분의 경제적 가치가 있는 작업에서 인간을 능가하는 프로그램) 개발을 위해 지금까지보다 더 많은 자금을 조달하고 있는 거대 기업들조차도 마찬가지다.
어제만 해도, 틱톡 모회사 바이트댄스(ByteDance)에서 나온 또 다른 중국 모델 Doubao-1.5-pro가 발표되었는데, 이 모델은 제3자 벤치마크에서 OpenAI의 비추론형 GPT-4o 모델과 유사한 성능을 보였지만 비용은 후자의 1/50에 불과하다.
중국 모델들의 발전 속도와 품질이 너무 빠르고 뛰어나서 기술 업계 외부 사람들조차 주목하고 있다. <이코노미스트>지가 최근 DeepSeek의 성공과 다른 중국의 AI 노력에 대해 기사를 게재했으며, 정치 분석가 매트 브루나이그(Matt Bruenig)는 X에서 다음과 같이 글을 올렸다. "나는 NLRB 문서 요약을 위해 거의 1년 동안 Gemini, ChatGPT, Claude를 사용해왔다. Deepseek가 이 분야에서 그들 모두보다 낫다. 챗봇 버전은 무료다. API 사용 비용은 OpenAI API보다 99.5% 저렴하다.[어깨 으쓱]
OpenAI는 어떻게 대응할 것인가?
결국 OpenAI 공동창업자이자 CEO인 샘 알트먼(Sam Altman)이 오늘, 아직 출시되지 않은 차세대 추론 모델 시리즈 o3를 ChatGPT에 도입하겠다고 밝힌 것도 무리는 아니다. 무료 사용자도 이용할 수 있게 될 예정이다. OpenAI는 여전히 더 전용적이고 진보된 모델을 통해 산업 표준을 설정하면서 자신의 길을 개척하려 하고 있다.
하지만 문제는 DeepSeek, 바이트댄스 및 기타 중국 AI 기업들이 뒤따르고 있는 상황에서 OpenAI가 새로운 첨단 AI 모델을 만들어내고 출시하는 데 얼마나 오랫동안 선두를 유지할 수 있을지이며, 만약 실제로 따라잡히게 된다면 그 쇠퇴가 얼마나 빠르고 심각할 것인지다.
다만 OpenAI에게는 또 다른 역사적 선례가 있다. DeepSeek와 중국 AI 모델들이 모바일 분야에서 구글의 오픈소스 안드로이드처럼—일정 기간 동안 시장 대부분을 차지했다—될 수 있다면, 애플의 아이폰(iPhone)이 폐쇄적이고 전용적이며 내부 중심적인 접근 방식으로 시장의 고급 부문을 장악한 후, 특히 미국에서 점차 하향 확장하여 현재 국내 스마트폰 시장 점유율 거의 60%를 차지하게 된 사례를 보면 된다.
그럼에도 불구하고, 선도적인 연구소의 AI 모델을 비싼 값에 사용하고 있는 모든 기업들에게 DeepSeek는 동일한 기능을 더 낮은 가격에, 더 큰 통제권과 함께 얻을 수 있음을 보여주고 있다. 기업 환경에서는 이것이 승리를 좌우할 수도 있다.
TechFlow 공식 커뮤니티에 오신 것을 환영합니다
Telegram 구독 그룹:https://t.me/TechFlowDaily
트위터 공식 계정:https://x.com/TechFlowPost
트위터 영어 계정:https://x.com/BlockFlow_News














