
첫 번째 DeepSeek 개발자들이 이미 떠나기 시작했다

이미지 출처: 무계 AI 생성
DeepSeek 서비스의 혼잡한 응답 이면에는 일반 사용자들의 초조한 대기만 있는 것이 아니라, API 인터페이스 응답이 임계값을 돌파하면서 DeepSeek 개발자 커뮤니티에도 지속적인 나비 효과가 발생하고 있다.
1월 30일, 베이징에 기반을 둔 AI 개발자 린센은 DeepSeek를 연동한 후 갑작스럽게 프로그램 백엔드 알림을 받았다. DeepSeek의 급성장으로 기뻐할 새도 없이, 린센의 프로그램은 DeepSeek 호출이 불가능해져 백엔드가 3일간 마비되었다.
처음에는 계정 잔액 부족 때문이라고 생각했지만, 설 연휴가 끝난 2월 3일 복귀 후에야 그는 DeepSeek로부터 API 충전 일시 중단 통보를 받았다. 이때 이미 계정 잔액이 충분했음에도 불구하고 더 이상 DeepSeek를 호출할 수 없었다.
린센이 백엔드 알림을 받은 지 사흘 만인 2월 6일, DeepSeek 공식 채널은 API 충전 일시 중단을 발표했다. 거의 반달이 지났지만, 2월 19일 현재까지도 DeepSeek 오픈 플랫폼의 API 충전 서비스는 정상화되지 않았다.

설명: DeepSeek 개발자 플랫폼 여전히 충전 미복구 / 출처: 알파벳방 스크린샷
백엔드 마비가 DeepSeek 서버 과부하로 인해 발생했음을 깨닫고, 개발자로서 며칠 동안 아무런 사전 고지를 받지 못했으며, 어떤 애프터서비스나 유지보수도 제공되지 않자, 린센은 '버려진 느낌'을 받았다.
"마치 집 앞 작은 가게가 있는데 단골손님이었고 카드도 끊었으며 주인과 사이도 좋았는데 하루아침에 그 가게가 미쉐린 레스토랑으로 선정되며 기존 단골들을 내팽개치고 발급된 카드도 인정하지 않는 것과 같다." 라고 린센은 말했다.
2023년 7월부터 DeepSeek를 도입한 최초 개발자 중 한 명인 린센은 DeepSeek의 급성장을 환영했지만, 지금은 서비스 유지를 위해 ChatGPT로 전환할 수밖에 없다. "ChatGPT는 좀 비싸지만 적어도 안정적이다."
DeepSeek가 입소문 난 작은 가게에서 인생샷 명소 미쉐린 레스토랑이 되면서, 린센처럼 호출이 막힌 더 많은 개발자들이 하나둘씩 DeepSeek를 떠나고 있다.
2024년 6월, 샤오창 AI 질문응답기는 제품 초기 단계부터 DeepSeek V2를 연동했다. 샤오창의 공동 창업자 루츠가 특히 인상 깊어했던 것은 당시 DeepSeek가 유일하게 《악양루기》 전문을 오류 없이 암송할 수 있는 대규모 언어 모델이라는 점이었다. 따라서 팀은 핵심 기능 중 하나를 DeepSeek에 의존하게 되었다.
하지만 개발자들 입장에서는 DeepSeek는 우수하나 안정성은 여전히 부족하다.
루츠는 알파벳방(ID: wujicaijing) 에게 설명했다. 설 연휴 기간 C단 사용자의 접근이 혼잡할 뿐 아니라 개발자들도 자주 DeepSeek 호출에 실패했고, 팀은 여러 DeepSeek를 연동한 대규모 언어 모델 플랫폼을 동시에 호출하기로 결정했다.
어쨌든 "현재 수십 개의 플랫폼에서 완전체 DeepSeek R1을 제공하고 있다." 이러한 R1 모델에 Agent와 Prompt를 활용하면 사용자 요구를 충족시킬 수 있다.
DeepSeek에서 유출되는 개발자 그룹을 확보하기 위해 일부 주요 클라우드 업체들은 개발자 대상 활동을 자주 개최하고 있다. "참여만 해도 무료로 컴퓨팅 파워를 제공하며, 대량 호출하지 않는 소규모 개발자는 거의 무료로 사용 가능하다." 이라고 이biao AI 기술 책임자 양후차오는 말했다.
그러나 DeepSeek의 인기가 여전한 가운데, 초기 개발자들이 떠나는 와중에도 더 많은 개발자들이 몰려들어 이들의 트래픽 호황을 누리려 하고 있다.
쉬젠이 창업한 프로젝트는 DeepSeek API를 호출해 역할극 AI 동반 앱을 구현하는 것으로, 2월 2일 출시 첫 주에 약 3,000명의 활성 사용자를 확보했다.
사용자들로부터 DeepSeek API 호출 시 오류 보고가 있긴 하지만, 이미 60%의 사용자가 조속한 안드로이드 버전 출시를 원하고 있다. 쉬젠의 소셜미디어 관리 페이지에는 매일 수십 명의 사용자들이 다운로드 링크를 요청하는 메시지를 보내고 있으며, "DeepSeek 기반 AI 동반 플랫폼"은 분명히 앱의 새로운 인기 요소가 되었다.
알파벳방의 집계에 따르면, DeepSeek 공식 웹사이트에 등록된 DeepSeek 연동 앱 목록은 2025년 이전 182개 항목에서 현재 488개로 늘어났다.
한편 DeepSeek는 '국산의 자존심'으로 폭발적인 인기를 끌며 7일 만에 1억 명의 사용자를 유치했고, 다른 한편으로는 처음부터 DeepSeek에 의존해 온 개발자들이 서버 과부하로 인한 서비스 혼잡으로 인해 차례로 다른 대규모 언어 모델로 이동하고 있다.
개발자들에게 장시간 서비스 이상은 단순한 고장이 아니라 코드 세계와 상업 논리 사이의 균열로 변모하고 있으며, 이주 비용을 감수하며 생존 전략을 계산해야 한다. 몰려들거나 떠나거나, 개발자들은 DeepSeek의 인기에 따른 여진을 반드시 직면해야 한다.
일
설 연휴 동안 3일간 백엔드가 강제로 마비된 후, 대보름날 린센은 1년 이상 운영해온 DeepSeek를 떠나 다시 ChatGPT로 돌아갔다.
API 호출 비용이 거의 10배 가까이 증가했지만, 서비스 안정성을 확보하는 것이 우선 순위가 되었다.
주의할 점은 개발자가 DeepSeek를 떠나 다른 대규모 언어 모델로 전환하는 것이 사용자가 앱 내에서 모델을 전환하는 것만큼 쉽지 않다는 것이다. "서로 다른 대규모 언어 모델, 심지어 동일한 언어 모델의 서로 다른 버전이라도 프롬프트에 대한 응답 결과는 미묘한 차이가 있다." 린센은 여전히 ChatGPT를 호출하고 있지만, 모든 핵심 노드를 DeepSeek에서 ChatGPT로 이전하고 안정적이며 고품질의 콘텐츠 피드백을 보장하는 데에도 하루 이상의 시간이 걸렸다.
전환 작업 자체는 두 초 정도면 되지만, "더 많은 개발자들이 새로운 모델로 교체하려면 일주일 동안 반복적으로 프롬프트를 조정하고 테스트를 반복해야 한다." 라고 린센은 알파벳방에 말했다.
린센 같은 소규모 개발자들은 DeepSeek 서버 용량 부족을 이해하지만, 사전에 알림이 있었더라면 시간 비용이나 앱 유지관리 비용 등의 손실을 줄일 수 있었을 것이라고 본다.
어쨌든, "DeepSeek 개발자 백엔드 로그인은 휴대폰 번호 등록만 필요하며, 단 한 통의 문자메시지로 개발자에게 사전 알림이 가능하다. 그런데 지금은 DeepSeek가 묵묵무문일 때부터 지지해온 개발자들이 스스로 손실을 감당해야 한다."
개발자와 특정 대규모 언어 모델 플랫폼이 깊이 결합되어 있을 때, 안정성은 말하지 않아도 당연한 약속이 된다. 서비스 인터페이스의 빈번한 변동은 개발자의 플랫폼 충성도를 재평가하게 만든다.
지난해 린센이 Mistral 대규모 언어 모델(프랑스 대형 모델 회사)을 호출할 때, Mistral의 청구 시스템 오류로 인해 중복 결제가 발생했고, 그가 이메일을 보낸 지 1시간 이내로 문제를 해결하고 100유로 상당의 쿠폰을 보상으로 제공했다. 이러한 대응은 린센에게 더 큰 신뢰를 안겨주었고, 그는 일부 서비스를 다시 Mistral로 이전했다.
이biao AI 기술 책임자 양후차오는 DeepSeek V3 버전 출시 이후 탈출을 준비하기 시작했다.
DeepSeek로 시를 짓거나 불평하는 것이 아니라, DeepSeek로 입찰서를 작성한다면 어떨까? 회사 내 AI 입찰서 프로젝트를 담당하는 양후차오는 DeepSeek가 V3 버전을 출시한 후 대체 방안을 모색하고 있다. 그에게 있어 입찰서와 같은 전문 분야에서 "DeepSeek의 안정성이 점점 더 부족하다."
DeepSeek R1 버전의 인기를 끌었던 추론 능력은 양후차오를 끌어들이지 못한다. 어쨌든, "개발자로서 소프트웨어의 주요 추론 능력은 프로그램과 알고리즘에 의해 이루어지며, 모델의 기본 능력에 크게 의존하지 않는다. 밑바닥이 가장 오래된 GPT 3.5라도 알고리즘으로 수정하면 좋은 결과를 낼 수 있으며, 모델은 응답이 안정적이기만 하면 된다."
실제 호출 과정에서 양후차오 눈에 DeepSeek는 영리하지만 게으른 '우등생'처럼 보인다.
V3 버전으로 업그레이드한 후, 양후차오는 DeepSeek가 일부 복잡한 문제에 대해 더 높은 답변 성공률을 보였지만, 안정성은 수용 불가능한 수준까지 치솟았다고 발견했다. "지금 10개 질문을 하면 최소한 하나는 출력이 불안정하며, 요구된 내용 외에도 DeepSeek는 종종 자유롭게 발휘하여 문제와 관련 없는 추가 내용을 생성한다."
예를 들어 입찰서에는 오류 문자가 허용되지 않으며, 대규모 언어 모델의 반환 결과는 개발자들이 일반적으로 Json 구조(명령어를 통해 매번 호출 시 고정 필드를 안정적으로 반환하도록 지정)를 사용해 출력하여 후속 함수 호출에 용이하게 한다. 그러나 오류나 부정확성이 발생하면 후속 호출이 실패하게 된다.
"DeepSeek R1은 아마도 이전 V3 버전보다 추론 능력이 많이 향상되었지만, 상업화 수준의 안정성은 아직 달성하지 못했다." @생산력Mark 계정에서 양후차오는 언급했다.

설명: DeepSeek V3 생성 과정에서의 글자 깨짐 / 출처: @생산력Mark 계정
2024년 초 DeepSeek-coder 시절부터 참여한 초기 사용자인 양후차오는 DeepSeek가 우등생임을 부정하지 않지만, 지금은 입찰서 생성의 질과 안정성을 보장하기 위해 국내 다른 B2B 중심의 대규모 언어 모델 기업으로 눈을 돌릴 수밖에 없다.
어쨌든 AI 업계의 핀둬둬(Pinduoduo)로 알려졌던 DeepSeek는 가성비라는 태그로 중소 AI 개발자들을 빠르게 끌어모았다. 그러나 이제 DeepSeek를 직접 안정적으로 호출하려면 로컬 배포가 필요하다. "DeepSeek R1 하나를 배포하려면 30만~40만 위안의 비용이 들며, 온라인 API로 계산하면 30만 위안은 평생 써도 다 못 쓴다."
저렴하지도 않고 안정적이지도 않은 상황에서 호출이 막힌 양후차오 같은 개발자들이 대거 DeepSeek를 떠나고 있다.
이
과거 린센들은 DeepSeek를 가장 먼저 선택한 사람들이다.
2024년 6월, 린센은 자신의 AI 소형 앱 '소년청세계'를 개발하면서 당시 국내외 수십 개의 대규모 언어 모델 플랫폼을 비교했다. 그는 매일 수천 건의 뉴스를 처리하고, 이를 선별·정렬하여 청소년이 듣기에 적합한 과학기술 및 자연 뉴스를 찾아내며, 뉴스 문장을 가공해야 했다.
이는 단순히 대규모 언어 모델이 영리해야 하는 것을 넘어 저렴함도 요구된다.
매일 수천 건의 뉴스 처리는 토큰 소비가 매우 크며, 독립 개발자인 린센에게는 ChatGPT 모델이 너무 비싸서 핵심 단계에서만 사용할 수 있고, 대량 텍스트의 신속한 선별과 분석은 더 저렴한 다른 대규모 언어 모델의 지원이 필요하다.
또한 해외의 Mistral, Gemini, ChatGPT 등을 호출하는 것도 매우 번거롭다. 해외에 실제 서버를 두어야 하며, 리레이 스테이션도 필요하고, 해외 신용카드로 토큰을 구매해야 한다.
린센은 영국 친구의 신용카드를 통해야 겨우 ChatGPT 계정에 충전할 수 있었다. 해외에 서버를 두면 API 응답 속도도 지연되기 때문에 린센은 국내로 눈을 돌려 ChatGPT의 대체재를 찾게 되었다.
DeepSeek는 린센에게 큰 인상을 주었다. "당시 DeepSeek가 가장 유명한 것은 아니었지만, 응답이 가장 안정적이었다." 예를 들어 API 호출을 10초마다 요청한다고 할 때, 다른 국내 대규모 언어 모델은 100회 중 30% 정도는 아무런 응답도 하지 않지만, DeepSeek는 항상 응답을 반환하며 ChatGPT나 BAT의 대규모 언어 모델 플랫폼에 뒤지지 않는 응답 품질을 유지했다.
ChatGPT와 BAT의 대규모 언어 모델 API 호출 가격과 비교하면, DeepSeek는 정말 저렴했다.
린센은 많은 뉴스 읽기 및 초기 분석 작업을 DeepSeek에 맡긴 후 DeepSeek의 호출 비용이 ChatGPT보다 10배 저렴하다는 것을 발견했다. 명령어 최적화 후 매일 DeepSeek 호출 비용은 2~3위안 수준으로 낮아졌다. "ChatGPT와 비교하면 최고는 아닐 수 있으나, DeepSeek의 가격은 극도로 낮으며, 내 프로젝트에는 가성비가 매우 높다."

설명: 린센이 대규모 언어 모델로 뉴스 수집 및 분석(좌), 최종적으로 '소년청세계' 소형 앱에 표시됨(우) / 출처: 린센 제공
가성비는 개발자들이 DeepSeek를 선택한 주요 이유였다. 2023년, 양후차오는 회사의 AI 프로젝트를 처음에 ChatGPT에서 Mistral로 전환했는데, 주로 비용을 통제하기 위해서였다. 이후 2024년 5월 DeepSeek가 V2 버전을 출시하며 API 가격을 백만 토큰당 2위안으로 낮추었고, 이는 다른 대규모 언어 모델 업체에 대한 차원이 다른 타격이었으며, 양후차오가 회사의 AI 입찰서 도구 프로젝트를 DeepSeek로 전환하게 된 계기이기도 하다.
또한 테스트 후 양후차오는 이미 클라우드 서비스로 B2B 시장을 선점한 BAT들이 "플랫폼이 너무 무겁다"고 느꼈다.
이biao AI와 같은 스타트업 회사 입장에서 BAT를 선택하면 클라우드 서비스의 바인딩 소비에 직면하게 된다. 단순히 대규모 언어 모델 서비스를 호출하기만 하는 양후차오에게 DeepSeek의 API 호출은 훨씬 더 간편하다.
이전 비용 측면에서도 DeepSeek가 우세했다.
린센이나 양후차오 모두 초기 앱 개발은 OpenAI 인터페이스 형식을 기반으로 했으며, BAT의 대규모 언어 모델 플랫폼으로 전환하려면 백엔드를 처음부터 다시 개발해야 한다. 그러나 DeepSeek는 OpenAI 유사 인터페이스를 호환하므로 모델 전환은 플랫폼 주소만 변경하면 되며, "1분 만에 무통 전환"이 가능하다.
샤오창 AI 질문응답기는 정식 판매 첫날부터 DeepSeek를 탑재했으며, 5개 핵심 역할 중 중국어 및 작문 지도 역할을 DeepSeek에 맡겼다.
파트너인 루츠도 지난해 6월 DeepSeek에 인상 깊었다. "DeepSeek의 중국어 이해 능력이 뛰어나며, 당시 유일하게 《악양루기》 전문을 오류 없이 암송할 수 있는 대규모 언어 모델이었다." 라고 루츠는 알파벳방에 말했다. 다른 대규모 언어 모델의 평범하고 형식적인 문서형 출력과 달리, DeepSeek로 아이들에게 작문을 가르치는 것은 종종 글쓰기 상상력을 통해 승리한다.
SNS에서 DeepSeek로 시나 공상과학 소설을 쓰는 것이 유행하기 전, DeepSeek의 화려한 문체는 이미 샤오창 AI 팀을 매료시켰다.
개발자들에게 DeepSeek의 호출 복구는 여전히 기대되는 일이며, 현재 BAT 플랫폼에 배포된 완전체 DeepSeek R1으로 이전하거나 다른 대규모 언어 모델 업체로 전환하는 것은 모두 '완완류칭(菀菀类卿)'에 불과하다.
삼
그러나 경쟁자들은 DeepSeek의 인기 요소인 심층 추론 능력을 따라잡기 위해 노력하고 있다.
국내에서는 최근 바이두, 텐센트가 자체 개발한 대규모 언어 모델에 심층 사고 능력을 잇따라 도입했으며, 해외에서는 OpenAI도 2월에 급히 '딥 리서치(Deep Research)'를 출시해 추론 대규모 언어 모델의 사고 능력을 인터넷 검색에 활용하고 Pro, Plus, Team 사용자에게 개방했다. 구글 AI 연구소(Google DeepMind)도 2월에 Gemini 2.0 모델 시리즈를 발표했으며, 이 중 2.0 Flash Thinking 실험판은 추론 능력을 강화한 모델이다.
주목할 점은 DeepSeek가 여전히 텍스트 읽기에 중심을 두고 있지만, ChatGPT나 Gemini 2.0은 심층 사고를 지원하는 동시에 추론 능력을 다중 모달로 확장하여 비디오, 음성, 문서, 이미지 등 다양한 입력 모달을 지원한다는 점이다.
DeepSeek에게 있어 다중 모달 분야에서의 추격 외에도, 경쟁자들의 가격 접근이 더 큰 도전이 되고 있다.
클라우드 플랫폼 배포 측면에서 주요 클라우드 업체들은 모두 DeepSeek를 연동하며 트래픽을 나누고 클라우드 서비스로 고객을 바인딩하고 있다. DeepSeek 대규모 언어 모델 호출은 어느 정도 기업 클라우드 서비스의 '사은품'이 되었다.
바이두 창립자 리옌홍은 최근 대규모 언어 모델 분야에서 "매 12개월마다 추론 비용이 90% 이상 감소할 수 있다"고 언급했다.
추론 비용 감소 추세 하에서 BAT의 API 호출 가격이 지속적으로 하락하는 것은 불가피하며, DeepSeek의 가성비 우위는 대기업의 새로운 가격 전쟁 압력을 받고 있다.
그러나 대규모 언어 모델 API 가격 전쟁은 이제 시작일 뿐이며, 개발자를 대상으로 대규모 언어 모델 업체들은 서비스 경쟁도 벌이고 있다.

린센은 다양한 규모의 대규모 언어 모델 플랫폼을 접해봤지만, 특히 기억에 남는 것은 어떤 대형 기술 기업이 전담 고객 매니저를 배치해 불안정 또는 기술 문제가 발생하면 개발자에게 주도적으로 연락하는 점이다.
오픈소스 대규모 언어 모델 플랫폼으로 개발자들에게 보다 보편적인 AI 지원을 제공하겠다는 목표를 가지고 있음에도 불구하고, DeepSeek는 홈페이지에조차 개발자에게 영수증을 발행하는 창구가 없다.
"API 충전 후 다른 대규모 언어 모델 플랫폼처럼 바로 백엔드에서 영수증을 발행할 수 없고, DeepSeek는 홈페이지 외부로 나가 고객 서비스 기업 위챗을 추가해 영수증을 발행해야 한다." 양후차오는 알파벳방에 말했다. 가격과 서비스 면에서 DeepSeek의 '가성비' 태그는 이제 다소 흔들리고 있다.
어떤 대형 인터넷 기업의 AI 제품 책임자는 일부 리더들이 기존 대규모 언어 모델을 DeepSeek로 교체하면서 Prompt 재조정에 드는 시간을 전혀 고려하지 않는다고 알파벳방에 말했다. 또한 완전체 DeepSeek R1이라 할지라도 Function calling 등의 일반 기능을 지원하지 않는 경우가 많다.
BAT처럼 클라우드 서비스로 B2B 서비스 시나리오를 구축한 기업들과 비교하면, 편의성 측면에서 DeepSeek는 여전히 AI 대형 기업에 한참 뒤처져 있다.
하지만 DeepSeek의 트래픽 효과가 아직 사라지지 않아, 따라가는 사람들이 여전히 많다.
일부 기업들은 DeepSeek 연동을 선언하지만 실제로는 API 호출을 시작해 수백 위안만 충전한 경우도 있다. 어떤 기업은 DeepSeek 모델을 배포했다고 공지하지만 사실은 직원들이 B사이트 강의를 보고 원클릭 설치 패키지를 다운로드한 것에 불과하다. 이 DeepSeek 열풍 속에서 진퇴양난, 혼란스러운 상황이 벌어지고 있다.
결국 물결은 빠질 것이며, 그러나 DeepSeek가 해야 할 숙제는 분명히 더 많아졌다.
TechFlow 공식 커뮤니티에 오신 것을 환영합니다
Telegram 구독 그룹:https://t.me/TechFlowDaily
트위터 공식 계정:https://x.com/TechFlowPost
트위터 영어 계정:https://x.com/BlockFlow_News














