
토큰 해외 진출: 중국의 전력을 전 세계에 판매
저자: 블랙 로브스터, TechFlow
1858년 여름, 구리 코어 해저 케이블 하나가 대서양 바닥을 가로질러 런던과 뉴욕을 연결했다.
이 사건의 의의는 결코 전송 속도에 있지 않았다. 그것은 권력 구조에 있었다. 누가 해저 케이블을 깔았는가가 정보 흐름에서 이익을 얻을 수 있는지를 결정했다. 영국 제국은 이 글로벌 전보망을 통해 식민지의 정찰 정보, 면화 가격, 전쟁 소식 등 모든 정보를 손아귀에 넣었다.
제국의 강대함은 함대만으로 이루어진 것이 아니라, 바로 그 케이블에도 있었다.
160여 년이 지난 지금, 이 논리는 예상치 못한 방식으로 재연되고 있다.
2026년, 중국의 대규모 언어 모델(Large Language Model, LLM)이 조용히 전 세계 개발자 시장을 잠식해 나가고 있다. OpenRouter의 최신 데이터에 따르면, 플랫폼 상위 10개 모델의 토큰(Token) 소비량 중 중국 모델이 61%를 차지했으며, 상위 3위 모두 중국산 모델이다. 샌프란시스코, 베를린, 싱가포르의 개발자들이 매일 보내는 API 요청은 태평양 해저 광케이블을 거쳐 중국의 데이터센터에 도달한다. 계산 능력은 그곳에서 소비되며, 전력은 그곳에서 흐르고, 결과는 다시 전송된다.
전력은 중국 전력망을 한 번도 떠나지 않지만, 그 가치는 토큰을 통해 국경을 넘어 전달된다.
AI 모델의 대이주
2026년 2월 24일, OpenRouter는 주간 데이터 보고서를 발표했다. 해당 보고서에 따르면, 플랫폼 상위 10개 모델의 총 토큰 소비량은 약 8.7조 토큰이며, 중국 모델이 그중 5.3조 토큰(61%)을 차지했다. MiniMax M2.5는 2.45조 토큰으로 단숨에 1위에 올랐고, Kimi K2.5와 지푸(GLM-5)가 뒤를 이었다. 상위 3위 모두 중국산 모델이다.

2월 26일 최신 데이터
이것은 우연이 아니다. 어떤 도화선이 모든 것을 촉발시켰다.
올초, AI가 진정으로 ‘일’을 하기 시작하게 만든 오픈소스 도구 OpenClaw가 등장했다. 이 도구는 컴퓨터를 직접 제어하고 명령을 실행하며 복잡한 워크플로우를 병렬로 수행할 수 있으며, GitHub 스타 수는 일주일 만에 21만 개를 돌파했다.
금융업 종사자인 존(John)은 곧바로 OpenClaw를 설치하고 Anthropic API를 연동해 주식시장 정보를 자동 감시하고 실시간 거래 신호를 제공하는 시스템을 구축했다. 몇 시간 후, 그는 계좌 잔고를 보고 멍하니 몇 초 동안 멈칫했다: 수십 달러가 사라진 것이다.
이것이 바로 OpenClaw가 가져온 새로운 현실이다. 과거에는 AI와 대화하는 데 한 번의 대화에 수천 토큰이 소비되었고, 비용은 무시할 수 있을 정도였다. 그러나 OpenClaw를 연동한 후, AI는 백그라운드에서 동시에 수십 개의 하위 작업을 수행하며, 맥락을 반복적으로 호출하고 순환적으로 반복하여 토큰 소비량은 선형이 아니라 지수급으로 증가한다. 청구서는 엔진 커버를 열고 달리는 자동차처럼 가속화되며, 연료 게이지가 빠르게 떨어지고 멈출 수 없다.
개발자 커뮤니티에서는 즉각 ‘현명한 해결책’이 퍼졌다: OAuth 토큰을 사용해 Anthropic 또는 Google의 구독 계정을 OpenClaw에 직접 연결함으로써 월정액제의 ‘무제한’ 할당량을 AI 에이전트의 무료 연료로 전환하는 것이다. 많은 개발자들이 실제로 이 방법을 채택했다.
공식적인 대응도 즉각 뒤따랐다.
Anthropic은 2월 19일 약관을 업데이트해 Claude 구독 자격 증명을 OpenClaw 등 제3자 도구에 사용하는 것을 명확히 금지했으며, Claude 기능을 이용하려면 반드시 API 과금 채널을 통해야 한다고 규정했다. Google은 더 나아가 OpenClaw를 통해 Antigravity 및 Gemini AI Ultra에 접근하려는 구독 계정을 대규모로 차단했다.
“천하가 진(秦)의 폭정을 오래 견뎌왔다.” 존은 즉시 국산 대규모 언어 모델로 눈을 돌렸다.
OpenRouter에서 국산 대규모 언어 모델인 MiniMax M2.5는 소프트웨어 공학 작업에서 80.2점을 기록했고, Claude Opus 4.6은 80.8점으로, 성능 차이는 거의 무시할 수 있을 정도다. 그러나 가격은 천차만별이다. 전자의 입력 토큰 100만 개당 가격은 0.3달러인데 반해, 후자는 5달러로 약 17배 차이가 난다.
존은 즉시 전환했고, 워크플로우는 여전히 원활하게 작동했으며, 청구서는 한 자릿수 수준으로 줄어들었다. 이러한 이주는 전 세계적으로 동시다발적으로 진행되고 있다.
OpenRouter의 COO 크리스 클라크(Chris Clark)는 매우 직설적으로 말했다. “중국산 오픈소스 모델이 다수의 시장 점유율을 확보한 이유는, 미국 개발자들이 운영하는 에이전트 워크플로우 내에서 중국산 모델의 비중이 비정상적으로 높기 때문이다.”
전력의 해외 진출
토큰의 해외 진출 본질을 이해하려면 먼저 토큰의 원가 구조를 명확히 파악해야 한다.
토큰은 매우 가볍게 보인다. 하나의 토큰은 약 0.75개의 영문 단어에 해당하며, 일반적인 AI 대화 한 차례에 소비되는 토큰 수는 수천 개에 불과하다. 그러나 이 토큰들이 조 단위로 쌓이게 되면, 그 뒤에 숨겨진 물리적 현실은 무겁고 실감나게 된다.
토큰의 원가를 분해하면 핵심 요소는 두 가지뿐이다: 컴퓨팅 파워와 전력.
컴퓨팅 파워는 GPU의 감가상각비이다. 당신이 NVIDIA H100 하나를 약 3만 달러에 구입하면, 이 칩의 수명을 각 추론 작업에 배분한 값이 감가상각 비용이다. 전력은 데이터센터가 지속적으로 가동되기 위한 연료이다. GPU가 최대 부하 상태일 때 한 장당 약 700와트를 소비하며, 냉각 시스템까지 고려하면 대규모 AI 데이터센터의 전력 요금은 연간 수억 달러를 넘을 수 있다.
이제 이 물리적 과정을 지도 위에 그려보자.
미국의 한 개발자가 샌프란시스코에서 API 요청을 보낸다. 데이터는 캘리포니아에서 출발해 태평양 해저 광케이블을 따라 중국의 어느 데이터센터에 도착한다. GPU 클러스터가 작동하기 시작하고, 중국 전력망에서 흐르는 전기가 칩으로 흘러들어 추론이 완료된 후, 결과가 다시 전송된다. 이 전체 과정은 단 1~2초밖에 걸리지 않는다.
전력은 중국 전력망을 한 번도 떠나지 않았지만, 그 전력의 가치는 토큰을 통해 국경을 넘어 전달되었다.
여기에는 일반 무역이 도달할 수 없는 특별한 마법이 있다: 토큰은 형태가 없고, 세관을 통하지 않으며, 관세 적용 대상도 아니며, 심지어 현재의 어느 무역 통계 항목에도 포함되지 않는다. 중국은 막대한 컴퓨팅 파워와 전력 서비스를 수출하고 있지만, 공식 상품 무역 통계에서는 거의 ‘보이지 않는’ 존재다.
토큰은 전력의 파생상품이 되었고, 토큰의 해외 진출은 본질적으로 전력의 해외 진출이다.
이것은 또한 중국의 상대적으로 저렴한 전기 요금 덕분이기도 하다. 중국의 종합 전기 요금은 미국보다 약 40% 낮은데, 이는 물리적 차원에서의 원가 차이로서 경쟁사가 쉽게 모방할 수 있는 부분이다.
또한 중국의 AI 대규모 언어 모델은 알고리즘 및 ‘내부 경쟁(內卷)’ 측면에서도 우위를 점하고 있다.
DeepSeek V3의 MoE(Mixture of Experts) 아키텍처는 추론 시 일부 파라미터만 활성화시키므로, 독립 테스트 결과에 따르면 GPT-4o 대비 추론 비용이 약 36배 낮다. MiniMax M2.5 역시 총 229B 파라미터 중 10B만을 활성화한다.
가장 상위 층은 바로 ‘내부 경쟁’이다. 알리바바, 바이트댄스, 바이두, 텐센트, 문더마운틴(Moonshot), 지푸, 미니맥스(MiniMax) 등 수십 개 기업이 동일한 시장에서 서로를 압박하며, 가격은 이미 합리적인 이윤 범위를 훨씬 밑돌고 있다. ‘손해 보고 이름만 남기기’가 업계의 일반적인 현상이 된 것이다.
자세히 보면, 이는 중국 제조업의 해외 진출과 유사하다. 중국은 공급망 우위와 산업 내 경쟁을 활용해 토큰 가격을 극단적으로 낮추고 있다.
비트코인에서 토큰까지
토큰 이전에, 전력의 해외 진출이 한 차례 있었던 적이 있다.
약 2015년 무렵, 쓰촨성, 윈난성, 신장위구르자치구의 발전소 운영자들은 이상한 손님들을 맞이하기 시작했다.
이 사람들은 폐기된 공장을 임대해 빽빽이 늘어선 기계들을 설치하고, 24시간 전력을 공급해 계속 작동시켰다. 이 기계들은 아무것도 생산하지 않았고, 다만 끝없이 반복되는 수학 문제를 풀기만 했다. 가끔씩, 이 무한한 수학 문제 속에서 비트코인 한 개가 생성되기도 했다.
이것이 전력의 해외 진출 1세대 형태였다: 저렴한 수력과 풍력 전기를 채굴기의 해시 연산을 통해 전 세계적으로 유통되는 디지털 자산으로 전환한 후, 거래소에서 달러로 환전하는 것이다.
전력은 국경을 한 번도 넘어가지 않았지만, 그 전력의 가치는 비트코인을 매개체로 전 세계 시장으로 흘러갔다.
그 당시 중국의 채굴 파워는 전 세계 비트코인 채굴 파워의 70% 이상을 차지했다. 중국의 수력과 석탄 발전은 이런 우회적 방식을 통해 전 세계 자본 재분배에 참여했다.
2021년, 이 모든 것은 갑작스럽게 종말을 맞이했다. 규제 당국의 강력한 조치가 내려졌고, 채굴업자들은 흩어졌으며, 채굴 파워는 카자흐스탄, 미국 텍사스주, 캐나다로 이주했다.
하지만 이 논리 자체는 사라지지 않았고, 다만 새로운 외피를 기다리고 있었을 뿐이다. 그러다 ChatGPT의 등장과 대규모 언어 모델 간의 치열한 경쟁 속에서, 과거의 비트코인 채굴장은 AI 데이터센터로 탈바꿈했고, 채굴기는 컴퓨팅 파워를 제공하는 GPU로 바뀌었으며, 과거에 생산되던 비트코인은 토큰으로 바뀌었다. 변하지 않은 것이라면, 여전히 ‘전력’뿐이었다.
비트코인의 해외 진출과 토큰의 해외 진출은 근본적인 논리에서 동형(isomorphic)이며, 다만 토큰은 현재 시점에서 더 큰 상업적 가치를 지닌다.
채굴기는 순수한 수학적 계산을 수행하고, 산출물인 비트코인은 금융 자산이며, 그 가치는 희소성과 시장의 공감대에 기반하며, ‘어떤 계산을 했는가’와는 전혀 무관하다. 따라서 컴퓨팅 파워 자체는 생산성이 없으며, 오히려 신뢰 메커니즘의 부산물에 가깝다.
그러나 대규모 언어 모델의 추론은 다르다. GPU는 전력을 소비하고, 실제 인지 서비스—코드, 분석, 번역, 창의적 아이디어—를 산출한다. 토큰의 가치는 사용자에게 제공하는 실용성에서 직접 유래한다. 이것은 더 깊은 수준의 통합이며, 개발자의 워크플로우가 특정 모델에 의존하게 되면, 시간이 지남에 따라 모델을 교체하는 비용은 점점 더 커진다.
물론 또 다른 핵심 차이점도 있다: 비트코인 채굴은 중국 정부에 의해 국내에서 추방된 반면, 토큰의 해외 진출은 전 세계 개발자들이 자발적으로 선택한 것이다.
토큰 전쟁
1858년에 설치된 해저 케이블은 영국 제국이 정보 고속도로에 대한 주권을 행사한다는 것을 의미했다. 누가 인프라를 소유하느냐에 따라 게임의 규칙이 정해졌다.
토큰의 해외 진출 역시 선언되지 않은 전쟁이며, 여기에는 많은 장애물이 존재한다.
첫 번째 장벽은 데이터 주권이다. 미국 개발자의 API 요청이 중국 데이터센터를 통해 처리되면, 데이터는 물리적으로 중국을 거친다. 개인 개발자나 소규모 애플리케이션의 경우 이는 문제가 되지 않으나, 기업의 민감한 데이터, 금융 정보, 정부 준수 요건이 관련된 상황에서는 치명적인 약점이 된다. 이것이 중국산 모델의 침투율이 개발 도구 및 개인용 애플리케이션 분야에서 가장 높고, 기업의 핵심 시스템에서는 거의 존재하지 않는 이유이다.
두 번째 장벽은 반도체 수출 금지 조치이다. 중국의 AI 발전은 NVIDIA 고성능 GPU의 수출 규제를 받고 있으며, MoE 아키텍처와 알고리즘 최적화는 이 불리한 상황을 부분적으로만 상쇄할 수 있고, 여전히 한계가 존재한다.
하지만 현재의 장애물은 단지 서막일 뿐이며, 더 큰 전장이 형성되고 있다.
토큰과 AI 모델은 이제 미국과 중국 간 새로운 전략적 경쟁 차원이 되었으며, 20세기의 반도체·인터넷 경쟁에 필적하거나, 더 오래된 비유로 표현하자면 우주 경쟁에 더 가깝다.
1957년, 소련은 스푸트니크 1호를 발사했고, 미국은 전국이 충격에 빠져 아폴로 계획을 즉각 시작했다. 이 계획에는 오늘날 가치로 수천억 달러에 달하는 자원이 투입되어 우주 경쟁에서 절대 패배하지 않겠다는 결의를 보였다.
AI 경쟁의 논리도 이와 놀랍도록 유사하지만, 그 격렬함은 우주 경쟁을 훨씬 뛰어넘을 것이다. 우주는 물리적 공간이지만 일반인은 그 영향을 느끼기 어렵다. 반면 AI는 경제의 모세혈관에 스며들어, 한 줄의 코드, 한 건의 계약, 정부의 의사결정 시스템 뒤에도 어느 나라의 대규모 언어 모델이 작동하고 있을 수 있다. 누가 전 세계 개발자의 인프라 기본 옵션으로 자리 잡느냐에 따라, 무형의 글로벌 디지털 경제에 대한 구조적 영향력을 획득하게 된다.
이것이 바로 중국의 토큰 해외 진출이 워싱턴을 진정으로 불안하게 만드는 이유이다.
개발자의 코드베이스, 에이전트 워크플로우, 제품 로직이 특정 중국산 모델의 API를 중심으로 구축되면, 이탈 비용은 시간이 지남에 따라 지수적으로 증가한다. 그런 시점이 오면, 미국이 법으로 제재를 가한다고 해도 개발자들은 발로 거부할 것이다. 오늘날 어떤 프로그래머도 GitHub를 버릴 수 없는 것과 같은 이치이다.
오늘날의 토큰 해외 진출은 이 긴 경쟁의 서막에 불과할지도 모른다. 중국의 대규모 언어 모델은 무엇을 뒤엎겠다고 선언하지는 않는다. 다만 더 낮은 가격으로, 전 세계 API 키를 가진 개발자에게 서비스를 제공할 뿐이다.
이번에는 해저 케이블을 까는 주체가 항저우, 베이징, 상하이에서 코드를 작성하는 엔지니어 팀과, 중국 남부 어느 성에서 24시간 가동되는 GPU 클러스터이다.
이 경쟁에는 카운트다운이 없다. 하루 24시간, 토큰을 단위로, 그리고 모든 개발자의 단말기에서 매 순간 치러지고 있다.
TechFlow 공식 커뮤니티에 오신 것을 환영합니다
Telegram 구독 그룹:https://t.me/TechFlowDaily
트위터 공식 계정:https://x.com/TechFlowPost
트위터 영어 계정:https://x.com/BlockFlow_News












