
토큰 공장 경제학이 전체 AI 산업을 재구성하고 있다
저자: 하이산
2024년 토큰의 ‘배추값’ 가격 경쟁에서 시작해 2026년 알리클라우드, 텐센트클라우드, 바이두 인텔리전트 클라우드가 동시에 가격 인상에 나선 지 두 해 만에,
토큰 산업은 단기간 내에 ‘돈을 태우는 내부 경쟁과 과잉 생산’에서 ‘공급 부족과 수요 증가로 인한 가격·물량 동시 상승’이라는 극적인 전환을 이뤄냈다.
2026년 이후 A주 AI 컴퓨팅 파워 관련 종목군은 누적 상승률 55%를 기록했으며, 월지암면(Moonshot), 치푸 AI(Zhipu AI) 등 주요 대규모 언어모델(Large Language Model, LLM) 기업들의 단일 월 매출은 10억 위안을 돌파했고, 일부 기업은 20일 만에 2025년 연간 매출을 넘어섰다.
황런쉰(Jensen Huang)이 ‘토큰 공장 경제학(Token Factory Economics)’이라 명명한 이 산업 혁명은 이제 단순한 기술 열풍을 넘어서, 실질적 수요 폭증, 공급-수요 구조 불균형, 글로벌 에너지 및 컴퓨팅 파워 경쟁이 복합적으로 작동하는 확실한 추세가 되었다. 이에 따른 근본적 논리 재구성이 AI 산업 전체의 게임 룰을 재정립하고 있으며, 나아가 세계의 근간 운영 체계까지도 뒤흔들고 있다.
01 새로운 시대의 ‘석유’
이 산업 전환점의 본질은 AI 산업이 ‘모델 군비 경쟁’에서 완전히 ‘토큰 생산 능력 경쟁’으로 전환된 데 있다.
2024년 이전까지 업계의 핵심 스토리는 ‘누가 더 큰 파라미터 규모의 모델을 보유하고, 누가 더 똑똑한가?’였다. 주요 제조사들은 대규모 모델 훈련에 막대한 자금을 투입하며, 무료 토큰 제공이나 저가 경매 방식으로 시장을 선점하려 했고, 심지어 ‘토큰을 파는 것보다 생수를 파는 게 더 낫다’는 왜곡된 상황까지 벌어졌다.
그러나 2026년 2월, 오픈클로(OpeClaw, 일명 ‘랍스터’) 인텔리전트 에이전트의 급부상은 이러한 논리를 완전히 붕괴시켰다.
기존 대규모 모델은 ‘사람이 AI를 찾는’ 단일 라운드 상호작용 방식으로, 한 번의 대화에 소모되는 토큰 수는 1,000~3,000개에 불과하다. 반면 에이전트(Agent)는 ‘계획-실행-관찰-성찰(Plan-Act-Observation-Reflection)’의 순환 구조를 채택하여 복잡한 하나의 작업 처리를 위해 수십 차례에서 수백 차례에 이르는 모델 호출이 필요하며, 중간 수준의 작업에는 약 10만 개, 고난이도 작업에서는 최대 수백만 개의 토큰이 소모되어 업계에서 ‘토큰 분쇄기(Token Crusher)’라고 불린다.
국가데이터국(NDRC)의 통계 자료는 이 폭발적 성장을 입증한다: 중국의 일일 토큰 호출량은 2024년 초 1,000억 개에서 2026년 3월 140조 개로 급등했으며, 2년 만에 1,000배 이상 증가했다. 특히 2026년 1분기의 토큰 호출량은 2025년 말 대비 40% 증가했다.
이에 따라 업계의 담론은 근본적으로 전환됐다: 더 이상 모델의 ‘지능 상한선’을 겨루지 않고, 누구든 더 낮은 비용으로, 더 안정적으로 방대한 양의 토큰을 생산할 수 있는가, 그리고 지능형 공급의 주도권을 장악할 수 있는가를 경쟁하게 된 것이다.
엄청난 수요 앞에서 공급-수요 불일치라는 강제적 제약은 이번 토큰 시장 강세의 핵심 근거이며, 이 불균형은 단기적인 변동이 아니라 산업 체인의 장기 주기로 결정된 구조적 모순이다.
공급 측에는 돌파하기 어려운 세 가지 병목 현상이 존재한다. 첫째, 핵심 하드웨어 생산 능력이 독점되고, 증설 주기가 매우 길다.
HBM(High Bandwidth Memory) 고대역폭 메모리는 AI 서버의 ‘심장’으로, 삼성전자, SK하이닉스, 마이크론이 전 세계 95% 이상의 생산 능력을 점유하고 있다. 이들의 증설 주기는 24~36개월에 달해 2026년 HBM 수급 격차가 40%를 넘을 것으로 예상된다.
이에 따라 일반 DDR5 메모리 가격은 6개월 만에 300% 급등했고, 256GB 서버 메모리 단가가 4만 위안을 넘었으며, AI 서버 납기 주기는 3개월에서 12개월로 연장됐다.
둘째, 전력 및 에너지가 가장 큰 잠재적 병목 요인으로 부상했다. 지능형 컴퓨팅 센터(Intelligent Computing Center)의 랙(Rack) 전력 소비는 기존 데이터센터의 10~20배에 달하며, 전력 비용은 토큰 생산 비용의 60% 이상을 차지한다. 그러나 대규모 데이터센터의 전력 인프라 구축 주기는 3~5년에 달해, 중국 동부 지역에서는 이미 컴퓨팅 파워 할당 지표 확보가 ‘한 장의 표’처럼 어려운 상황이다.
셋째, 기반 시설 및 운영·유지보수 역량이 수요 폭증을 따라가지 못하고 있다. 액체 냉각(Liquid Cooling) 데이터센터의 침투율은 2024년 15%에서 2026년 45%로 상승했지만, 관련 기술 인력 및 시공 역량이 심각하게 부족해, 이미 완공된 많은 컴퓨팅 파워 클러스터들이 정상적인 가동률을 달성하지 못하고 있다.
공급 측 역량 부족 속에서 수요 측은 ‘3단 로켓’ 방식의 폭발적 성장을 보이고 있으며, 이 성장은 지속성이 매우 강하다.
첫 번째 단계는 C단 인텔리전트 에이전트의 보급이다. 개인 사용자는 단순한 대화 및 오락에서 벗어나, 이메일 처리, 코드 작성, 계획 수립 등에 AI 어시스턴트를 활용하게 되면서, 일일 토큰 소비량이 수십 개에서 수천 개로 급등했고, 향후 수만 개 수준까지 도달할 가능성이 있다.
두 번째 단계는 B단 생산 현장 적용의 전면적 확산이다. 기업들은 AI를 단순한 부가 기능이 아닌, 핵심 생산 요소로 간주하며 토큰을 직접적인 생산 자원으로 도입하고 있다. 쿤룬완웨이(Kunlun Tech), 우바퉁청(58同城) 등 기업의 월 토큰 소비량은 1조 개를 넘었고, 제조업, 금융, 의료 분야의 AI 전환은 수 조 개 규모의 토큰 수요를 창출하고 있다.
세 번째 단계는 글로벌 진출 수요의 폭발이다. 중국산 대규모 모델의 토큰 가격은 해외 클로드(Claude), GPT 등 대비 1/5~1/3 수준으로, 높은 성능 대비 가격 효율성(Cost-Performance Ratio)을 바탕으로 동남아시아, 중동, 라틴아메리카 시장에서 빠르게 점유율을 확대하고 있다. 2026년 1분기 중국 클라우드 서비스 기업의 해외 토큰 매출은 전년 동기 대비 320% 증가했으며, 새로운 성장 축으로 자리매김했다.
더 깊이 들여다보면, 토큰은 AI 시대의 기초 상품으로서 디지털 경제 전체의 가치 체계를 재구성하고 있다. 전기(Electricity)가 산업 시대의 핵심 에너지였고, 트래픽(Traffic)이 인터넷 시대의 핵심 자산이었던 것처럼, 토큰은 지능 시대의 핵심 생산 자료로서 측정 가능하고, 가격 책정이 가능하며, 거래가 가능한 세 가지 특성을 갖춘, 컴퓨팅 파워 공급과 지능형 수요를 연결하는 보편적 가치 기준점(Universal Value Anchor)이다.
이 변화는 비즈니스 모델의 근본적 혁명을 가져왔다: 업계는 ‘자금을 태워 규모를 확보하는’ 인터넷 시대의 구시대적 방식을 버리고, ‘사용량 기반 과금과 수익 중심’의 신시대에 진입했다.
대기업들은 일반적으로 ‘C단 사용자에게 무료 토큰 제공으로 사용 습관 형성 → B단 고객에게 소비량 기반 정밀 과금으로 수익 창출’ 전략을 채택하고 있다. 2026년 1분기 주요 클라우드 서비스 기업의 AI 사업 영업이익률은 평균 35% 이상으로 상승했으며, 처음으로 규모화된 수익 창출을 달성했다.
중국 입장에서는 이 토큰 산업 혁명이 ‘코너를 돌아 앞서가는’ 역사적 기회를 제공한다. 중국은 세계 최저 수준의 녹색 전력(Green Electricity) 비용, 가장 완비된 컴퓨팅 파워 인프라(서버 생산 능력이 전 세계 60% 이상 점유), 가장 광활한 응용 시나리오, 그리고 최고의 성능 대비 가격 효율성을 갖춘 대규모 언어모델을 보유하고 있어, ‘세계 토큰 공장(World Token Factory)’이 될 모든 조건을 갖추고 있다.
과거 중국이 원가 경쟁력을 바탕으로 ‘세계 공장(World Factory)’이 되었던 것처럼, 현재 중국은 에너지, 컴퓨팅 파워, 응용 시나리오의 종합적 우위를 바탕으로 전 세계 토큰 생산 및 공급을 주도하고 있다.
단기적으로는 공급-수요 불일치가 2027년 말까지 지속될 것이며, 토큰 가격은 고위험 상태를 유지하고, 업계 집중도는 급속히 상승할 것이다.
장기적으로는 반도체 생산 능력 확대와 모델 효율성 개선을 통해 토큰은 다시 ‘배추값’ 시대로 진입해 국민경제의 모든 영역에 침투하며, 디지털 경제 성장의 핵심 엔진이 될 것이다.
02 세부 산업 현황은 어떠한가?
토큰 산업이 ‘저가 내부 경쟁’에서 ‘공급-수요 긴장’으로 전환되면서, 그 세부 분야 역시 구조적 분화를 보이고 있다.
상류에서의 가격 통제, 중류에서의 이익 확대, 하류에서의 수익 창출이라는 차별화된 시장 흐름이 나타났으며, 산업 상류의 컴퓨팅 파워 하드웨어 생산, 중류의 토큰 허브(허브) 운영, 하류의 응용 시나리오 실현이라는 세 가지 주요 부문은 각기 다른 진입 장벽, 호황 정도, 그리고 가치 배분 논리를 보이고 있다.
우선 상류 컴퓨팅 파워 하드웨어는 토큰 공장의 핵심 생산 능력으로, 대기업이 독점한 구조 하에서 필수 불가결한 수요를 보인다.
핵심 세부 분야는 AI 칩, 컴퓨팅 파워 서버, 액체 냉각 시스템, 지능형 컴퓨팅 센터 운영 등 네 가지로 구성되며, 업계는 과점(寡占) 구조를 보이고 있다.
AI 칩은 토큰 생산의 핵심 엔진으로, 해외 기업인 엔비디아(NVIDIA)가 전 세계 고급 GPU 시장의 90% 이상을 점유하고 있다.
반면 A주 국산 대체 선두 기업들은 빠르게 돌파구를 마련하고 있다: 한무지(Hanmooji)의 스위엔 590(SiYuan 590) 칩은 대규모 모델 추론 및 훈련에 적합하도록 설계되어 양산을 시작했으며, 2026년 1분기 AI 칩 매출은 전년 동기 대비 320% 증가했다.
하이광정보(Haiguang Information)의 DCU 제품은 중국 내 지능형 컴퓨팅 센터에서 30% 이상의 침투율을 기록하며, 중국과학원 산하의 쓰광(中科曙光), 인슈앙(浪潮信息) 등 주요 제조사들과 긴밀히 협력하고 있다. 징자웨이(Jingjia Micro)의 JM9 시리즈 GPU는 정부 및 금융 분야의 정보기술 혁신(信创) 시나리오에 이미 적용되었으며, 국산 범용 GPU의 핵심 공급업체로 자리매김했다.
컴퓨팅 파워 서버는 토큰 생산 능력의 물리적 담체로서, A주 선두 기업들이 전 세계 시장의 절반 이상을 차지하고 있다.
인슈앙(인슈앙 정보)은 전 세계 AI 서버 시장 점유율 1위를 고수하며, 2026년 1분기 출하량은 전년 동기 대비 180% 증가했다. 쓰광(쓰광 정보)의 액체 냉각 서버는 중국 내 점유율 1위를 차지하고 있으며, 중국 내 80% 이상의 국가급 지능형 컴퓨팅 센터에 하드웨어를 공급하고 있다.
액체 냉각 시스템은 고전력 지능형 컴퓨팅 센터 운영을 위한 필수 기술로, 침투율이 2024년 15%에서 2026년 45%로 급속히 상승했다.
잉웨이크(Yingweike)는 액체 냉각 분야의 절대적 선두 기업으로, 엔비디아, 인슈앙, 화웨이 등 핵심 고객과의 긴밀한 협력을 바탕으로, 2026년 액체 냉각 주문량은 전년 동기 대비 210% 증가했다.
신링 환경(Shenling Environment)의 액체 냉각 데이터센터 솔루션은 다수의 국가급 지능형 컴퓨팅 센터에 도입되었으며, 주문 증가율은 150%를 넘었다.
지능형 컴퓨팅 센터 운영 분야에서는 바오신소프트(Baoxin Software), 광환신왕(Guanghuan Xinwang), 윤쩌지산(Yunze Zhisan)이 핵심 입지와 녹색 전력 자원을 기반으로 중국 내 최대 제3자 지능형 컴퓨팅 센터 운영사로 부상했으며, 2026년 1분기 컴퓨팅 파워 임대 수익은 모두 100% 이상 증가했다.
다음으로 중류 토큰 허브는 가격 경쟁에서 가치 경쟁으로 전환하고 있다.
토큰 산업의 중류는 컴퓨팅 파워 스케줄링, 모델 서비스 제공, 그리고 표준화된 토큰 출력이라는 핵심 기능을 수행하며, 주요 참여자는 대규모 언어모델 기업과 클라우드 서비스 기업 두 유형으로 나뉜다.
현재 A주 내 대규모 언어모델 선두 기업들도 명확한 토큰 상업화 경로를 확보했다.
예를 들어 쿤룬완웨이의 티엔궁(Tiangong) 대규모 언어모델은 일일 토큰 호출량이 1.2조 개를 돌파했으며, B단 유료 고객 수는 12만 개를 넘었다. 이 회사가 출시한 기업용 토큰 서비스 가격은 해외 모델 대비 1/4 수준에 불과하며, 2026년 1분기 AI 사업 매출은 전년 동기 대비 450% 증가했다.
카다쉰페이(Keda Xunfei)의 싱후오(Xinghuo) 대규모 언어모델은 교육, 의료, 사무 등 수직 분야에 집중하고 있으며, 토큰 소비의 70%가 B단 생산 현장 적용에서 발생한다.
클라우드 서비스 기업 측면에서는 알리클라우드, 텐센트클라우드, 후산엔진(화산엔진) 등은 A주에 상장되지 않았으나, A주 관련 생태계 기업들이 충분히 혜택을 받고 있다: 용유네트워크(Yongyou Network), 진디인터내셔널(金蝶国际, 홍콩 상장)은 알리클라우드 기반 기업용 AI 애플리케이션을 개발해 토큰 소비의 중요한 채널이 되고 있다.
마지막으로 하류 응용 시나리오는 토큰 가치의 궁극적 수출처로서, C단 보급화와 B단 필수 수요로 점차 확산되고 있다.
하류는 C단 개인 응용, B단 기업 서비스, 수직 산업 디지털 전환의 세 가지 유형으로 구분되며, 각 시나리오별 토큰 소비 규모와 상업화 속도는 현격히 다르다.
C단 시나리오는 보급화를 목표로 하며, 개인용 AI 어시스턴트, 콘텐츠 생성, 창의 디자인 등을 중심으로 한다.
A주 기업 중 만싱테크(Wanshine Tech)의 AI 창의 소프트웨어(먀오잉공창, 만싱 AI 페인팅)는 전 세계 유료 사용자 수가 550만 명을 넘었고, 2026년 1분기 토큰 소비량은 전년 동기 대비 320% 증가했다. 또한 모델 최적화를 통해 1인당 토큰 비용을 40% 감소시켰다.
차이쉬운(채신) 주식회사의 AI 이메일 및 스마트 오피스 어시스턴트 누적 사용자 수는 3억 명을 넘었고, 일일 토큰 호출량은 500억 개를 돌파했다.
B단 기업 서비스는 토큰 소비의 주력으로, 전체 소비량의 65% 이상을 차지한다.
예를 들어 퉁후아스(同花顺)의 AI 투자 자문 서비스는 1억 명 이상의 주식 투자자를 커버하며, 일일 토큰 호출량은 800억 개를 넘었다. 2026년 1분기 AI 관련 매출은 전년 동기 대비 190% 증가했다.
중쿵기술(중공기술)의 산업용 AI 플랫폼은 화학, 전력 등 분야에 지능형 운영·유지보수 서비스를 제공하며, 단일 공장의 연간 토큰 소비량은 500만 개를 넘는다.
룬다의료(윤다의료)의 AI 의료 보조 진단 시스템은 전국 3,000여 개 병원에 도입되었으며, 일일 의료 텍스트 토큰 처리량은 200억 개를 넘는다.
종합적으로 볼 때, B단 수직 산업 시나리오는 향후 토큰 산업의 장기 성장 동력이며, 자율주행, 스마트 제조, 핀테크 등 분야의 AI 전환이 수 조 개 규모의 토큰 수요를 창출할 것이다.
03 어떤 종목이 바람을 타고 있는가?
산업 발전 규칙을 고려할 때, 현재 토큰 산업은 ‘모델 경쟁’에서 완전히 ‘생산 능력 및 수익 창출 경쟁’으로 전환되었다. 공급-수요 불일치와 상업적 가치의 가속화된 실현을 바탕으로, A주 내 6개 주요 기업이 컴퓨팅 파워 하드웨어, 중류 모델, 하류 응용의 세 가지 주요 분야에서 확고한 위치를 확보했으며, 이번 만억 토큰 경제(Trillion-Token Economy)에서 가장 잠재력 있는 핵심 종목으로 부상했다.
첫 번째는 인슈앙(인슈앙 정보)으로, AI 서버 분야의 절대적 선두 기업이며, 토큰 생산 능력의 앵커 역할을 한다. 전 세계 AI 서버 시장 점유율 1위 기업인 인슈앙은 전 세계 토큰 공장 운용을 뒷받침하는 핵심 하드웨어 담체다. 이 회사는 엔비디아와 긴밀히 협력하며, 고급 GPU 할당량을 우선 확보하고 있으며, 공급망과 규모 면에서 타의 추종을 불허하는 진입 장벽을 갖고 있다.
2026년 1분기 AI 서버 출하량은 전년 동기 대비 150% 이상 증가했고, 전 세계 시장 점유율은 25%를 돌파했으며, 미납된 주문량은 약 400억 위안에 달해, 납기 일정이 2027년 말까지 밀려 있다. 이는 산업 체인 전반에서 실적 확정성이 가장 높은 종목이다.
두 번째는 액체 냉각 분야의 선두 기업인 잉웨이크로, 토큰 공장의 ‘냉각 심장’이다. 지능형 컴퓨팅 센터의 전력 밀도가 급격히 상승함에 따라 액체 냉각은 토큰 대규모 생산을 위한 필수 기술이 되었고, 업계 침투율은 2024년 15%에서 2026년 45%로 상승했다. 2026년 1분기 액체 냉각 사업 매출은 전년 동기 대비 210% 이상 증가했으며, 주문 확정성은 2027년까지 확보된 상태로, 상류 부문에서 실적 탄력성이 가장 큰 종목이다.
세 번째는 대규모 언어모델 상업화의 선구자인 쿤룬완웨이로, 토큰 수익 창출의 모범 사례다. 쿤룬완웨이는 A주 내 최초로 토큰을 규모화해 수익을 창출한 대규모 언어모델 기업이다. 이 회사의 기업용 토큰 서비스 가격은 해외 모델 대비 1/3~1/4 수준으로, 중소기업 시장 점유율을 빠르게 확대하고 있다.
2026년 1분기 일일 토큰 호출량은 1.2조 개를 돌파했고, B단 유료 고객 수는 12만 개를 넘었으며, AI 사업 매출은 전년 동기 대비 450% 이상 증가했고, 영업이익률은 42% 이상을 유지하고 있다. 이는 A주 내 가장 순수한 토큰 수익 창출 종목이다.
네 번째는 수직 분야 대규모 언어모델의 선두 기업인 카다쉰페이로, 수직 산업 토큰 수요의 핵심 담당자다. 카다쉰페이는 교육, 의료, 산업 등 수직 분야에 집중하며, 싱후오 대규모 언어모델의 토큰 소비 중 70% 이상이 B단 생산 현장 적용에서 발생한다. 이는 수요의 강한 필수성(剛性)을 의미한다.
오랜 기간 축적된 산업 시나리오와 데이터 장벽을 바탕으로, 정부 및 기업 맞춤형 토큰 서비스 주문이 급속히 증가하고 있으며, 2026년 AI 관련 매출 비중은 60%를 넘을 전망이다. 수직 산업의 AI 침투율이 지속적으로 상승함에 따라, 이 회사는 산업 디지털 전환에서 창출되는 장기 토큰 수요 혜택을 충분히 누릴 것이다.
다섯 번째는 해외 진출 C단 AI 응용 분야의 선두 기업인 만싱테크로, 개인용 토큰 소비의 핵심 기업이다. 만싱테크는 전 세계 C단 AI 창의 도구 분야의 선두 기업으로, 영상 편집 및 AI 페인팅 등 제품의 유료 사용자 수가 550만 명을 넘었다. AI 기능이 전면적으로 적용된 후, 사용자의 유료 전환 의지와 사용 시간이 크게 증가했으며, 2026년 1분기 토큰 소비량은 전년 동기 대비 320% 이상 증가했다.
종합적으로 볼 때, 이번 토큰 혜택은 수요 주도형 장기 기회이며, 단기적으로는 인슈앙, 잉웨이크 등 상류 하드웨어 선두 기업에 우선 주목할 수 있고, 중기적으로는 쿤룬완웨이 등 상업화 모범 사례 기업을 포트폴리오에 포함시키는 것이 바람직하며, 장기적으로는 카다쉰페이 등 수직 시나리오 선두 기업에 대한 전망은 매우 밝다. 우수 기업들은 이 고성장 사이클을 통해 실적과 기업 가치의 이중 상승을 경험하게 될 것이다.
TechFlow 공식 커뮤니티에 오신 것을 환영합니다
Telegram 구독 그룹:https://t.me/TechFlowDaily
트위터 공식 계정:https://x.com/TechFlowPost
트위터 영어 계정:https://x.com/BlockFlow_News














