
토큰 경제학의 새로운 모델을 한 편의 글로 완전히 이해하기
TechFlow 선정TechFlow 추천

토큰 경제학의 새로운 모델을 한 편의 글로 완전히 이해하기
대규모 언어 모델(Large Language Model) 제조사와 개발자를 연결하는 토큰 유통 중간 계층이 부상하고 있으며, 진정한 이익은 추론 가속화(Inference Acceleration), 기업 통합(Enterprise Integration), 그리고 실제 사용 사례 구현(Scenario Implementation)에 숨어 있다.
글쓴이: 자오잉(Zhao Ying)
출처: 월스트리트 인사이드(WSI)
AI 애플리케이션의 상업화는 소프트웨어 판매, 멤버십 판매를 넘어 토큰(Token) 호출 능력 판매로 확장되고 있다. 여기서 ‘토큰’은 대규모 언어 모델(LLM)이 정보를 처리하는 최소 단위이자, 모델 API의 요금 산정·정산·소비 기준이다. 호출량이 증가함에 따라 토큰 자체가 일종의 ‘재고’처럼 조달·라우팅·분할·재판매되는 양상으로 전환되고 있다.
화위엔 증권(Huayuan Securities) 애널리스트 천량둥(Chen Liangdong)은 최근 발표한 미디어 산업 특별 보고서에서 이 핵심 변화를 다음과 같이 요약했다. “토큰 운영은 새로운 중간 계층 시장을 형성하고 있으며, 이는 토큰 유통 모델을 탐색해 상류 대규모 모델 제조사와 하류 개발자·기업·개인 사용자를 연결하는 것을 목표로 한다. 본질적으로 이는 전 세계 토큰의 도매에서 소매까지 이어지는 유동성 인프라다.”
이 비즈니스가 등장한 배경은 복잡하지 않다. 한편으로 중국 내 토큰 호출량이 급격히 증가해, 2024년 초 일평균 호출량이 1,000억 개에서 2025년 말 100조 개로, 그리고 2026년 3월에는 140조 개를 돌파했다. 다른 한편으로 국산 대규모 모델의 성능이 눈에 띄게 향상되어 일부 평가 지표 및 실제 호출량 기준으로 이미 글로벌 1티어에 진입했다. 수요는 커지고, 모델은 많아졌지만, 거래를 진정으로 가로막는 장애물은 결제·네트워크·인터페이스·규제 준수·채널·실사용 시나리오 구현 등이다.
그러나 토큰 유통을 단순히 ‘API 할당량 재판매’로 이해해서는 안 된다. 가장 얇은 수익층은 재판매 차익에서 나오지만, 더 두꺼운 수익층은 추론 가속화, 통합 인터페이스 제공, 기업 대상 프롬프트 엔지니어링, 에이전트 오케스트레이션, 모델 선정, 비즈니스 시스템 연동 등에서 창출된다. 또한 진입 장벽이 비교적 낮기 때문에 이 시장의 리스크 역시 직접적이다. 경쟁 심화, 선지급 자금 및 부실채권 발생, 상류 모델 제조사의 정책 변화 등은 모두 중간 계층의 이윤을 압박한다.
토큰에도 이제 ‘도매업자’와 ‘소매업자’가 등장했다
토큰 유통의 기본 사슬에는 세 가지 유형의 주체가 존재한다.
상류는 바이트댄스의 시던스(Seedance) 시리즈, 알리바바의 친원(Qwen) 시리즈, 지푸(智谱)의 GLM 시리즈, 월즈 다크 사이드(Moonshot)의 킴이(Kimi) 시리즈, 딥시크(DeepSeek) 시리즈 등과 같은 모델 공급업체들로, 토큰의 근원 공급처다.
중간 계층은 대리 플랫폼으로, 상류 모델 자원을 수용하여 최종 사용자에게 다시 유통하는 역할을 한다. 단순히 할당량을 넘겨주는 것에 그치지 않고, 서로 다른 모델들의 인터페이스 프로토콜을 하나의 표준 API 형식으로 변환하여 하류 사용자가 단일 API 키만으로 여러 모델을 호출할 수 있도록 지원한다.
하류는 토큰을 실제로 소비하는 주체로, 개인 사용자, 개발자, 기업 고객, 혹은 하위 유통 업체까지 포함될 수 있다.
이 중간 계층의 가치는 몇 가지 핵심 영역에 집중된다. 국내 직결을 통해 네트워크 진입 장벽을 낮추는 점; 하나의 코드로 다수 모델을 호환 가능한 점; 개인 결제 및 기업 대금 결제를 모두 지원하는 점; 대량 구매 시 더 낮은 단가를 확보할 수 있는 점; GPT, 클로드(Claude), 딥시크, 킴이 등 다양한 모델을 한 플랫폼에서 통합 제공함으로써 개발자의 반복적인 접속 비용을 줄이는 점 등이다.
따라서 토큰 유통은 가볍게 보이지만, 자체 대규모 모델 훈련이나 방대한 서버 클러스터를 필요로 하지 않는다. 핵심 자산은 API 중계 스케줄링 시스템, 상류 모델 자원, 유통 채널 및 고객, 그리고 서비스 역량이 된다.
호출량 폭증—이 비즈니스의 가장 직접적인 동력
토큰 운영 모델이 성립하기 위해서는 충분히 큰 소비량이 전제되어야 한다.
중국의 일평균 토큰 호출량은 2년 만에 1,000억 개에서 140조 개 이상으로, 1,000배 이상 증가했다. 이 호출량 확장은 다양한 수직 분야의 에이전트 실사용 확산과 기업 내 생성형 AI의 비즈니스 프로세스 전반에 걸친 통합을 반영한다.
IDC 데이터는 더 급진적인 전망을 제시한다. 중국 기업의 활성화된 인텔리전트 에이전트 수는 2031년까지 3.5억 개를 돌파할 것으로 예측되며, 연평균 복합 성장률(CAGR)은 135%를 넘을 전망이다. 또한 에이전트의 과제 밀도 및 복잡도가 증가함에 따라, 에이전트의 토큰 소비량 연평균 증가율은 30배 이상에 이를 것으로 전망된다.
실행 중심의 인텔리전트 에이전트에서는 이미 이러한 변화가 관측되고 있다. 오픈클로(OpenClaw)는 오픈라우터(OpenRouter) 플랫폼에서 2026년 2월 2일부터 3월 16일까지의 주간 토큰 소비량을 0.81테라(T)에서 4.97테라(T)로 늘렸으며, 전체 플랫폼 내 점유율도 8.31%에서 24.36%로 상승시켰다.
토큰이 대규모 소비재가 되면, 이를 둘러싼 조달·가격 책정·라우팅·정산 과정도 자연스럽게 계층화된다. 모델 공급업체가 모든 고객을 직접 서비스할 필요는 없고, 최종 고객도 각각의 모델에 일일이 접속하려는 의향이 없으므로, 이 중간 계층에 공간이 생기는 것이다.
국산 모델의 가성비—토큰 해외 진출의 문을 여는 열쇠
국산 대규모 모델의 성능 향상은 토큰 유통이 국내 시장에서 글로벌 시장으로 확장되는 핵심 변수다.
슈퍼클루(SuperCLUE) 데이터에 따르면, 바이트댄스의 두바오(Doubao), 딥시크 시리즈 등 국산 모델의 종합 평가 점수가 이미 70점을 넘어서며, GPT-5.4, 제미나이(Gemini) 등 해외 선두 모델과의 격차가 좁아지고 있다. 퉁이첸원(통의천문), 킴이, 지푸 GLM 등 모델들도 명확한 랭킹 체계를 형성하고 있다.
오픈라우터 데이터에 따르면, 2026년 5월 10일 기준 1주간 텐센트의 하이3(Hy3) preview(무료)가 호출량 1위를 차지했으며, 상위 5위·10위·20위 안에 든 국산 대규모 모델은 각각 2종, 6종, 9종이었다.
더 상징적인 변화는 2026년 1분기에 나타났다. 2월 9일부터 15일까지 중국 모델의 오픈라우터 호출량은 4.12조 토큰에 달해, 동기 미국 모델의 2.94조 토큰을 처음으로 넘어섰다. 2월 16일부터 22일까지는 중국 모델의 주간 호출량이 5.16조 토큰으로 추가 상승했으며, 플랫폼 전체 호출량 상위 5위 모델 중 4개가 중국 기업 제품으로, 미니맥스(MiniMax) M2.5, 킴이 K2.5, 지푸 GLM-5, 딥시크 V3.2가 그것이며, 이 4개 모델이 상위 5위 전체 호출량의 85.7%를 차지했다.
가격 경쟁력도 매우 두드러진다. 미니맥스 M2.5와 GLM-5의 입력 가격은 백만 토큰당 0.3달러이며, 클로드 오퍼스(Claude Opus) 4.6은 5달러다. 출력 가격 기준으로는 미니맥스 M2.5가 1.1달러, GLM-5가 2.55달러, 클로드 오퍼스 4.6은 25달러다. 국산 모델은 AI 에이전트, 코드 개발 등 고토큰 소비 시나리오에서 가성비 차이가 계속해서 확대될 전망이다.
글로벌 AI 자원 불균형—라우팅 플랫폼이 ‘중계소’가 되다
토큰 유통은 단순히 가격 문제만 해결하는 것이 아니라, 자원의 비효율적 배분 문제도 해결한다.
해외 주요 대규모 모델은 지역별 접근 제한, 규제 준수 요구사항, 결제 장벽 등의 이유로 중국 본토 개발자 등 일부 사용자에게 직접 접근이 어렵다. 반대로 국산 우수 모델이 해외 시장으로 진출할 때도 현지화 적응, 유통 채널 구축, 사용자 확보 등 어려움을 겪는다.
이러한 불균형은 해외 유통, 자원 통합 라우팅, 계층별 유통 수요를 촉발시켰다.
오픈라우터는 이미 대표적인 사례가 되었다. 해당 플랫폼의 토큰 처리량은 2025년 주당 5조~7조 개에서 2026년 4월에는 주당 20조 개를 넘어서며 급성장했으며, 2026년 연간 수익은 5,000만 달러를 넘어서 2025년 10월 공개된 연간 수익 1,000만 달러 대비 약 5배 증가했다.
국내에도 유사한 플랫폼이 존재한다. ‘규지 류동(硅基流动)’은 자체 개발한 추론 엔진을 기반으로 고효율 추론 가속을 제공하는 종합 대규모 모델 클라우드 서비스 플랫폼이다. 2025년 12월 기준 플랫폼 등록 사용자 수는 900만 명을 넘었고, 기업 고객은 1만 곳 이상, 상용화된 모델은 150개 이상이다.
심지어 미국 정치 관련 자본도 이 분야에 진입했다. 2026년 5월 5일, 도널드 트럼프 전 대통령 및 그 가족과 밀접한 관계를 맺고 있는 암호화폐 기업 WLFI는 월드클로(WorldClaw)와 협력해 월드라우터(WorldRouter)를 출시했다. 이 플랫폼은 클로드, GPT, 제미나이 등 300여 개 모델을 통합하며, USD1 기준 결제를 지원하고, 공식 공개 요금 대비 약 30% 저렴한 가격으로 제공된다.
진정한 이윤은 반드시 ‘차익 재판매’에 있지 않다
토큰 유통은 세 가지 수익 모델을 갖는다.
첫 번째는 재판매 차익이다. 플랫폼이 상류 모델 제조사로부터 API 할당량을 대량 구매한 후, 하류 고객에게 프리미엄을 붙여 판매하는 방식이다. 오픈라우터는 공급업체 원가에 약 5.5%의 프리미엄을 부과하는 것이 바로 이 모델의 전형적인 사례다.
두 번째는 기술 프리미엄이다. 플랫폼이 자체 개발한 추론 가속 엔진을 통해 단일 토큰 실행 비용을 낮추고, 공식 가격과 유사하거나 오히려 낮은 가격으로 판매하면서도, 계산 효율성 차이를 통해 매출총이익을 확보하는 방식이다. 규지 류동의 실리콘엘엘엠(SiliconLLM)과 원디프(OneDiff) 기술은 언어 모델 추론 속도를 10배, 텍스트-이미지 생성 효율을 3배 향상시켜, 대규모 모델 API 호출 비용을 업계 평균의 1/10 수준으로 낮췄다.
세 번째는 기업 맞춤형 부가 서비스다. 기업이 AI를 도입하는 비용은 단순히 토큰 단가에만 국한되지 않는다. 프롬프트 엔지니어링, 다중 모델 선정, 비즈니스 시스템 연동, 워크플로우 오케스트레이션, 운영 관제, 임직원 AI 역량 개발 등이 모두 포함된다. 토큰 기본 가격이 하락하면, 오히려 이러한 잠재적 비용 항목들이 더 명확한 유료화 포인트가 될 수 있다.
규지 류동의 기업용 MaaS 플랫폼은 바로 이런 방향성을 반영한다. 기업 고객에게 모델 훈련·최적화, 배포·추론, 애플리케이션 개발 지원이라는 세 가지 계층의 서비스를 제공하며, 데이터 처리, 모델 파인튜닝, 프롬프트 엔지니어링, RAG(Retrieval-Augmented Generation) 등 전반을 아우른 후, 에너지·금융·정부 등 다양한 산업군에 표준화된 API 형태로 최종 제공한다.
마케팅, 숏드라마, 게임, 이커머스—토큰 소비가 가장 활발한 분야
토큰 유통이 수익을 내려면 결국 현실의 적용 시나리오로 귀결되어야 한다.
생성형 AI 애플리케이션은 의료·헬스케어, 교통, 산업 제조 등 다양한 분야로 확산되며, 기업 의사결정 지원 및 전략 관리 등 핵심 프로세스에도 참여하고 있다. 그러나 많은 기업은 여전히 디지털 전환 기반이 약하고, 데이터 자산 축적이 부족하며, 컴퓨팅 자원 투자도 제한되어 있어 AI 역량을 직접 구축하기 어려운 실정이다.
반면 마케팅·광고 기업은 이미 고객과 활용 시나리오를 확보하고 있으며, 특히 숏드라마, 만화 드라마, 게임, 이커머스 등 분야에서 토큰 소비 수요가 더욱 직접적이고 지속적이다. 이들 기업에게는 단순히 모델 역량을 재판매하는 것을 넘어서, 토큰을 고객의 콘텐츠 생성·광고 배포·소재 제작·영상화 등 전 과정에 통합하는 기회가 있다.
투자 기회도 두 가지 주요 축을 따라 전개된다.
첫 번째는 우수한 모델 역량을 보유한 기업으로, 알리바바, 텐센트 홀딩스, 쿠아이쇼우(쿠아이), 쿤룬완웨이(昆仑万维), 지푸, 미니맥스 등이 포함된다.
두 번째는 강력한 토큰 활용 시나리오와 우수한 고객 기반을 보유한 기업으로, 특히 해외 고객 자원과 마케팅 시나리오를 보유하고, AI 마케팅 및 AI 영상화 분야에 적극 투자하려는 기업, 예컨대 이디안톈샤(易点天下), 란쓰광뱌오(蓝色光标) 등이 여기에 해당한다.
리스크도 명확하다—낮은 진입 장벽, 선지급 자금, 상류의 결정권
토큰 유통 비즈니스 모델은 가볍지만, 그 ‘모든’ 경쟁력을 보장하는 것은 아니다.
동종 업계 경쟁이 첫 번째 리스크다. 유통 사업의 기술적 진입 장벽은 낮은 편이며, 자금·고객·채널 등에서 우위를 점한 선두 유통업체가 진입하면, 빠르게 유사 모델을 복제하여 수익성 압박을 가할 수 있다.
선지급 자금 및 부실채권 발생이 두 번째 리스크다. 유통업체는 하류 고객에게 보통 월단위 또는 분기단위로 결제를 허용하지만, 상류 모델 업체에 대한 API 할당량 구매는 선지급이 필수적이다. 토큰 소비 규모가 커질수록 선지급 자금 부담은 커지고, 고객의 지불 지연이 발생하면 부실채권 리스크도 동시에 확대된다.
상류 모델 업체의 정책 변화가 세 번째 리스크다. 대규모 모델 제조사가 API 가격 및 접속 규정을 전적으로 통제하므로, 가격 조정이나 제3자 접속 정책 강화 등이 가능하다. 이는 중간 계층 입장에서 통제하기 가장 어려운 요소다.
TechFlow 공식 커뮤니티에 오신 것을 환영합니다
Telegram 구독 그룹:https://t.me/TechFlowDaily
트위터 공식 계정:https://x.com/TechFlowPost
트위터 영어 계정:https://x.com/BlockFlow_News














