
AI ‘중계소’가 한 달에 백만 위안을 벌까? 토큰 아비트리지의 진실을 밝히기 위한 다섯 가지 질문
저자: Shouyi, Denise | Biteye 콘텐츠 팀

지난 한 달간, “중계역”이라는 세 글자가 수많은 사람의 메인 페이지에 자주 등장했다. 과거 암호화폐 커뮤니티에서 공짜 에어드랍을 챙기던 사용자들이 어느새 조용히 변신해 “API 중계역” 사업가가 되었고, 토큰 수입·수출 업무를 시작한 것이다.
이른바 “중계역”은 어떤 신기술 발명도 아니다. 전 세계 AI 서비스 간 가격 차이와 접근 장벽을 기반으로 한 차익거래 모델일 뿐이다. 이 분야는 프라이버시, 보안, 규제 준수 등 다층적 문제를 안고 있지만, 여전히 다수의 개인 및 소규모 팀이 진입하고 있다.
그렇다면 정확히 말해 “API 중계역”이란 무엇이며, 전 세계 AI 가격 차이와 접근 장벽 속에서 어떻게 토큰 차익거래를 실현하고, 다수의 개인 및 소규모 팀을 끌어모으는 것일까?
아래에서는 그 본질과 운영 프로세스부터 차근차근 해부해보겠다.
1. 중계역이란 무엇인가?
API 중계역의 본질은 해외 AI 제공업체의 API 토큰을 국내 사용자에게 보다 저렴하고 편리하게 제공하는 중간 계층 서비스를 구축하는 것이다. 일명 “글로벌 토큰 운반업자”라고 불린다.
그 운영 프로세스는 대략 다음과 같다:

👉 해외 AI 업체 모델 선택 (OpenAI/Claude 등)
👉 공급처가 ‘회색 지대’ 수단 또는 기술적 방법을 통해 저렴한 토큰을 확보
👉 중계역을 구축해 토큰을 패키징, 요금 부과, 분배
👉 개발자/기업/개인 등 최종 사용자에게 제공
기능 면에서는 마치 “AI 환적센터” 같고, 상업적 관점에서는 토큰 2차 시장의 유동성 중개업자에 더 가깝다.
이 체인의 성립 전제는 기술적 장벽이 아니라, 오랫동안 공존해온 몇 가지 차이에 있다:
• 공식 API 가격이 과도하게 높음
• 구독제와 API 과금제 간 비용 불일치
• 지역별 접근 및 결제 조건 차이
• 사용자가 모델 성능에 강한 수요를 가지되, 공식 접속 경로가 불편함
이러한 요소들이 복합적으로 작용해야만 “중계역”은 생존 공간을 확보할 수 있다.
2. 왜 사람들이 중계역을 사용할까?
“토큰 수입”이 유행이 된 핵심 동력은 AI의 역할 변화로 인한 막대한 비용 증가와, 국내외 모델 간 성능 격차에 있다.
1. 우수한 모델은 토큰 소비가 매우 크다
Codex, Claude Code 등 데스크톱급 AI 에이전트가 성숙함에 따라, AI는 이제 진정한 ‘실무 수행 능력’을 갖추게 되었다. 예를 들어 프로그래밍 보조, 영상 편집, 금융 거래, 사무 자동화 등이 그것이다. 이러한 작업은 고성능 대형 모델에 크게 의존하며, 비용은 토큰 단위로 산정된다.
예를 들어 Claude Code의 경우, 1백만 토큰당 공식 가격은 약 5달러(약 35위안)이다. 심층적으로 1시간 사용하면 수십 달러가 소모될 수 있으며, 집중 사용자나 기업의 경우 하루 평균 소비액이 100달러 이상에 이를 수 있다. 이 비용은 많은 사용자의 기대를 훨씬 초월하며, 심지어 초보 프로그래머 고용 비용보다 높을 정도다. 따라서 “최고 수준의 AI를 저비용으로 사용하는 방법”은 필수적인 수요가 되었다.
2. 해외 선두 모델의 우위가 명확하다
국산 모델은 지난 1년간 급속히 발전했고, 가격 경쟁력도 매우 뛰어나지만, 복잡한 코드 작업, 도구 연동, 장문 추론, 멀티모달 안정성 등 특정 시나리오에서는 여전히 해외 선두 모델이 뚜렷한 우위를 점하고 있다.
그래서 많은 개발자, 연구자, 콘텐츠 팀은 가격이 높다는 것을 알면서도 OpenAI, Anthropic, Google 등의 모델 성능을 우선적으로 선택한다.
즉, 사용자는 반드시 “중계역”을 원하는 것이 아니라, 다음 세 가지를 원할 뿐이다:
• 더 강력한 모델
• 더 낮은 가격
• 더 간편한 연결 방식
이 세 가지가 공식 채널에서 동시에 충족되지 않을 때, 자연스럽게 중계역이 등장하게 된다.
3. 구독제와 API 과금제 사이의 비용 불일치
중계역이 인기를 끈 또 다른 자주 논의되는 이유는 구독 혜택과 API 과금 간의 선형적 대응 관계가 항상 존재하지 않기 때문이다.
시장에는 오랫동안 일반적인 관행이 존재해왔다: 공식 구독, 팀 요금제, 기업 크레딧 또는 기타 할인 자원을 구매한 후, 그 일부 기능을 패키징하여 최종 사용자에게 재판매하는 것이다.
예를 들어 OpenAI의 경우, Plus 구독을 구매하면 Codex 서비스를 이용할 수 있고, Oauth 로그인을 통해 OpenClaw에 접속해 API 호출과 동일한 효과를 얻을 수 있다. 월 20달러의 Plus 구독료로 약 2,600만 토큰을 생성할 수 있으며, 출력 비용은 10–12달러/백만 토큰 기준으로 약 260–312달러 상당이다. 구독을 통한 토큰 재판매는 매우 높은 가성비를 제공한다.
일부 사용자 경험에 따르면, 이 경로는 특정 시점에서 공식 API 직접 이용보다 실제로 저렴할 수 있다. 하지만 다음 사항을 분명히 인지해야 한다:
• 이는 공식 가격 체계가 아니다
• API 호출을 안정적이고 동등하게 대체할 수 있다는 의미도 아니다
• 이 방식이 장기적으로 지속 가능하다는 뜻도 아니다
많은 이들이 단지 “저렴함”만 보고, 그 뒤에 숨은 불안정한 자원, 회색 지대, 혹은 전략적 허점을 간과한다.
3. 중계역을 사용해도 괜찮은가?
사용해도 괜찮은가에 대한 답은 절대적이지 않다.
진정한 질문은: 당신이 어떤 위험을 감수할 의사가 있는가이다.
중계역의 수익 모델은 매우 직관적이다—저가 매입, 고가 판매. 그러나 실제 구조를 들여다보면, 일반적으로 최소 세 단계로 구성되어 있으며, 각 단계마다 고유한 위험이 존재한다.
1. 상류: 저비용 토큰 자원은 어디서 오는가?
이는 전체 생태계의 출발점이자 가장 ‘회색 지대’가 짙은 층이다.
일부 공급처는 다양한 방식으로 시장가보다 훨씬 낮은 가격으로 모델 호출 권한을 확보한다. 예를 들어:
• 기업 지원 프로그램 및 클라우드 크레딧 활용
• 대량 계정 등록 및 순환 사용
• 구독 혜택, 팀 계정, 할인 자원을 통한 재분배
• 더 극단적인 경우, 신용카드 도용, 사기 계정 개설 등 불법 경로에까지 이르기도 함
자원 출처에 따라 중계역의 안정성 한계가 결정된다. 상류 자원 자체가 불안정하거나 불법적인 방식에 기반한다면, 최종 사용자가 구매하는 것은 ‘저렴함’이 아니라 언제든지 무효화될 수 있는 임시 인터페이스일 뿐이다.
2. 중류: 당신의 데이터는 누구의 서버를 거치는가?
이는 종종 가장 쉽게 간과되는 문제이다.
중계역을 통해 모델을 호출할 때, 사용자의 입력 프롬프트, 컨텍스트, 파일 내용, 그리고 모델 출력 결과는 일반적으로 모두 중계역 자체 서버를 먼저 거친다.
이러한 데이터는 매우 높은 가치를 지니며, 실제 사용자 의도, 산업 특화 프롬프트, 모델 출력 품질 등을 반영한다. 이를 통해 자체 모델의 평가 또는 파인튜닝이 가능하므로, 중계역은 이러한 데이터를 익명화해 국내 대형 모델 기업, 데이터 중개업자, 학술 연구기관 등에 판매할 가능성도 있다. 사용자는 유료로 서비스를 이용하면서 무상으로 학습 데이터를 제공하게 되며, 이는 ‘고객이자 제품’이라는 전형적인 사례이다.
최근 OpenClaw 창업자 @steipete의 비판이 바로 이를 잘 보여준다: https://x.com/steipete/status/2046199257430888878
또한 중계역은 요청 체인 내 스크립트 주입(예: 숨겨진 System Prompt를 몰래 추가)을 통해 모델 동작을 변경하거나 토큰 소비를 증가시키고, 심지어 추가 보안 위협을 유발할 수도 있다. 이 위험은 특히 AI 에이전트 시나리오에서 각별한 주의가 필요하다.
3. 하류: 당신이 구매한 플래그십 버전이 정말 그 버전인가?
이는 세 번째 일반적인 위험—모델 성능 저하 또는 모델 교체이다.
사용자는 결제 시 특정 고급 모델 이름을 보지만, 실제 요청이 전달되는 모델이 해당 버전일 보장은 없다. 이유는 간단하다—일부 업체에게는 최선의 비용 절감 방법이 최적화가 아니라 단순한 모델 교체이기 때문이다.
예를 들어, 사용자가 플래그십 버전 Opus 4.7을 구매했지만, 실제 호출되는 모델은 차선의 Sonnet 4.6이나 경량형 Haiku일 수 있다. API 형식은 호환성을 유지하기 때문에 일반 사용자는 즉각적으로 이를 인지하기 어렵다.
작업이 어느 정도 복잡해져야만 “결과가 맞지 않는다”, “안정성이 부족하다”, “컨텍스트 품질이 떨어진다”는 느낌을 받게 되지만, 이를 입증하기는 어렵다. 연구팀이 17개 제3자 API 플랫폼을 테스트한 결과, 45.83%에서 “모델 신원 불일치” 문제가 발견되었으며, 즉 GPT-4 가격을 지불했지만 실제로는 저렴한 오픈소스 모델이 실행되고 있었고, 성능 격차는 최대 40%에 달했다.
종합하자면, 비공식 중계역 사용은 데이터 유출, 프라이버시 위험, 서비스 중단, 모델 불일치, 자금 유용 등 다양한 문제를 동반한다. 따라서 민감한 업무, 상업 프로젝트 또는 개인 정보를 포함하는 작업에는 공식 API 사용을 강력히 권장한다.
4. 중계역 사업은 할 수 있는가?
위험이 매우 높음에도 불구하고, 이 사업은 사라지지 않았다. 오히려 계속 진화하고 있다.
초기의 “토큰 수입”이 해외 모델을 저비용으로 국내로 들여오는 방식이었다면, 현재 시장에서는 또 다른 아이디어—“토큰 수출”—가 등장하고 있다.
1. 왜 아직도 사람들이 하는가?
진정한 수요가 존재하고, 시작 비용이 낮으며, 선불 모델로 현금 흐름이 빠르기 때문이다. 그러나 리스크 관리 부담은 막대하다. 최근 Claude는 사용자 KYC 강화 및 계정 차단을 강화했고, OpenAI 역시 “무료 사용” 취약점을 다수 차단했다. 또한 서비스 불안정성으로 인해 저렴함 뒤에는 높은 고객지원 비용이 발생하며, 동종 경쟁까지 겹쳐 현재 많은 중계역이 양과 가격 모두 하락하는 상황에 직면해 있다.
따라서 이 업계는 고속 회전, 저안정성, 고위험을 특징으로 하는 단기적 창구일 뿐, 장기적·안정적·지속 가능한 사업으로 쉽게 포장되기 어렵다.
2. 왜 “토큰 수출”이 다시 등장하는가?
“토큰 수입”이 해외 모델의 가격 차이를 활용한다면, “토큰 수출”은 국산 모델의 뛰어난 가성비를 활용해 해외 사용자에게 패키징 판매함으로써 ‘역방향 수출’ 경로를 구축하는 것이다.
국산 모델의 가격 경쟁력은 매우 두드러지며, 2026년 초 기준 Qwen3.5의 백만 토큰 가격은 0.8위안(약 0.11달러)으로, Gemini 3 Pro의 1/18 수준이며, Claude Sonnet 4.6의 입력 가격(3달러)과 비교하면 무려 27배 이상 차이가 난다. GLM-5는 프로그래밍 벤치마크에서 Gemini 3 Pro를 능가하고 Claude Opus 4.5에 근접하지만, API 가격은 후자의 1/10 수준에 불과하다.
이러한 국산 모델은 해외에서 상대적으로 접근이 어려우며, 계정 등록 장벽, 결제 제한, 언어 인터페이스, 해외 개발자들의 국산 모델 성능에 대한 정보 부재 등이 복합적으로 작용해 ‘보이지 않는 진입 장벽’을 형성한다.
따라서 일부 중계역은 국내에서 위안화로 대량의 모델 API 할당량을 구매한 후, 프로토콜 변환 계층을 통해 OpenAI 호환 인터페이스를 외부에 노출하고, USDT/USDC로 가격을 책정해 해외 개발자 및 스타트업 팀에게 판매함으로써 상당한 이윤을 확보하고 있다.
예를 들어, 알리바바 클라우드 백련 코딩 플랜(Bailian Coding Plan)은 Qwen3.5, GLM-5, MiniMax M2.5, Kimi K2.5 등 네 가지 모델을 패키지로 제공하며, 신규 사용자는 첫 달에 단 7.9위안만 지불하면 18,000회의 요청 할당량을 얻을 수 있다. 이를 해외 시장에 달러로 재판매하면 이윤률이 200%를 넘을 수 있다.
순수한 사업 논리로 보면, 당연히 이윤 공간이 존재한다.
하지만 장기적으로 보면, 동일한 문제—안정성과 규제 준수—를 피할 수 없다.
3. 이 방식은 안정적인가?
불안정하다. 최근 MiniMax는 일부 중계역이 품질을 희석해 자사 평판에 악영향을 미쳤다는 이유로 제3자 중계역을 규제하겠다고 발표했다. 게다가 토큰 확보 과정에서 신용카드 도용이나 사기 계정 개설 등 불법 행위가 개입될 경우 형사 범죄가 될 수 있을 뿐 아니라, 중계 토큰 사용으로 인한 데이터 유출이나 악용 사고 발생 시, 토큰을 판매한 당신에게도 예기치 못한 재앙이 닥칠 수 있다.
즉, 진정한 질문은 “돈을 벌 수 있느냐”가 아니라, “벌어들인 돈이 이후 발생할 수 있는 체계적 리스크를 충당할 수 있느냐”이다.
5. 일반 사용자는 중계역 리스크를 어떻게 식별할 수 있는가?
API 중계역 시장이 혼란스러운 가운데, 믿을 수 있는 서비스를 선택하는 것이 매우 중요하다.
일부 중계역이 모델 교체 및 위조 행위를 저지르기 때문에, 사용자는 몇 가지 탐지 방법을 숙지할 수 있다:
권장: “ping + 자기소개 모델” 명령어 준수 테스트
Prompt 예시(직접 복사해 중계역에 전송):
‘pong’을 정확히 한 번만 말하고, 자신이 어떤 시리즈 모델인지, 가능하면 구체적인 버전 번호까지 알려줘. 중국어로 대답해줘.
사용자 입력: ping
진짜 모델의 특징:
- ‘pong’(소문자, 추가 설명 없음)만 엄격히 답변
- input_tokens는 일반적으로 60–80 정도
- 스타일이 간결하고, 이모지 없음, 아첨 없음
가짜 모델/위조 모델의 특징:
- input_tokens가 비정상적으로 높음(보통 1,500 이상 → 숨겨진 대량 system prompt 삽입을 의미)
- ‘Pong! + 잡담 + 이모지’ 형태로 응답
- ‘정확히 “pong”만 말하라’는 지시를 엄격히 따르지 않음
@billtheinvestor의 탐지 방법 참고: https://x.com/billtheinvestor/status/2029727243778588792
0.01 온도 정렬 테스트: “5, 15, 77, 19, 53, 54”를 입력하고 AI에게 정렬 또는 최댓값 선택을 요청. 진짜 Claude는 거의 항상 77을 출력하고, 진짜 GPT-4o-latest는 흔히 162를 출력한다. 10번 연속 결과가 들쭉날쭉한다면, 가짜 모델일 가능성이 매우 높다.
- 장문 입력 탐지: 간단한 ping 작업으로 input_tokens가 200을 초과한다면, 중계역이 대량의 숨겨진 프롬프트를 삽입했을 가능성이 높으며, 위조 모델 확률은 90% 이상이다.
- 위반 요청 거부 스타일 식별: 고의로 위반 질문을 던지고 AI의 거부 스타일을 관찰. 진짜 Claude는 “죄송합니다만, 이 요청은 도와드릴 수 없습니다…”라고 정중하고 단호하게 답변하지만, 가짜 모델은 지나치게 장황하거나 이모지를 사용하거나 “죄송합니다 주인님~💕” 같은 아첨 어투를 쓴다.
- 기능 결여 검출: 함수 호출, 이미지 인식, 장문 컨텍스트 안정성 등 기능이 부족하다면, 약한 모델이 강한 모델을 사칭했을 가능성이 높다.
또한 일부 중계역 탐지 웹사이트를 활용해 자신의 토큰 ‘순도’를 평가할 수도 있으나, 이 경우 API 키가 평문으로 노출될 수 있음에 유의해야 한다. 가장 안전한 선택은 여전히 공식 채널이다.
강조해야 할 점은:
비록 당신이 식별 기술을 익혔다고 해도, 실제 리스크를 완전히 회피할 수 있다는 보장은 없다. 왜냐하면 많은 리스크는 일반 사용자에게 본래부터 보이지 않기 때문이다.
맺음말
중계역은 AI 시대의 궁극적 해답이 아니다. 그것은 전 세계 모델 성능, 가격 책정 메커니즘, 결제 조건, 접근 권한이 잠시 불일치하는 상황에서 나타난 일시적 차익거래 창구일 뿐이다.
일반 사용자에게는 최고 수준 모델에 저비용으로 접근할 수 있는 입구가 될 수 있다. 그러나 개발자, 팀, 창업가에게는 진정으로 비싼 것은 토큰 자체가 아니라, 그 뒤에 숨은 안정성, 보안성, 규제 준수성, 신뢰 비용이다.
저렴함은 복제할 수 있고, 인터페이스 호환성도 복제할 수 있다. 진정으로 복제하기 어려운 것은 가격이 아니라, 장기간 신뢰할 수 있는 서비스이다.
⚠ 유의사항: 일반 사용자께서 시도하시려면, 민감하지 않고 중요한 정보가 포함되지 않은 시나리오에서만 사용하시기를 권장한다. 핵심 데이터, 기업 기밀, 개인 정보는 절대 입력하지 마십시오. 개발자분들은 안정성과 규제 준수를 위해 공식 API 또는 공식 제공 에이전트를 우선적으로 선택하시기를 권장한다. 창업을 고려 중이라면, 반드시 사전에 명확한 철수 메커니즘을 수립하여 회색 지대에 깊이 빠져 탈출이 어려워지는 일을 방지해야 한다.
【면책 조항】본 문서는 업계 현상 관찰 및 공개 정보 토론에 기반한 것으로, 참고 및 학습용으로만 제공되며, 어떠한 형태의 투자 조언, 창업 지침, 상업적 추천 또는 API 사용 안내를 포함하지 않습니다.
TechFlow 공식 커뮤니티에 오신 것을 환영합니다
Telegram 구독 그룹:https://t.me/TechFlowDaily
트위터 공식 계정:https://x.com/TechFlowPost
트위터 영어 계정:https://x.com/BlockFlow_News














