
왜 AI 서비스의 구독 모델은 필연적으로 사라질까?
저자|장용의

6월 9일, Anthropic은 지금까지 공개된 모델 중 가장 강력한 Claude Fable 5를 발표했다. 관례에 따라 이는 유료 사용자에게는 명실상부한 축제일이 되어야 했다—당신이 매달 내는 돈이야말로, 최신 플래그십 모델을 가장 먼저 체험할 수 있는 자격을 사주는 것이다.
하지만 발표문 속 한 줄의 문장이 발표 직후 엄청난 논란을 불러일으켰다: “6월 22일 이후, Fable 5는 모든 구독 요금제에서 제외되며, 계속 사용하려면 별도로 사용량 크레딧을 구매해야 한다.”
즉, 회원권을 구매하더라도 플래그십 모델을 사용할 수 있는 기간은 단 14일뿐이다.
출시 당일부터 ‘퇴거 통지서’가 붙어 있는 모델은 대규모 언어모델(LM) 산업 역사상 처음 있는 일이다.
많은 이들이 이를 Anthropic의 실수 혹은 오만한 판단으로 간주한다. 그러나 필자의 견해는 정반대다: 이는 실수가 아니라 예고이다.
AI 구독제는 필연적인 종말을 향해 가고 있다—어느 특정 기업의 탐욕 때문이 아니라, 구독제가 성립하는 근본 전제 자체가 AI에 의해 스스로 해체되고 있기 때문이다.
01 카운트다운 14일의 플래그십 모델
먼저 사실을 정리해 보자. Anthropic의 공식 계획(2026년 6월 9일 기준)에 따르면, Fable 5는 출시일부터 Pro, Max, Team 및 좌석 기준 기업용 요금제에 무료로 포함되며, 6월 22일까지 유효하다. 6월 23일부터는 해당 요금제에서 완전히 제외되며, 이후 발생하는 모든 토큰 사용량은 선불로 구매한 사용량 크레딧에서 차감되며, 요금율은 API와 완전히 동일하다.
이 요금율은 결코 저렴하지 않다: 입력 토큰 100만 개당 10달러, 출력 토큰 100만 개당 50달러로, 바로 직전 세대 플래그십 모델인 Opus 4.8의 두 배에 달한다. 더 미묘한 점은, 무료 이용 기간 중에도 Fable 5의 구독 할당량 산정 비중이 약 두 배로 적용된다는 점이다—같은 작업을 수행하더라도, 할당량 소비 속도는 Opus의 두 배다.
사용자들의 반응은 뻔하다. Hacker News에서는 누군가 이 ‘먼저 주고 나중에 거두는’ 방식을 불안하게 여겨, Anthropic이 구독 사용자를 과금 기반 사용 모델로 유도하려는 의도가 아니냐고 의심하기도 했다. 또 일부 개발자는 실측 결과를 공유했다: 월 100달러짜리 Max 요금제에서 단 한 번의 에이전트 프로그래밍 세션만으로도 거의 100달러 상당의 토큰을 소비했다.

사용자들이 소셜미디어에서 자신의 토큰 사용량이 턱없이 부족하다고 불평하고 있다|출처: Twitter
게다가 이는 Anthropic만의 움직임이 아니다. 지난 8주 동안 전체 산업이 동일한 방향으로 움직이고 있다: OpenAI는 4월 2일, Codex의 과금 방식을 메시지 단위 과금에서 API와 동일한 토큰 단위 과금으로 변경했으며, 이후 기존 기업 고객 전체로 확대 적용했다.
GitHub는 4월 20일, Copilot 개인용 신규 등록을 중단했고, 일주일 후 전면적으로 AI 크레딧(AI Credits) 과금 체계로 전환한다고 발표했으며, 6월 1일 완전히 전환을 마쳤다—Pro 요금제는 월 10달러이며, 이 금액만큼의 크레딧이 부여된다.
Anthropic의 움직임은 특히 밀집되어 있다: 4월 4일부터 OpenClaw 등 제3자 에이전트 프레임워크가 구독 할당량을 소비하는 것을 금지했고, 해당 용도는 과금 기반 사용으로 전환되었다; 4월 21일, 가격표 페이지에서 Pro 요금제의 Claude Code 항목이 갑작스럽게 빨간 X 표시로 바뀌었고, 커뮤니티가 발칵 뒤집힌 후 24시간 이내에 철회되었으며, 공식 설명은 “약 2%의 신규 등록 사용자를 대상으로 한 소규모 테스트”였다; 5월 14일, 6월 15일부터 Agent SDK 및 인터페이스 없는 호출 기능을 구독 범위에서 제외하고, API 요금률에 따라 별도의 크레딧으로 측정하겠다고 공식 발표했다.
세 개 기업, 8주, 동일한 방향—이것은 우연이 아니라, 전체 산업이 동일한 수학적 문제 앞에서 동일한 해답을 제출한 것이다.
그 수학적 문제는 어떤 모습일까?
02 과금 대상은 계산 능력이 아니다
연구 기관 SemiAnalysis는 최근 이 수학적 문제를 명확히 제시했다. 그들은 Anthropic과 OpenAI의 각 구독 요금제를 하나씩 구입해 장시간 프로그래밍 작업을 수행하며, 주간 할당량이 모두 소진될 때까지 실행한 후, API 공식 요금을 기준으로 실제 가치를 환산했다: 이 사용량은 얼마에 해당하는가.
기존 업계의 일반적 인식은, 월 200달러짜리 요금제로 최대 약 2000달러 상당의 토큰을 소비할 수 있다는 것이었다. 실제 측정 결과는 이를 훨씬 초월했다: 20달러의 Claude Pro는 약 400달러 상당, 200달러의 Max 20x는 약 8000달러 상당이다. OpenAI 측은 더욱 극단적이었다—20달러의 ChatGPT Plus는 약 700달러 상당, 200달러의 Pro 20x는 약 14000달러 상당이다.

가장 고가 요금제의 보조율은 최대 70배에 달한다|출처: SemiAnalysis
공정한 말을 먼저 해야 한다: 이 수치는 ‘할당량을 모두 소진’하는 상한선 값이며, 일반 사용자의 평상시 사용량을 의미하지 않는다; 또한 API 공식 요금에는 이윤이 포함되어 있고, 환산된 금액은 실제 계산 능력 비용과도 동일하지 않다. 하지만 과금 체계는 이 상한선을 반드시 보장해야 한다—보험사는 누구도 사고를 내지 않을 것이라고 가정할 수 없다.

SemiAnalysis의 구독 요금제별 실제 소비 가능량 비교 실험 결과|출처: X @kimmonismus / SemiAnalysis
보조금 자체는 치명적이지 않다. 스트리밍 서비스도 보조금을 지급했고, 택시 앱도 보조금을 지급했다. 자금을 태우며 성장을 꾀하는 것은 인터넷 산업의 전통적 수단이다. 진정으로 치명적인 것은, AI 구독제가 이들 서비스와 근본적으로 다른 점에 있다.
Netflix가 월정액제를 판매할 수 있었던 이유는 두 가지다: 영화 한 편을 추가로 제공하는 한계비용이 사실상 0에 수렴한다는 점, 그리고 한 사람이 하루에 시청할 수 있는 시간은 최대 24시간이라는 점. Spotify도 마찬가지다. 월정액제가 성립하는 암묵적 전제는, 소비량이 인간의 생리적 한계에 의해 잠겨 있다는 점—즉, 실제로 과금되는 대상은 콘텐츠가 아니라 인간의 시간이라는 것이다.
채팅 로봇 시대의 AI는 이 전제를 겨우 충족시켰다. 아무리 열성적인 사용자라도 하루에 키보드를 두드리는 양은 제한되어 있고, 경미한 사용자가 남겨둔 여유 할당량으로 열성 사용자의 초과 소비를 충분히 커버할 수 있었다.
그러다 에이전트(Agent)가 등장했다.
한 번의 에이전트 작업은 어떤 모습인가? 20개의 파일을 읽고, 계획을 세우고, 코드를 수정하고, 테스트를 실행하고, 오류 보고서를 읽고, 다시 반복한다—한 사이클에서 소비되는 토큰 수는 일반 대화의 5~30배에 달한다. 더 심각한 점은, 이 작업에 당신의 실시간 참여가 필요 없다는 것이다. 필자 역시 직접 경험했는데, 얼마 전 공항 두 곳의 항공편 데이터를 정리하도록 에이전트에게 지시한 후 샤워를 갔다 돌아오니 작업은 이미 완료되어 있었고, 할당량도 바닥났다. 당신이 잠든 동안, 전력계는 계속 돌고 있었다.
에이전트가 없애는 것은 가격 상한이 아니라 소비 상한이다. 그리고 AI 산업의 전체 진화 방향—더 긴 작업, 더 높은 자율성, 병렬로 실행되는 다수 인스턴스—은 모두 동일한 종착점으로 질주하고 있다:
소비 과정에서 인간을 완전히 제거하는 것이다.
GitHub는 공지문에서 이를 매우 직설적으로 표현했다: “에이전트 방식이 ‘기본(default)’이 되고 있다.” 즉, 구독제가 아직 겨우 유지 가능한 부분—사람이 화면 앞에 앉아 한 문장씩 대화를 나누는 시나리오—은 AI의 가치 지도에서 점차 더 작은 비중을 차지하게 될 것이다.
여기서 누군가는 물을 수 있다: 보조금이 너무 깊다면, 가격을 인상하면 안 되겠느냐?
시도해 보았고, 그 결과는 오히려 더 악화되었다. 다시 SemiAnalysis의 표를 살펴보면, 반상한 세부 사항 하나가 눈에 띈다: 요금제가 비쌀수록 보조율이 높아진다는 점이다.
Claude 측에서는 20달러 요금제의 보조율이 20배, 200달러 요금제는 40배이며, OpenAI 측에서는 35배에서 70배로 증가했다. 이 현상의 절반은 가격 설계에 기인한다—고가 요금제는 할당량을 배수로 확대함으로써 대고객에게 할인을 제공하는 효과를 낸다; 나머지 절반은 사용자 행동에 기인한다—200달러를 내고 20x 요금제를 구매하는 사람은, 할당량을 꽉 채우려는 의도로 구매하는 것이고, 경미한 사용자는 이 요금제에 아예 등장하지 않는다.
이를 보험업계에서는 ‘역선택(inverse selection)’이라 부른다. 보험계약의 가격이 가장 높은 위험도를 가진 피보험자만을 끌어모을 경우, 이 계약은 정밀한 보험수리학적 관점에서도 지속 가능하지 않다. 어떤 고정 가격이라도, 그 가격 이상의 사용량을 소비하는 사용자만을 정확히 선별해낼 뿐이다—이는 운영 문제라기보다 구조적 문제이며, 가격 조정은 다만 선별망을 더욱 세밀하게 만들 뿐이다.
2025년 한 해 동안, 업계는 사실상 모든 보완책을 시도해 보았다. 1월, Sam Altman은 X에서 월 200달러짜리 ChatGPT Pro가 예상보다 훨씬 많은 사용량으로 인해 적자를 내고 있음을 인정했고, 가격 인상 시도는 실패했다.

OpenAI는 시도했지만 실패했다|출처: X
연중, Cursor는 요청 단위 과금을 계산 능력 단위 과금으로 변경했으나, 대규모 해지 사태를 불러왔고 CEO가 공식 사과했다—중도에 규칙을 변경하는 시도도 실패했다; 여름에는 Anthropic이 Claude Code에 주간 사용 제한을 도입했는데, 이유는 일부 사용자가 에이전트를 24시간 가동하여, 한 사람의 계산 능력 소비량이 수만 달러에 달했기 때문이었다—사용량 제한 조치는 분노만 불러왔다.
모든 보완책이 무효화된 후, 올해 8주간의 집단적 ‘최후통첩’이 이루어졌다. OpenAI의 ChatGPT 담당자 Nick Turley는 BG2 팟캐스트에서 명백히 말했다: “현 시대에 무제한 요금제를 제공하는 것은, 무제한 전기 요금제를 제공하는 것과 같을지도 모른다.”
03 껍질은 남아 있지만 핵심은 이미 죽었다
물론, 다음과 같은 반론도 설득력 있어 보인다: 구독제는 분명 잘 살아 있다. ChatGPT Plus는 여전히 월 20달러, Claude Pro도 계속 판매 중이며, GitHub의 코드 자동 완성 기능조차 월정액제를 유지하고 있다. 그렇다면 ‘종말’이라는 주장은 과장된 위협일 뿐 아닌가?
이 반론은 진지하게 다뤄야 한다. 왜냐하면 이 반론이 묘사하는 현상은 실제로 존재하기 때문이다. 그러나 이 반론은 무엇이 죽었는지를 잘못 파악하고 있다.
구독제의 정신은 결코 ‘매월 한 번 결제’라는 형식이 아니라, ‘고정 가격, 마음 놓고 사용’이라는 약속에 있다—당신은 매번 사용할 때마다 비용을 계산할 필요가 없으며, 이것이 바로 과거에 과금 단위별 요금제를 이긴 전부의 이유였다.
그러나 지금 벌어지고 있는 일은 이렇다: 결제 주기는 남아 있지만, 약속은 빼앗겨 버렸다.
GitHub Pro의 월 10달러 요금에는 10달러 상당의 크레딧만 포함되어 있으며, 이 크레딧이 소진되면 즉시 사용이 중단된다—이것은 구독제가 아니라, 구독제 외형을 한 옷 입은 선불 충전 카드일 뿐이다. Anthropic의 크레딧은 API 요금률에 따라 차감되며, OpenAI의 크레딧은 자동 재충전 기능을 지원한다. 구독제는 폐지되지 않는다. 다만 내용이 완전히 비워질 뿐이다: 껍질은 남아 있지만, 핵심은 이미 죽었다.

GitHub Copilot의 AI 크레딧 과금 전환 공식 발표|출처: GitHub
진정한 마지막 ‘비무장 지대’는 순수한 채팅이다. 이 영역이 여전히 월정액제를 유지할 수 있는 이유는, 그것이 AI 가운데 유일하게 소비량이 여전히 인간의 시간에 의해 제한되는 시나리오이기 때문이다. 그러나 이 ‘성채’는 비무장 지대를 지켜내지 못한다—이 산업의 모든 연구개발 자원은 AI를 ‘당신이 물으면 답해주는’ 수준에서 ‘당신을 대신해 일을 완수해주는’ 수준으로 끌어올리기 위해 쏟겨지고 있다. 채팅 구독제는 죽지 않는다. 다만 주변부로 밀려날 뿐이다: 그 자리에 머물러 있으면서, 진정한 가치와 진정한 수익이 조금씩 과금 단위별 요금제의 세계로 옮겨가는 것을 지켜보는 것이다.
또 하나 간과하기 어려운 시기적 우연이 있다: TechCrunch 보도(2026년 6월)에 따르면, Fable 5 출시 시점에 Anthropic은 OpenAI와 함께 상장 준비를 진행 중이다. 지난 3년간 보조금은 벤처 캐피탈이 부담했지만, 공개시장의 투자자들은 ‘열성 사용자 한 명이 늘어날수록 적자가 늘어나는’ 손익계산서를 받아들이지 않을 것이다. 자본의 퇴장 일정표가, 최후통첩을 무한정 연기할 수 없음을 결정한다.
이는 각기 다른 사람들에게 서로 다른 의미를 갖는다. 기업 입장에서는, 이제 AI 지출을 클라우드 지출처럼 관리해야 한다—The Information 보도에 따르면, Uber의 CTO는 내부 메모에서 “회사가 4개월 만에 2026년 전체 AI 예산을 소진했다”고 밝혔으며, 예산 수립, 모니터링 설치, 작업별 모델 라우팅 등은 이제 모든 팀의 필수 과정이 될 것이다. 개인 사용자 입장에서는, 과거에는 경미한 사용자가 열성 사용자를 보조했으나, 이제는 각자가 자신의 전력계에 대한 요금을 지불한다.

Uber의 AI 예산 전환 역시 상당한 논란을 불러일으켰다|출처: The Information
솔직히 말해, 이것이 반드시 전부 나쁜 일만은 아니다. 가격 신호가 복귀함에 따라, “이 작업을 AI에게 맡기는 것이 과연 가치가 있는가?”라는 질문이 비로소 진짜 질문이 된다—그리고 한 산업이 이 질문을 진지하게 대답하기 시작할 때, 그것은 보조금 중심의 성장 서사에서 벗어나, 건강한 비즈니스로 진입하는 시작점이 되는 경우가 많다.
여기서 한 마디 덧붙이자면: 전력계가 설치되기 전, 현재의 구독제는 이 산업이 사용자에게 보여주는 가장 관대한 순간일지도 모른다—그러니 지금 쓰고, 소중히 여기라.
논리는 바로 SemiAnalysis의 그 표 속에 숨어 있다. 사용자 관점에서 읽어보면, 그것은 결코 사형 선고문이 아니라, 아직 유효한 혜택 목록이다: 당신이 월 200달러를 지불하면, 플랫폼은 최대 14000달러 상당의 계산 능력을 당신과 함께 태워버린다. 이런 규모의 보조금은 이전에 택시 대전과 배달 앱 대전 때만 나타났다—그 두 차례 대전의 결과는 모두 우리가 기억하는 바다. 보조금이 사라진 후, 가격은 결코 원래대로 돌아가지 않았다.
따라서 지금 당장 무거운 작업을 수행해야 한다. 예컨대 Fable 5는 구독제에 포함된 기간이 6월 22일까지밖에 남지 않았으므로, 크레딧 시대가 오기를 기다리며 정밀한 계산을 하기보다는, 지금 바로 오래 전부터 해보고 싶었지만 비용이 부담스러웠던 긴 작업들을 처리하는 편이 낫다. 이것은 ‘양털 깎기’가 아니다—단지 반드시 교정될 운명을 가진 가격 오류 속에서, 정신바짝 차린 혜택 수혜자가 되는 것이다.

Turley의 비유는 그가 의도했던 것보다 훨씬 깊은 함의를 담고 있을지도 모른다. 전기가 진정한 인프라가 되는 표지란, 단순히 가정집에 전기가 공급되는 것이 아니라, 가정집마다 전력계가 설치되는 순간이다—그 순간부터 누구도 ‘전기 월정액제가 타당한가?’를 논하지 않으며, 오직 전기 요금만을 논하게 된다.
구독제는 부고를 받지 않을 것이다. 다만 어느 조용한 청구일에, 당신의 지출 내역 한 줄에 ‘입장료’라고 적힌 작은 글자로 변할 뿐이다.
그 전까지—지금 쓰고, 소중히 여기라.
TechFlow 공식 커뮤니티에 오신 것을 환영합니다
Telegram 구독 그룹:https://t.me/TechFlowDaily
트위터 공식 계정:https://x.com/TechFlowPost
트위터 영어 계정:https://x.com/BlockFlow_News