
Tại sao mô hình đăng ký dịch vụ AI chắc chắn sẽ đi đến chỗ diệt vong?
Tuyển chọn TechFlowTuyển chọn TechFlow

Tại sao mô hình đăng ký dịch vụ AI chắc chắn sẽ đi đến chỗ diệt vong?
Mô hình đăng ký sẽ bị cạn kiệt—hãy sử dụng một cách trân trọng.
Tác giả|Trương Dũng Nghị

Ngày 9 tháng 6, Anthropic đã ra mắt mô hình công khai mạnh nhất của mình cho đến nay — Claude Fable 5. Theo thông lệ, đây lẽ ra phải là ngày hội dành riêng cho người dùng trả phí — số tiền bạn đóng hàng tháng cuối cùng cũng đổi lấy quyền được tiếp cận ngay lập tức với phiên bản cao cấp nhất.
Tuy nhiên, một dòng chữ trong thông báo đã ngay lập tức gây ra tranh cãi lớn sau khi phát hành: kể từ ngày 22 tháng 6, Fable 5 sẽ bị gỡ bỏ khỏi mọi gói đăng ký, và việc tiếp tục sử dụng sẽ yêu cầu mua riêng “điểm sử dụng” (usage credits).
Nói cách khác, ngay cả khi bạn đã đăng ký thành viên, bạn chỉ được dùng mô hình cao cấp này trong 14 ngày.
Một mô hình vừa ra mắt đã kèm theo “lệnh đuổi khách”, điều chưa từng xảy ra trong ngành mô hình ngôn ngữ lớn (LLM).
Nhiều người coi đây là một sai lầm hoặc biểu hiện của sự kiêu ngạo từ phía Anthropic. Quan điểm của tôi lại ngược lại: Đây không phải là sai lầm, mà là lời cảnh báo trước.
Hệ thống đăng ký (subscription) cho AI đang tiến tới một sự sụp đổ tất yếu — không phải do lòng tham của bất kỳ công ty nào, mà bởi chính nền tảng mà mô hình đăng ký dựa vào đang bị chính AI tự tay phá hủy.
01 Mô hình cao cấp với đồng hồ đếm ngược 14 ngày
Trước tiên, hãy làm rõ các sự kiện. Theo kế hoạch chính thức của Anthropic (ngày 9 tháng 6 năm 2026), Fable 5 sẽ được miễn phí tích hợp trong các gói Pro, Max, Team và phiên bản doanh nghiệp tính phí theo vị trí (seat-based) kể từ ngày phát hành, và kết thúc vào ngày 22 tháng 6; từ ngày 23 tháng 6 trở đi, mô hình này sẽ bị loại khỏi toàn bộ các gói nói trên, và mỗi token sử dụng sau đó đều được khấu trừ từ số “điểm sử dụng” đã trả trước, với mức giá hoàn toàn giống như API.
Mức giá này không hề rẻ: 10 USD cho mỗi triệu token đầu vào và 50 USD cho mỗi triệu token đầu ra — đúng bằng hai lần mức giá của phiên bản cao cấp trước đó Opus 4.8. Điều tinh tế hơn nữa là, ngay cả trong giai đoạn miễn phí, Fable 5 vẫn được tính với trọng số khoảng gấp đôi trong hạn mức đăng ký — nghĩa là cùng một tác vụ, tốc độ tiêu thụ hạn mức sẽ nhanh gấp đôi so với Opus.
Phản ứng của người dùng là điều dễ đoán. Trên Hacker News, có người thẳng thắn nhận xét rằng cách làm “cho trước rồi thu lại” này khiến người dùng cảm thấy bất an, nghi ngờ Anthropic đang muốn đẩy người dùng đăng ký sang mô hình thanh toán theo mức sử dụng; còn một số nhà phát triển thực nghiệm cho biết chỉ một phiên làm việc lập trình agent trên gói Max giá 100 USD/tháng đã tiêu tốn lượng token trị giá gần 100 USD.

Người dùng liên tục phàn nàn trên mạng xã hội rằng lượng token được cấp hoàn toàn không đủ dùng|Nguồn ảnh: Twitter
Hơn nữa, đây không phải động thái riêng lẻ của Anthropic. Trong suốt tám tuần qua, toàn ngành đều đang thực hiện cùng một việc: Ngày 2 tháng 4, OpenAI chuyển Codex từ mô hình tính phí theo tin nhắn sang tính phí theo token tương thích với API, sau đó mở rộng áp dụng cho toàn bộ khách hàng doanh nghiệp hiện hữu.
GitHub đình chỉ đăng ký mới cho phiên bản cá nhân của Copilot vào ngày 20 tháng 4, một tuần sau tuyên bố chuyển toàn bộ hệ thống sang mô hình thanh toán bằng “AI Credits”, và hoàn tất chuyển đổi vào ngày 1 tháng 6 — gói Pro giá 10 USD/tháng đi kèm đúng 10 USD “điểm sử dụng”.
Chính Anthropic có những động thái dày đặc nhất: Từ ngày 4 tháng 4, cấm các framework agent bên thứ ba như OpenClaw tiêu thụ hạn mức đăng ký, chuyển sang thanh toán theo mức sử dụng; ngày 21 tháng 4, mục “Claude Code” trong gói Pro trên trang định giá bất ngờ xuất hiện dấu “X” màu đỏ, gây xôn xao cộng đồng, và trong vòng 24 giờ đã bị rút lại, giải thích chính thức là “một thử nghiệm nhỏ trên khoảng 2% người dùng mới đăng ký”; ngày 14 tháng 5, chính thức thông báo từ ngày 15 tháng 6, SDK Agent và các cuộc gọi không giao diện sẽ bị loại khỏi phạm vi đăng ký, chuyển sang tính phí độc lập theo mức giá API.
Ba công ty, tám tuần, cùng một hướng đi — đây không phải ngẫu nhiên, mà là cả ngành đều đưa ra cùng một đáp án trước cùng một bài toán toán học.
Vậy bài toán ấy trông như thế nào?
02 Điều thực sự được định giá chưa bao giờ là năng lực tính toán
Gần đây, tổ chức nghiên cứu SemiAnalysis đã đưa bài toán này lên bàn cân. Họ mua từng gói đăng ký của Anthropic và OpenAI, chạy các tác vụ lập trình dài hạn cho đến khi hết hạn mức hàng tuần, rồi quy đổi giá trị sử dụng đó theo bảng giá API.
Trước đây, nhận thức chung trong ngành là một gói giá 200 USD/tháng tối đa chỉ tạo ra khoảng 2.000 USD token. Kết quả thực nghiệm vượt xa con số này: Gói Claude Pro giá 20 USD có giới hạn khoảng 400 USD; gói Max 20x giá 200 USD đạt khoảng 8.000 USD. Còn ở phía OpenAI còn đáng kinh ngạc hơn — gói ChatGPT Plus giá 20 USD tạo ra khoảng 700 USD, gói Pro 20x giá 200 USD đạt khoảng 14.000 USD.

Mức độ trợ giá cao nhất đạt tới 70 lần|Nguồn ảnh: SemiAnalysis
Có hai điều công bằng cần nói rõ ngay từ đầu: Đây là giá trị giới hạn trên khi “dùng hết hạn mức”, không phản ánh mức sử dụng thường nhật của người dùng phổ thông; giá niêm yết API đã bao gồm lợi nhuận gộp, nên con số quy đổi cũng không bằng chi phí tính toán thực tế. Nhưng việc định giá phải đảm bảo khả năng chi trả cho giới hạn trên — công ty bảo hiểm không thể giả định rằng sẽ chẳng ai gặp rủi ro.

Kết quả đo lường thực tế của SemiAnalysis về mức sử dụng có thể tiêu thụ trên từng gói đăng ký|Nguồn ảnh: X @kimmonismus / SemiAnalysis
Sự trợ giá bản thân nó không gây chết người. Dịch vụ phát trực tuyến từng trợ giá, ứng dụng gọi xe cũng từng trợ giá — đốt tiền để đổi lấy tăng trưởng là kỹ năng truyền thống của Internet. Điều thực sự gây chết người là sự khác biệt căn bản giữa mô hình đăng ký AI và những mô hình khác.
Netflix dám bán gói tháng nhờ hai yếu tố: chi phí biên để thêm một bộ phim gần như bằng không, và một người chỉ có tối đa 24 giờ mỗi ngày để xem. Spotify cũng vậy. Giả định ngầm khiến mô hình gói tháng tồn tại là mức tiêu thụ bị giới hạn bởi giới hạn sinh lý của con người — thực chất điều được định giá chưa bao giờ là nội dung, mà là thời gian của con người.
AI thời đại chatbot tạm thời phù hợp với giả định này. Dù bạn có trò chuyện nhiều đến đâu, lượng nhập liệu hàng ngày của một người cũng có giới hạn; phần hạn mức dư thừa của người dùng nhẹ đủ để bù đắp cho mức tiêu thụ vượt quá của người dùng nặng.
Rồi Agent xuất hiện.
Một tác vụ agent là gì? Nó đọc 20 tập tin, lập kế hoạch, chỉnh sửa mã, chạy kiểm thử, đọc thông báo lỗi, rồi lặp lại — một vòng như vậy tiêu tốn lượng token cao gấp 5–30 lần so với một cuộc trò chuyện thông thường. Nguy hiểm hơn nữa là nó không cần bạn có mặt. Tôi cũng từng trải nghiệm: Gần đây tôi yêu cầu agent tổng hợp dữ liệu chuyến bay của hai sân bay, tôi đi tắm, quay lại thì tác vụ đã hoàn tất và hạn mức cũng đã cạn kiệt. Bạn đang ngủ, nhưng đồng hồ điện vẫn quay.
Agent không hủy bỏ giới hạn giá, mà hủy bỏ giới hạn tiêu thụ. Toàn bộ xu hướng tiến hóa của ngành AI — nhiệm vụ dài hơn, tính tự chủ cao hơn, nhiều phiên bản chạy song song — đều đang lao thẳng về cùng một đích:
Loại bỏ con người hoàn toàn khỏi khâu tiêu thụ.
GitHub trong thông báo nói rất rõ ràng: cách dùng agent “đang trở thành mặc định”. Nghĩa là những tình huống mà mô hình đăng ký còn có thể vận hành được — tức là người dùng ngồi trước màn hình, từng câu một trò chuyện — sẽ chiếm tỷ trọng ngày càng nhỏ trong bản đồ giá trị của AI.
Đến đây, có người sẽ hỏi: trợ giá quá sâu thì tăng giá thôi chứ?
Đã thử tăng giá, nhưng dẫn đến kết quả còn tệ hơn. Nhìn lại bảng của SemiAnalysis, có một chi tiết bất thường: gói càng đắt, mức độ trợ giá càng cao.
Ở Claude, gói 20 USD có mức trợ giá 20 lần, gói 200 USD đạt 40 lần; ở OpenAI, mức này tăng từ 35 lên 70 lần. Một nửa là do thiết kế giá — các gói cao cấp mở rộng hạn mức theo hệ số, thực chất là giảm giá cho khách hàng lớn; nửa còn lại do hành vi người dùng — những người sẵn sàng chi 200 USD để mua gói 20x chính là những người nhắm vào việc “dùng hết hạn mức”, còn người dùng nhẹ hoàn toàn không xuất hiện ở phân khúc này.
Trong ngành bảo hiểm, hiện tượng này gọi là “lựa chọn nghịch”. Khi mức giá bảo hiểm thu hút toàn bộ những người có rủi ro cao nhất, thì hợp đồng bảo hiểm ấy không còn cơ sở tính toán tồn tại. Bất kỳ mức giá cố định nào cũng sẽ chính xác lọc ra nhóm người dùng có mức sử dụng vượt quá mức giá đó — đây không phải vấn đề quản trị, mà là vấn đề cấu trúc; việc điều chỉnh giá chỉ khiến “cái sàng” ngày càng lọc kỹ hơn.
Suốt năm 2025, ngành đã thử nghiệm mọi miếng vá có thể. Tháng 1, Sam Altman thừa nhận trên X rằng gói ChatGPT Pro giá 200 USD/tháng đang lỗ vì mức sử dụng vượt xa dự kiến — thất bại trong việc tăng giá.

OpenAI đã thử nhưng thất bại|Nguồn ảnh: X
Giữa năm, Cursor chuyển từ mô hình tính phí theo yêu cầu sang tính phí theo năng lực tính toán, dẫn đến hàng loạt người hủy đăng ký, CEO phải công khai xin lỗi — thất bại khi thay đổi quy tắc giữa chừng; mùa hè, Anthropic áp đặt giới hạn tuần cho Claude Code, với lý do có người dùng để agent chạy liên tục cả ngày, mức tiêu thụ năng lực tính toán của một cá nhân lên tới hàng chục nghìn USD — biện pháp giới hạn lưu lượng chỉ gây ra phẫn nộ.
Khi mọi miếng vá đều thất bại, mới xuất hiện “cuộc đối đầu tập thể” trong tám tuần vừa qua. Nick Turley, người đứng đầu ChatGPT của OpenAI, đã nói thẳng trên podcast BG2: “Ở thời điểm hiện tại, việc cung cấp gói không giới hạn có thể giống như việc cung cấp gói điện không giới hạn.”
03 Vỏ ngoài còn nguyên, lõi bên trong đã chết
Dĩ nhiên, cũng có một phản bác nghe rất thuyết phục: mô hình đăng ký rõ ràng vẫn đang hoạt động tốt. ChatGPT Plus vẫn giữ giá 20 USD/tháng, Claude Pro vẫn đang bán, thậm chí tính năng hỗ trợ viết mã của GitHub vẫn duy trì mô hình gói tháng. Việc gọi đây là “sự sụp đổ” có phải là nói quá không?
Phản bác này xứng đáng được xem xét nghiêm túc, vì hiện tượng nó mô tả là có thật. Nhưng nó nhìn nhầm cái đang chết.
Hồn cốt của mô hình đăng ký chưa bao giờ là hình thức “trừ tiền hàng tháng”, mà là cam kết “giá cố định, sử dụng thoải mái” — bạn không cần tính toán chi phí cho từng lần sử dụng, chính điều này từng là toàn bộ lý do giúp nó chiến thắng mô hình trả phí theo lần.
Và điều đang xảy ra hiện nay là: chu kỳ trừ tiền vẫn còn, nhưng cam kết đã bị rút đi.
10 USD/tháng của GitHub Pro chứa đúng 10 USD “điểm sử dụng”, dùng hết là dừng — đây không phải mô hình đăng ký, mà là thẻ nạp tiền trước khoác áo mô hình đăng ký. “Điểm sử dụng” của Anthropic được khấu trừ theo mức giá API, của OpenAI hỗ trợ nạp tiền tự động. Mô hình đăng ký sẽ không bị hủy bỏ, mà sẽ bị rút ruột: vỏ ngoài còn nguyên, lõi bên trong đã chết.

Thông báo chính thức của GitHub về việc chuyển Copilot sang mô hình thanh toán bằng AI Credits|Nguồn ảnh: GitHub
Vẫn còn một vùng đất cuối cùng còn nguyên vẹn: trò chuyện thuần túy. Nó vẫn có thể duy trì mô hình gói tháng vì đây là tình huống cuối cùng trong AI mà mức tiêu thụ vẫn bị giới hạn bởi thời gian của con người. Nhưng hào quang không thể bảo vệ vùng đất cuối cùng này — mỗi đồng nghiên cứu trong ngành đều nhằm đẩy AI từ “bạn hỏi – nó trả lời” sang “nó chủ động giúp bạn hoàn thành”.Mô hình đăng ký trò chuyện sẽ không bị tiêu diệt, mà sẽ bị đẩy ra rìa: đứng yên tại chỗ, chứng kiến giá trị thực sự và doanh thu thực sự dần chuyển hẳn sang thế giới thanh toán theo mức sử dụng.
Còn một trùng hợp về thời điểm rất khó bỏ qua: Theo báo cáo của TechCrunch (tháng 6 năm 2026), đúng vào thời điểm Fable 5 ra mắt, Anthropic đang cùng OpenAI chuẩn bị niêm yết. Trong ba năm qua, khoản trợ giá được tài trợ bởi vốn đầu tư mạo hiểm; còn nhà đầu tư thị trường công khai sẽ không chấp nhận một báo cáo kết quả kinh doanh trong đó “càng có thêm người dùng nặng thì càng lỗ thêm”. Lịch trình rút vốn của nhà đầu tư quyết định rằng cuộc đối đầu không thể hoãn vô thời hạn.
Điều này mang ý nghĩa khác nhau đối với từng nhóm đối tượng. Với doanh nghiệp, chi phí AI giờ đây phải được quản lý như chi phí điện toán đám mây — theo báo cáo của The Information, CTO của Uber trong bản ghi nhớ nội bộ cho biết công ty đã tiêu hết toàn bộ ngân sách AI cho năm 2026 chỉ trong bốn tháng; việc lập ngân sách, lắp đặt giám sát và định tuyến mô hình theo từng tác vụ sẽ trở thành môn học bắt buộc đối với mọi đội nhóm. Với người dùng cá nhân, trước đây người dùng nhẹ trợ giá cho người dùng nặng, còn bây giờ, mỗi người tự trả tiền cho “đồng hồ điện” của mình.

Việc chuyển đổi ngân sách AI của Uber cũng gây ra tranh cãi đáng kể|Nguồn ảnh: The Information
Thành thật mà nói, điều này chưa chắc toàn là điều xấu. Khi tín hiệu giá quay trở lại, lần đầu tiên câu hỏi “liệu tác vụ này có đáng để AI thực hiện?” trở thành một vấn đề thực sự — và khi một ngành bắt đầu nghiêm túc trả lời câu hỏi ấy, thường là lúc nó thoát khỏi câu chuyện “đốt tiền” để bước vào giai đoạn kinh doanh bình thường.
Viết đến đây, tôi muốn chèn một câu: Trước khi “đồng hồ điện” được lắp đặt, mô hình đăng ký hiện tại có thể là khoảnh khắc hào phóng nhất mà ngành này dành cho người dùng — hãy tận dụng, hãy trân trọng.
Lý luận nằm ngay trong bảng của SemiAnalysis. Đọc dưới góc nhìn người dùng, bảng này thực chất không phải bản án tử hình, mà là danh sách phúc lợi vẫn còn hiệu lực: bạn trả 200 USD/tháng, nền tảng đồng hành cùng bạn tiêu thụ tối đa 14.000 USD năng lực tính toán. Mức trợ giá mạnh mẽ như vậy, lần gần nhất xuất hiện là trong các cuộc chiến gọi xe và giao đồ ăn — và kết cục của hai cuộc chiến ấy chúng ta đều biết: sau khi trợ giá kết thúc, giá chưa bao giờ quay lại mức cũ.
Vì vậy, hãy tranh thủ chạy ngay những tác vụ nặng. Ví dụ như cửa sổ Fable 5 còn trong gói đăng ký chỉ kéo dài đến ngày 22 tháng 6, thay vì chờ đến khi mô hình “điểm sử dụng” áp dụng rồi mới tính toán chi li, hãy sắp xếp ngay những tác vụ dài mà bạn đã muốn chạy từ lâu nhưng ngại giá cao. Việc này không phải “lợi dụng kẽ hở” — chỉ đơn giản là trở thành người hưởng lợi tỉnh táo trong một sai lệch định giá tất yếu sẽ được điều chỉnh.

So sánh của Turley có thể sâu sắc hơn cả điều ông muốn diễn đạt. Dấu mốc thực sự để điện trở thành cơ sở hạ tầng không phải khi nó được đưa đến từng hộ gia đình, mà là khi mỗi hộ đều lắp đặt “đồng hồ điện” — từ khoảnh khắc ấy, không ai còn bàn luận “điện có nên bán theo gói tháng hay không”, mà chỉ thảo luận giá điện.
Mô hình đăng ký sẽ không có cáo phó. Nó chỉ lặng lẽ biến thành một dòng chữ nhỏ trong bảng sao kê chi tiêu của bạn mang tên “phí gia nhập” vào một ngày thanh toán bình thường nào đó.
Trước khi điều đó xảy ra — hãy tận dụng, hãy trân trọng.
Chào mừng tham gia cộng đồng chính thức TechFlow
Nhóm Telegram:https://t.me/TechFlowDaily
Tài khoản Twitter chính thức:https://x.com/TechFlowPost
Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News












