
Cuộc chiến trợ cấp “token” giữa các ông lớn AI đã gần kết thúc chưa?
Tuyển chọn TechFlowTuyển chọn TechFlow

Cuộc chiến trợ cấp “token” giữa các ông lớn AI đã gần kết thúc chưa?
Còn có thể giảm thêm 80%.
Tác giả|Vũ Hàng Viên
Token đắt, đốt tiền khiến người dùng xót xa.
Đây không chỉ là tiếng lòng chung của những người say mê “lập trình cảm xúc” (Vibe Coding) hiện nay, mà ngay cả các “ông lớn” Thung lũng Silicon từng nhiệt thành cổ vũ phong trào “tối đa hóa token” (Tokenmaxxing) cũng bắt đầu lần lượt áp dụng giới hạn sử dụng token đối với nhân viên nội bộ.
Thế nhưng, một điều phản trực quan hơn là: hiện tại, những người đang sử dụng dịch vụ AI theo mô hình đăng ký thực chất đã được các “ông lớn” AI trợ giá token — mức trợ giá cao nhất thậm chí có thể lên tới 70 lần phí đăng ký !
Điều đáng lo ngại hơn nữa là hai “đầu tàu” AI — OpenAI và Anthropic — đều đã bước vào giai đoạn nước rút chuẩn bị niêm yết trên thị trường chứng khoán. Khi hai công ty này chính thức lên sàn, liệu chúng ta sẽ chứng kiến kịch bản tương tự “cuộc chiến trợ giá” thời kỳ Internet, khi các doanh nghiệp còn sót lại đồng loạt tăng giá đơn hàng, khiến giá token trở về mức hợp lý?
Tin tốt là điều này có thể sẽ không xảy ra. Gần đây, Bill Maris — nhà sáng lập Google Ventures — đã đặt ra một câu hỏi trong podcast All-in:
Nếu Google quyết định cắt giảm giá token thêm 80%, OpenAI và Anthropic sẽ phản ứng như thế nào?
Cùng lúc đó, không lâu trước đây, khởi nghiệp Agnes AI trong buổi livestream cùng GeekPark đã giải thích chi tiết về khả năng sắp tới của “kỷ nguyên token miễn phí” .
Vậy giá token trong tương lai sẽ tăng hay giảm? Và điều này sẽ mang ý nghĩa gì đối với những người đã “nghiện” AI?
01 Trợ giá token đã “bốc khói”
Tại sao nói giá token hiện tại thực tế không hề đắt?
Bởi ít nhất trong mô hình đăng ký AI, mức giá hiện hành của các công ty AI đều đã là “giá siêu hời” sau khi được trợ giá.
Gần đây, SemiAnalysis đã tiến hành đánh giá chi tiết so sánh giá trị thực tế của token tiêu thụ với phí đăng ký trên các mô hình đăng ký của OpenAI và Anthropic.
SemiAnalysis làm một việc đơn giản nhưng hiệu quả: thực tế sử dụng AI trên các gói đăng ký khác nhau của các nền tảng AI để hoàn thành nhiều nhiệm vụ, sau đó tính ngược giá trị token dựa trên bảng giá API công khai. Kết quả như sau:

Hãy chú ý một quy luật: gói càng đắt, mức độ trợ giá càng cao. Điều này bản thân nó đã cho thấy các gói cao cấp này không nhằm mục đích sinh lời — chúng là một dạng “định giá nghịch đảo”, chấp nhận lỗ nặng nhất để giữ chân người dùng “nặng ký” nhất. Bởi vì nhóm người dùng này chính là các nhà phát triển và nhà ra quyết định doanh nghiệp; một khi họ đã gắn bó với một nền tảng nào đó, họ sẽ kéo theo cả đội ngũ và toàn bộ chuỗi sản phẩm phía sau.
Lỗ đến mức này, vì sao vẫn tiếp tục? Câu trả lời chuẩn là: trước tiên đốt tiền để mở rộng quy mô, sau đó tăng giá để bù đắp. Thời kỳ Internet di động đã vận hành theo cách này — Didi và Uber trợ giá hàng trăm tỷ Nhân dân tệ cho dịch vụ gọi xe, và sau khi kết thúc trợ giá, giá gọi xe tăng lên; Meituan trợ giá vô số đơn giao đồ ăn, và sau khi kết thúc trợ giá, phí giao hàng tăng lên. Tuy nhiên, logic này chỉ có thể đứng vững nếu tồn tại một điều kiện then chốt: hiệu ứng “khóa” (locking effect) trong giai đoạn trợ giá.
Didi có thể tăng giá vì tài xế không thể rời bỏ luồng đơn hàng trên nền tảng, và hành khách không thể rời bỏ mạng lưới tài xế trên nền tảng. Meituan có thể tăng giá vì chủ cửa hàng không thể rời bỏ lượng truy cập và mạng lưới giao hàng của mình. Khi trợ giá kết thúc, người dùng đã bị “khóa” chặt trong hệ sinh thái, chi phí chuyển đổi trở nên cực kỳ cao.
Nhưng cuộc chiến AI có một điểm khác biệt căn bản so với Internet — token gần như không tạo ra hiệu ứng “khóa”.
Nếu Claude tăng giá, các nhà phát triển có thể chuyển API sang GPT hoặc Gemini chỉ trong một ngày — các giao diện ngày càng chuẩn hóa, nhiều framework phát triển thậm chí tích hợp sẵn chức năng chuyển đổi giữa nhiều mô hình. Với người dùng thông thường còn đơn giản hơn: chỉ cần đổi địa chỉ URL là xong. AI không giống dịch vụ gọi xe có mạng lưới tài xế địa phương, không giống dịch vụ giao đồ ăn có hệ thống giao hàng, cũng không giống mạng xã hội có chuỗi quan hệ bạn bè. Token là token, bất kể do công ty nào sản xuất, đều là thứ giống nhau.
Điều này đồng nghĩa rằng, một khi trợ giá chấm dứt, người dùng có thể rời đi ngay lập tức. Trợ giá không phải đang “xây dựng rào cản”, mà giống như đang “duy trì nhịp tim” — chỉ cần có bên nào đưa ra mức giá thấp hơn, người dùng sẽ chạy theo.
Chưa kể đến một yếu tố mới đang khiến hóa đơn của mọi người mất kiểm soát: AI Agent.
Khi bạn trò chuyện với ChatGPT, một cuộc hội thoại có thể tiêu tốn vài nghìn token. Nhưng khi bạn yêu cầu AI Agent thực hiện một nhiệm vụ phức tạp — viết mã rồi tự động gỡ lỗi, phân tích một tài liệu dày vài chục trang rồi tạo báo cáo — thì trong một vòng xử lý, lượng token tiêu thụ có thể cao gấp 5–30 lần so với một cuộc trò chuyện thông thường. Một nhà phát triển đã thử nghiệm thực tế: chỉ một phiên lập trình bằng AI Agent trên gói Claude Max trị giá 100 USD đã tiêu tốn token trị giá gần 100 USD. Gần đây, CTO của Uber tiết lộ công ty đã “đốt sạch” toàn bộ ngân sách AI dành cho năm 2026 chỉ trong bốn tháng.
Vấn đề là: cuộc chiến trợ giá token này có thể kéo dài bao lâu? Ai sẽ là người cuối cùng còn đứng vững sau cuộc hỗn chiến?
Bill Maris cho rằng câu trả lời rõ ràng là các tập đoàn truyền thống.
02 Token như một vũ khí
Để hiểu rõ sự tàn khốc thực sự của cuộc chiến trợ giá này, trước hết cần nhìn thấu một sự bất cân xứng cấu trúc — nguồn “đạn dược” của các bên tham chiến hoàn toàn khác nhau.
Google mỗi năm thu hơn 300 tỷ USD từ quảng cáo. Đây không phải tiền nhà đầu tư, cũng không phải vốn huy động để đốt, mà là một “máy in tiền” hoạt động tự động mỗi ngày. Hàng tỷ người trên toàn thế giới mỗi ngày mở công cụ tìm kiếm, xem YouTube, dùng Gmail — tiền quảng cáo tự động chảy vào tài khoản. Google không cần thuyết trình, không cần lấy lòng các nhà phân tích, cũng không cần giải thích với bất kỳ ai lý do vì sao phải chi khoản tiền này.
Google dùng lợi nhuận quảng cáo để trợ giá token AI, giống như một người sở hữu giếng dầu đi đấu giá với các trạm xăng — dầu của anh ta tự phun lên từ mảnh đất riêng, trong khi dầu của đối thủ phải vay ngân hàng để mua.
OpenAI và Anthropic chính là những người vay tiền mua dầu.
OpenAI đã huy động tổng cộng hơn 180 tỷ USD, định giá mới nhất vượt 850 tỷ USD. Anthropic đã huy động hơn 130 tỷ USD. Số tiền này đến từ các quỹ đầu tư mạo hiểm và nhà đầu tư chiến lược — họ đầu tư không phải vì thiện nguyện, mà kỳ vọng các công ty này sẽ niêm yết và đem lại khoản lợi nhuận khổng lồ khi thoái vốn.
Nhưng việc niêm yết mới thực sự là khởi đầu của rắc rối. Niêm yết đồng nghĩa với việc báo cáo tài chính phải công khai với toàn thế giới. Mỗi quý, các nhà phân tích Phố Wall sẽ theo dõi doanh thu, lợi nhuận, chi phí thu hút người dùng, chi phí biên. Khi họ tính ra cứ mỗi 1 USD phí đăng ký bạn thu vào, bạn thực tế lỗ tới 70 USD — thì dù câu chuyện tăng trưởng ngoạn mục đến đâu cũng không thể cứu nổi giá cổ phiếu.
Bill Maris đã diễn giải logic này một cách rất thẳng thắn trong podcast. Ông nói nguyên văn: “Nếu tôi là Google, quyết định cắt giảm giá token tùy ý 80%, thì mô hình kinh doanh của OpenAI và Anthropic sẽ ra sao?”
Người dẫn chương trình hỏi xác suất xảy ra điều này là bao nhiêu. Maris không ngần ngại đáp: “100%. Capital as a weapon, tokens as a weapon (vốn là vũ khí, token là vũ khí).”
Đây không phải suy đoán của nhà phân tích. Bill Maris là nhà sáng lập kiêm CEO của Google Ventures, đồng thời là Phó Chủ tịch các Dự án Đặc biệt của Google, từng ươm tạo Waymo và Google X. Tất cả những người có mặt đều hiểu rõ: đây không phải một giả định, mà là ông đã từng tận mắt chứng kiến Google chiến đấu như thế nào.
Kịch bản ông mô tả rất đơn giản: Google tuyên bố giảm giá API Gemini 80%. Khách hàng doanh nghiệp sẽ làm gì? Nếu chất lượng sản phẩm gần như tương đương — trong nhiều bài kiểm tra chuẩn, Gemini đã ngang ngửa với Claude và GPT — nhưng giá rẻ hơn 4/5, bạn còn tiếp tục dùng cái đắt hơn sao?
Maris tự trả lời: “Nếu bạn là một công ty, có thể tiết kiệm 80% chi phí khi mua sản phẩm cơ bản tương đương từ Google và Gemini, thì tại sao bạn không làm vậy? Áp lực lên các công ty kia sẽ trở nên vô cùng nghiêm trọng.”
Trong khi đó, OpenAI và Anthropic gần như không có biện pháp phản công đối xứng. Họ không thể hạ giá theo — bởi họ không có “máy in tiền”, mỗi đô la đều là tiền của nhà đầu tư. Họ cũng không thể duy trì mức giá cao nhờ lợi thế kỹ thuật — khoảng cách giữa các mô hình ngôn ngữ lớn đang thu hẹp nhanh chóng: hôm nay bạn dẫn trước ba tháng, ba tháng sau đã bị đuổi kịp. Điều này khác xa khoảng cách thế hệ công nghệ giữa iPhone và Nokia. Thành trì bảo vệ giữa các mô hình AI giống như đê cát, thủy triều dâng lên là tràn qua ngay.
Theo cách kể chuyện của Bill, Google có nhiều khả năng chiến thắng, nhưng trong thế giới AI, liệu Google thực sự có thể độc quyền? Meta随时 có thể mã nguồn mở một mô hình miễn phí, Trung Quốc có DeepSeek và ByteDance, Amazon đang đẩy mạnh mô hình riêng của mình. Khi bạn đã ép giá token xuống mức “rẻ như rau”, đối thủ không biến mất — họ cũng đang hạ giá.
Cuộc chiến AI có thể không có người chiến thắng.
03 Trò chơi “vô hạn” của token?
Ngay cả người ít am hiểu lịch sử nhất cũng phần nào có thể phỏng đoán kịch bản kết cục của cuộc chiến AI hiện nay như sau:
Thứ nhất là kịch bản “dịch vụ Internet” — câu chuyện của Didi, của Amazon: trước tiên trợ giá, sau đó độc quyền, rồi tăng giá để thu hoạch. Trong kịch bản này, cuộc chiến giá hiện tại chỉ là phần mở đầu, cuối cùng sẽ có một hoặc hai bên chiếm phần lớn thị trường và giành quyền định giá. Nếu vậy, khoản lỗ khổng lồ hiện nay sẽ là một khoản đầu tư hợp lý — giống như Amazon lỗ suốt hai thập kỷ, cuối cùng trở thành bá chủ cả thương mại điện tử lẫn điện toán đám mây.
Thứ hai là kịch bản “điện – nước – gas” — token trở thành một nguồn lực cơ sở chuẩn hóa, giống như điện, băng thông hay lưu trữ đám mây. Không bên nào có thể duy trì quyền định giá lâu dài, bởi sản phẩm quá giống nhau và chi phí chuyển đổi quá thấp. Cạnh tranh sẽ ép giá xuống sát mức chi phí, lợi nhuận tiến gần về 0. Cuối cùng, chính phủ có thể can thiệp quản lý — giống như cách họ từng làm với ngành điện và viễn thông cách đây một thế kỷ.
Sự phân chia giữa hai kịch bản phụ thuộc vào một từ khóa:
Khóa (Lock-in).
Didi có thể tăng giá vì hành khách bị “khóa” trong mạng lưới tài xế, và tài xế cũng bị “khóa” trong luồng đơn hàng. Amazon có thể tăng giá vì chủ cửa hàng bị “khóa” trong hệ sinh thái logistics và lưu lượng truy cập của họ.
Hiệu ứng “khóa” là nền tảng cốt lõi của mô hình “lỗ trước, lãi sau”.
Nhưng token AI — như đã lập luận nhiều lần ở trên — gần như không tồn tại hiệu ứng “khóa”. Các API ngày càng chuẩn hóa, chi phí chuyển đổi gần như bằng 0. Điều kiện then chốt để kịch bản thứ nhất thành hiện thực không tồn tại đối với sản phẩm token.
Nếu kịch bản thứ hai — kết cục “cơ sở hạ tầng điện – nước – gas” — mới gần với thực tế hơn, thì điều chúng ta đang chứng kiến không phải một cuộc chiến cuối cùng sẽ phân định thắng bại, mà là một cuộc đua tiêu hao không hồi kết.
Vương Hưng — nhà sáng lập Meituan — từng mô tả trạng thái cạnh tranh này. Nhận định sâu sắc của ông là: một số cuộc cạnh tranh không tồn tại khái niệm “thắng”. Mục tiêu của các bên tham gia không phải đánh bại đối thủ, mà là đảm bảo mình luôn ngồi trên bàn chơi. Bởi chỉ cần còn ở trên bàn, bạn vẫn có thể tiếp tục huy động vốn, tuyển người và cải tiến sản phẩm. Việc rời khỏi bàn chơi mới là thất bại duy nhất.
Áp dụng khung tư duy này để nhìn lại cục diện AI hiện nay, nhiều điều tưởng chừng mâu thuẫn bỗng trở nên rõ ràng.
Định giá mới nhất của OpenAI vượt 800 tỷ USD không phải vì việc huấn luyện mô hình đòi hỏi nhiều tiền đến vậy. Mà vì họ cần số tiền ấy để tiếp tục cuộc chiến giá. Việc huy động vốn không nhằm mục đích chiến thắng, mà để “có tư cách tiếp tục chiến đấu”.
Google chuẩn bị cắt giảm giá token 80% không phải để tiêu diệt OpenAI và Anthropic. Mà để đảm bảo mình luôn là người chơi cốt lõi trong kỷ nguyên AI — giống như cách họ từng tung Android miễn phí để đảm bảo không bị bỏ lại phía sau trong kỷ nguyên di động.
Còn Anthropic nâng giá API cho mô hình flagship mới nhất Fable 5 lên gấp đôi so với thế hệ trước — đầu vào 10 USD/một triệu token, đầu ra 50 USD/một triệu token — trông như đang “tăng giá”, thực chất là chủ động sàng lọc các khách hàng doanh nghiệp sẵn sàng trả tiền cho khả năng cao cấp, bởi họ hiểu rõ: cuộc chiến trợ giá ở phân khúc tiêu dùng là không thể thắng Google.
Mỗi đợt chiến tranh giá đều mở rộng quy mô sử dụng AI. Quy mô mở rộng đồng nghĩa với nhiều dữ liệu hơn, nhiều tình huống ứng dụng hơn, và nhiều nhà phát triển hơn đổ vào hệ sinh thái. Điều này khiến mô hình của tất cả các bên tham gia ngày càng mạnh hơn. Các bên tham chiến sử dụng chính cuộc chiến để thu hút nguồn lực nâng cấp bản thân — đây không phải một trò chơi “tổng bằng không” nơi kẻ này thắng thì người kia thua, mà là một quá trình tất cả cùng mạnh lên thông qua cạnh tranh, song cũng khó lòng thu được lợi nhuận khổng lồ.
Nghe có vẻ giống ngành điện cuối cùng sẽ ra sao không?
140 năm trước, Edison và Westinghouse đều nghĩ họ đang tranh giành một thị trường “người thắng nắm hết”. Họ đổ toàn bộ tài sản vào cuộc đua, cá cược rằng “ai thiết lập tiêu chuẩn điện, người đó sẽ sở hữu điện”. Nhưng số phận ngành điện đã dạy chúng ta một chân lý giản dị:
Khi một công nghệ đủ quan trọng, đủ phổ quát và đủ chuẩn hóa, nó sẽ không còn thuộc về bất kỳ công ty nào. Nó thuộc về cơ sở hạ tầng.
Cuộc cạnh tranh AI bề ngoài là Google đấu OpenAI đấu Anthropic, là so sánh năng lực mô hình, là so quy mô huy động vốn. Nhưng nếu lùi xa ra để nhìn tổng thể, vai trò thực sự của cuộc cạnh tranh này là: nó đang đẩy nhanh quá trình đưa AI lên một tầng bậc cơ sở hạ tầng — nơi không công ty nào có thể độc chiếm.
Khi Bill Maris nói “chắc chắn sẽ xảy ra”, ông có thể không chỉ đang tiên đoán Google sẽ giảm giá. Ông có thể vô tình tiên đoán một xu hướng lớn hơn — trong thế giới AI, token cuối cùng sẽ không thuộc về bất kỳ ai. Cũng như ngày nay không ai “sở hữu” điện.
Đối với OpenAI và Anthropic, điều này hàm ý một điều khiến họ bất an: ngay cả khi dẫn đầu về công nghệ, ngay cả khi huy động được khối lượng vốn khổng lồ, tương lai “kiếm bộn nhờ AI” mà họ theo đuổi có thể từ đầu đã không tồn tại. Họ đang đối mặt không phải một cuộc chiến giá tạm thời, mà là một số phận cấu trúc — thứ họ đang cố gắng xây dựng, bản chất có thể chính là “đường cao tốc, điện và nước” của thế hệ kế tiếp.
Còn đối với người dùng, xét về một khía cạnh nào đó, đây có thể là tin tốt. Bởi miễn là cuộc chiến trợ giá token còn tiếp diễn, người dùng vẫn sẽ tiếp tục được hưởng “giao dịch hời”: chi 20 USD nhưng nhận được sức mạnh tính toán trị giá 400 USD.
Chào mừng tham gia cộng đồng chính thức TechFlow
Nhóm Telegram:https://t.me/TechFlowDaily
Tài khoản Twitter chính thức:https://x.com/TechFlowPost
Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News














