
Khi giá token cao hơn con người, “kể chuyện về AI” sẽ gặp rắc rối
Tuyển chọn TechFlowTuyển chọn TechFlow

Khi giá token cao hơn con người, “kể chuyện về AI” sẽ gặp rắc rối
Hiện tại không phải là bong bóng kiểu năm 1999, nhưng câu chuyện “sự gia tăng lượng token được tiêu thụ đồng nghĩa với thành công của quá trình chuyển đổi AI” cuối cùng sẽ sụp đổ.
Tác giả: Bào Yìlóng
Nguồn: WallStreetCN
Tính hợp lý của chi tiêu AI doanh nghiệp đang chịu sự kiểm định nghiêm ngặt: lượng token tiêu thụ liên tục tăng cao, trong khi giá trị thương mại có thể đo lường được lại khó tìm thấy.
Ngày 22 tháng 5, Andrew Macdonald – Giám đốc Điều hành (COO) của Uber, công ty có vốn hóa thị trường trên 200 tỷ USD – đã công khai phát biểu trong một chương trình podcast rằng “mối liên hệ giữa mức tăng tiêu thụ token và cải thiện thực chất của sản phẩm vẫn chưa tồn tại”.
Macdonald chỉ ra rằng việc biện minh hợp lý cho chi phí AI ngày càng gia tăng đang trở nên khó khăn hơn bao giờ hết. Ông thậm chí còn tự sáng tạo một thuật ngữ để mô tả hiện tượng lãng phí nội bộ trong đội ngũ kỹ sư: “tokenmaxxing” (cực đại hóa token).
Trước đó vào giữa tháng 5, Microsoft đã bắt đầu cắt giảm giấy phép sử dụng Claude Code nội bộ với lý do “hóa đơn token không còn bền vững”.
Hai sự kiện này cộng hưởng khiến thị trường buộc phải đối mặt với một biến số từng bị bỏ qua trước đây: Kinh tế học token – tức là hiệu quả kinh tế đơn vị của việc tiêu thụ token ở quy mô doanh nghiệp – đã từ một chủ đề ngoại vi vươn lên thành trụ cột trọng yếu trong toàn bộ luận cứ đầu tư AI.
Năm nhóm dữ liệu phác họa một bức tranh mới
Kể từ tháng 4, nhiều nhóm dữ liệu liên tiếp được công bố, cùng nhau vẽ nên một bức tranh đáng báo động.
Tháng 4 năm nay, Giám đốc Công nghệ (CTO) của Uber công khai tiết lộ rằng công ty đã “đốt cháy” toàn bộ ngân sách hàng năm dành cho Claude Code chỉ trong vòng bốn tháng.
Trong số 5.000 kỹ sư, tỷ lệ sử dụng hàng tháng dao động từ 84% đến 95%; hóa đơn trung bình mỗi người mỗi tháng dao động từ 150 USD đến 2.000 USD; riêng vị CTO này, theo báo cáo, đã tiêu tốn token trị giá 1.200 USD chỉ trong một buổi trình diễn nội bộ kéo dài hai giờ.
Macdonald mô tả phản ứng của mình khi biết con số này là “kinh ngạc đến mức không thốt nên lời”.
Về phía Microsoft, theo bản tin Notepad của Tom Warren thuộc The Verge, Claude Code nhanh chóng lan rộng trong đội ngũ kỹ sư nội bộ, song mô hình tính phí dựa trên token khiến chi phí quy mô lớn trở nên không bền vững, dẫn đến việc Microsoft nhanh chóng tiến hành cắt giảm các giấy phép liên quan.
GitHub thông báo kể từ ngày 1 tháng 6, tất cả các gói Copilot sẽ chuyển từ mô hình đăng ký cố định sang thanh toán theo mức sử dụng.
Bài đăng thảo luận chính thức thu hút gần 900 phiếu phản đối, nguyên nhân là một số người dùng tính toán rằng một phiên lập trình bằng agent thông minh thường tiêu tốn từ 30–40 USD, nghĩa là một gói dịch vụ 10 USD/tháng sẽ cạn kiệt ngay sau một lần sử dụng.
Entelligence.AI – nền tảng nâng cao năng suất cho nhà phát triển – tổng hợp dữ liệu từ 2.444 doanh nghiệp và phát hiện:
- Cứ mỗi 1 USD chi cho phí token AI, chỉ có 18 xu tạo ra giá trị thực tế đến người dùng.
- 44 xu dùng để sửa lỗi do chính AI gây ra; 27 xu chi cho công việc làm lại; 11 xu tiêu tốn vào chi phí kiểm tra, rà soát.
Theo Chỉ số Chi tiêu Token LLM của Bloomberg Silicon Data, giá token đã tăng khoảng 65% kể từ cuối tháng 2 năm nay; giá phần mềm AI tại Mỹ tăng tích lũy 20–37% trong vòng một năm qua.
Tranh luận tăng/giảm: Cùng một sự thật, hai cách diễn giải
Cùng một tập dữ liệu, dưới các khuôn khổ phân tích khác nhau, lại dẫn tới những kết luận hoàn toàn trái ngược.
Quan điểm tăng (bullish) cho rằng tình trạng hỗn loạn hiện tại chỉ là “đau đẻ” trong quá trình chuyển đổi thành công.
Theo đánh giá của Jim Schneider (Goldman Sachs) đầu tháng 5, đến năm 2030, AI dạng agent sẽ đẩy lượng tiêu thụ token tăng gấp 24 lần, đạt khoảng 120 triệu tỷ tỷ token mỗi tháng; biên lợi nhuận gộp của các nhà cung cấp điện toán đám mây quy mô siêu lớn và nhà cung cấp mô hình sẽ chuyển sang dương trong vòng 3–12 tháng tới.
Rich Privorotsky (Goldman Sachs) lại cho rằng quý I năm 2026 có thể đã là đỉnh cao của chỉ số “cực đại hóa token” như một KPI, và ngành công nghiệp đang chuyển từ chạy theo khối lượng tiêu thụ sang một thước đo lành mạnh hơn: “chi phí cho mỗi hành động hiệu quả”.
Nghiên cứu kinh tế của JPMorgan cũng chỉ ra rằng đầu năm 2026, số lượng gói Python mới và cập nhật trên PyPI tăng vọt – một xu hướng chưa từng xuất hiện vào thời điểm ChatGPT ra mắt năm 2022, cho thấy sự gia tăng năng suất thực sự đang diễn ra.
Ngoài ra, tỷ lệ P/E hiện tại của Nhóm 7 Công nghệ (Mag 7) vào khoảng 20 lần lợi nhuận kỳ vọng, thấp xa so với mức đỉnh bong bóng công nghệ năm 2000 (52 lần), mức đỉnh Nhật Bản năm 1989 (67 lần) hay thời kỳ “Những cổ phiếu tuyệt đẹp 50” (34 lần). Theo chuẩn mực lịch sử về bong bóng, hiện trạng hiện nay chưa cấu thành một bong bóng.
Quan điểm giảm (bearish) được Jim Covello – nhà phân tích bán dẫn của Goldman Sachs – trình bày hệ thống nhất trong báo cáo tháng 4.
Ông chỉ ra rằng gần như toàn bộ giá trị trong chuỗi cung ứng AI đều chảy về các công ty bán dẫn – một hiện tượng chưa từng có tiền lệ trong lịch sử và không thể bền vững. Các công ty chip lẽ ra chỉ nên hưởng lợi khi khách hàng của họ được hưởng lợi, nhưng trong chu kỳ này, sự thịnh vượng của họ lại được xây dựng trên sự hao mòn của toàn bộ chuỗi cung ứng phía trên.
Lợi nhuận ròng của NVIDIA tăng khoảng 20 lần kể từ khi ChatGPT ra mắt; các nhà cung cấp điện toán đám mây quy mô siêu lớn đã cạn kiệt dòng tiền hoạt động và chuyển sang đi vay – khối lượng phát hành nợ liên quan đến trung tâm dữ liệu năm 2025 dự kiến khoảng 182 tỷ USD, tăng gấp đôi so với năm 2024.
Nghiên cứu của MIT Nanda cho thấy 95% doanh nghiệp đầu tư vào AI sinh tổng hợp không thu được bất kỳ lợi nhuận nào. Sự mất kết nối này có thể duy trì trong một thời gian, nhưng không thể kéo dài mãi.
Lo ngại về cấu trúc tài trợ vòng lặp
Cuộc tranh luận này còn chạm đến một tầng phức tạp hơn: vòng tuần hoàn tài chính giữa các nhà cung cấp điện toán đám mây quy mô siêu lớn và các phòng thí nghiệm AI.
Theo các tài liệu công bố doanh nghiệp được The Information tổng hợp, OpenAI và Anthropic chiếm hơn một nửa trong tổng cam kết dịch vụ điện toán đám mây tương lai trị giá khoảng 2.000 tỷ USD của Microsoft, Oracle, Google và Amazon. Cụ thể:
- Trong danh mục đơn đặt hàng chờ xử lý trị giá 627 tỷ USD của Microsoft, 280 tỷ USD gắn với OpenAI;
- Trong danh mục kinh doanh tiềm năng trị giá 553 tỷ USD của Oracle, 54% (khoảng 300 tỷ USD) do OpenAI cam kết;
- Trong danh mục trị giá 467,6 tỷ USD của Google, Anthropic chiếm 43% (khoảng 200 tỷ USD);
- Oracle cũng có mức độ phơi nhiễm tương ứng chiếm 51% trong danh mục chờ xử lý trị giá 464 tỷ USD của Amazon.
Cấu trúc tài trợ này mang tính vòng lặp nội sinh. Khoản đầu tư 13 tỷ USD của Microsoft vào OpenAI chủ yếu được thực hiện dưới dạng tín dụng Azure, mà OpenAI sau đó dùng để mua sức mạnh tính toán trên Azure; Microsoft ngay lập tức ghi nhận khoản chi tiêu này vào doanh thu điện toán đám mây.
Cùng một nhà cung cấp điện toán đám mây quy mô siêu lớn vừa là nhà đầu tư vốn cổ phần vào phòng thí nghiệm AI, vừa là nhà cung cấp dịch vụ thu phí tính toán.
Cấu trúc này còn hiện rõ trên dữ liệu lợi nhuận. Alphabet công bố lợi nhuận quý I kỷ lục 62,6 tỷ USD, trong đó khoảng 28,7 tỷ USD – gần một nửa – đến từ việc tăng giá trị ghi sổ của cổ phần nắm giữ Anthropic.
Trong lợi nhuận quý I 30,3 tỷ USD của Amazon, 16,8 tỷ USD là khoản lợi nhuận chưa thực hiện trước thuế từ Anthropic; trong khi dòng tiền tự do của Amazon sụt giảm 95%, chỉ còn 1,2 tỷ USD, do chi tiêu vốn cho trung tâm dữ liệu cùng kỳ lên tới 44,2 tỷ USD.
Tính bền vững của hệ thống này phụ thuộc vào khả năng của các phòng thí nghiệm AI trong việc tiếp tục huy động vốn bên ngoài nhằm thực hiện các cam kết điện toán đám mây, điều này lại phụ thuộc vào mức độ sẵn sàng của khách hàng doanh nghiệp trong việc trả hóa đơn token ngày càng tăng.
Theo báo cáo, hiện Anthropic tiêu tốn tới 3 USD chi phí cho mỗi 1 USD doanh thu. Một khi nhịp độ huy động vốn chậm lại, độ tin cậy của dự báo doanh thu điện toán đám mây sẽ suy giảm, kéo theo áp lực điều chỉnh lại hệ số định giá của các nhà cung cấp điện toán đám mây quy mô siêu lớn.
Chuỗi giá trị này truyền dẫn hai chiều, và cũng sẽ đứt gãy hai chiều.
Đây không phải năm 1999, nhưng vấn đề là có thật
Hoàn cảnh hiện tại chưa cấu thành một kịch bản bong bóng điển hình.
Xét về hệ số định giá, Nhóm 7 Công nghệ hiện đang giao dịch ở mức P/E kỳ vọng khoảng 20 lần, thấp xa so với mức đỉnh bong bóng công nghệ năm 2000 (52 lần), mức đỉnh thị trường Nhật Bản năm 1989 (67 lần) hay thời kỳ “Những cổ phiếu tuyệt đẹp 50” (34 lần).
Công nghệ AI là có thật. Đối với nhóm người dùng chuyên sâu, dữ liệu về việc nâng cao năng suất cũng có thể kiểm chứng. Doanh thu hàng năm của OpenAI khoảng 20 tỷ USD, của Anthropic khoảng 4,3 tỷ USD – hai phòng thí nghiệm này sẽ không biến mất.
Hiện nay, chi phí token (chi phí tính toán) đã trở thành yếu tố quyết định thành bại của AI, trong khi nửa năm trước, chủ đề này thậm chí còn không được bàn đến nhiều.
Lúc ấy, mọi người chỉ quan tâm “công nghệ có hoạt động được không”. Giờ đây câu trả lời rất rõ ràng: Với một số công việc cụ thể và một số nhóm người dùng cụ thể, công nghệ thực sự hoạt động hiệu quả.
Nhưng vấn đề mới đã xuất hiện: Liệu khoản tiền doanh nghiệp tiết kiệm được nhờ AI có thể kịp thời truyền ngược lên trên, vượt qua “cửa sổ định giá” mà thị trường vốn dành cho các phòng thí nghiệm AI và các ông lớn điện toán đám mây?
Những người lạc quan về AI cho rằng miễn là công nghệ tiếp tục trưởng thành, ROI (tỷ suất hoàn vốn) của doanh nghiệp sẽ chuyển sang dương trong vòng 1–1,5 năm.
Những người bi quan thì cho rằng sẽ ngày càng nhiều lãnh đạo cấp cao, giống như Macdonald, công khai phàn nàn về tỷ lệ chi tiêu – hiệu quả của AI quá thấp và bắt đầu cắt giảm ngân sách.
Cả hai khả năng này đều đang diễn ra, chưa thể phân thắng bại. Điều duy nhất chắc chắn là lời nói dối cũ – “miễn là lượng token tiêu thụ tăng, nghĩa là chuyển đổi AI thành công” – đã sụp đổ.
Tiêu thụ nhiều token không đồng nghĩa với tạo ra giá trị thương mại; hai bong bóng này cuối cùng đều phải xì hơi. Hóa đơn AI đã đến hạn thanh toán, nhưng cuối cùng ai sẽ là người trả tiền? Hiện vẫn là một ẩn số.
Chào mừng tham gia cộng đồng chính thức TechFlow
Nhóm Telegram:https://t.me/TechFlowDaily
Tài khoản Twitter chính thức:https://x.com/TechFlowPost
Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News











