
Phát hành token ra thị trường quốc tế: Bán điện của Trung Quốc cho toàn thế giới
Tuyển chọn TechFlowTuyển chọn TechFlow

Phát hành token ra thị trường quốc tế: Bán điện của Trung Quốc cho toàn thế giới
Một cuộc chiến tranh điện lực không tiếng súng.
Tác giả: Tôm hùm đen, TechFlow
Mùa hè năm 1858, một sợi cáp đồng chạy ngầm dưới đáy Đại Tây Dương nối liền Luân Đôn và New York.
Ý nghĩa của sự kiện này chưa bao giờ nằm ở tốc độ truyền tải, mà ở cấu trúc quyền lực: bên nào lắp đặt cáp ngầm dưới biển thì bên đó sẽ kiểm soát dòng chảy thông tin. Đế chế Anh nhờ mạng lưới điện báo toàn cầu này đã nắm trong tay mọi thông tin từ thuộc địa, giá cả bông vải, cho đến tin tức chiến tranh.
Sức mạnh của đế chế không chỉ nằm ở hạm đội hải quân, mà còn ở sợi cáp ấy.
Hơn 160 năm sau, logic này đang lặp lại theo một cách thức hoàn toàn bất ngờ.
Năm 2026, các mô hình ngôn ngữ lớn (LLM) Trung Quốc đang âm thầm chiếm lĩnh thị trường nhà phát triển toàn cầu. Dữ liệu mới nhất từ OpenRouter cho thấy, trong tổng lượng token tiêu thụ bởi mười mô hình hàng đầu trên nền tảng, các mô hình Trung Quốc chiếm tới 61%, ba vị trí dẫn đầu đều là sản phẩm của Trung Quốc. Các yêu cầu API do nhà phát triển tại San Francisco, Berlin và Singapore gửi đi mỗi ngày đang vượt qua cáp quang ngầm dưới Thái Bình Dương để đến trung tâm dữ liệu Trung Quốc, nơi sức mạnh tính toán được sử dụng, điện năng được tiêu thụ và kết quả được gửi trở lại.
Điện năng chưa từng rời khỏi lưới điện Trung Quốc, nhưng giá trị của nó đã được chuyển giao xuyên biên giới thông qua token.
Cuộc di cư quy mô lớn của các mô hình AI
Ngày 24 tháng 2 năm 2026, OpenRouter công bố dữ liệu tuần: tổng lượng token tiêu thụ bởi mười mô hình hàng đầu trên nền tảng đạt khoảng 8,7 nghìn tỷ, trong đó các mô hình Trung Quốc chiếm riêng 5,3 nghìn tỷ – tương đương 61%. MiniMax M2.5 với 2,45 nghìn tỷ token vọt lên vị trí số một, tiếp theo là Kimi K2.5 và Zhipu GLM-5; cả ba vị trí dẫn đầu đều đến từ Trung Quốc.

Dữ liệu mới nhất ngày 26 tháng 2
Đây không phải là chuyện ngẫu nhiên — một chồi lửa đã khơi mào tất cả.
Đầu năm nay, OpenClaw xuất hiện như một “cơn gió mới”, một công cụ mã nguồn mở giúp AI thực sự bắt đầu “làm việc”: trực tiếp điều khiển máy tính, thực thi lệnh và song song xử lý các luồng công việc phức tạp; số sao trên GitHub của nó tăng vọt lên hơn 210.000 chỉ trong vòng một tuần.
John – một chuyên gia tài chính – cài đặt OpenClaw ngay lập tức và tích hợp API của Anthropic để tự động giám sát thông tin thị trường chứng khoán và đưa ra tín hiệu giao dịch kịp thời. Vài giờ sau, anh ta nhìn chằm chằm vào số dư tài khoản trong vài giây: vài chục đô la – biến mất.
Đó chính là hiện thực mới mà OpenClaw mang lại. Trước đây, trò chuyện với AI chỉ tiêu tốn vài nghìn token mỗi lần – chi phí gần như có thể bỏ qua. Nhưng sau khi tích hợp OpenClaw, AI chạy đồng thời hàng chục tác vụ nền, liên tục gọi lại ngữ cảnh và lặp lại vòng lặp – mức tiêu thụ token không còn tuyến tính, mà tăng theo cấp số nhân. Hóa đơn tiền thanh toán giống như chiếc xe đang tăng tốc với nắp capô mở toang, kim đồng hồ xăng tụt không ngừng.
Một “chiêu hay” nhanh chóng lan truyền trong cộng đồng nhà phát triển: dùng mã thông báo OAuth để kết nối trực tiếp tài khoản đăng ký Anthropic hoặc Google với OpenClaw, biến hạn mức “vô hạn” theo tháng thành nhiên liệu miễn phí cho Agent AI – phương pháp mà nhiều nhà phát triển đã áp dụng.
Phản ứng chính thức từ phía nhà cung cấp nhanh chóng xuất hiện.
Anthropic cập nhật thỏa thuận vào ngày 19 tháng 2, rõ ràng cấm sử dụng thông tin đăng nhập đăng ký Claude cho các công cụ bên thứ ba như OpenClaw; muốn tích hợp chức năng Claude, bắt buộc phải sử dụng kênh API có tính phí. Google thậm chí còn chặn hàng loạt tài khoản đăng ký được kết nối với Antigravity và Gemini AI Ultra thông qua OpenClaw.
“Thiên hạ căm ghét bạo chính đã lâu”, John lập tức chuyển sang ôm lấy các mô hình ngôn ngữ lớn nội địa.
Trên OpenRouter, mô hình nội địa MiniMax M2.5 đạt điểm 80,2% trong các nhiệm vụ kỹ thuật phần mềm, so với 80,8% của Claude Opus 4.6 – chênh lệch gần như không đáng kể. Nhưng giá cả lại chênh lệch trời vực: mức giá đầu vào của MiniMax M2.5 là 0,3 USD/một triệu token, trong khi Claude Opus 4.6 là 5 USD – cao hơn khoảng 17 lần.
John chuyển sang sử dụng MiniMax M2.5 ngay lập tức – luồng công việc vẫn vận hành trơn tru, nhưng hóa đơn giảm xuống một cấp độ. Cuộc di cư này đang diễn ra đồng thời trên toàn cầu.
Chris Clark – Giám đốc Điều hành (COO) của OpenRouter – nhận định rất thẳng thắn:Các mô hình mã nguồn mở Trung Quốc chiếm được thị phần lớn là vì chúng chiếm tỷ trọng cực kỳ cao trong các luồng công việc Agent do nhà phát triển Mỹ vận hành.
Điện năng xuất khẩu
Để hiểu bản chất của hiện tượng “token xuất khẩu”, trước tiên cần làm rõ cấu trúc chi phí của một token.
Token trông rất nhẹ: một token tương đương khoảng 0,75 từ tiếng Anh; một cuộc trò chuyện bình thường với AI cũng chỉ tiêu tốn vài nghìn token. Nhưng khi những token này được tích lũy theo đơn vị nghìn tỷ, hiện thực vật lý đằng sau chúng trở nên nặng nề hơn bao giờ hết.
Phân tích chi phí của một token, ta chỉ thấy hai yếu tố cốt lõi:sức mạnh tính toán và điện năng.
Sức mạnh tính toán là chi phí khấu hao GPU: bạn mua một chiếc NVIDIA H100 với giá khoảng 30.000 USD, và chi phí khấu hao này được phân bổ cho mỗi lần suy luận. Điện năng là nhiên liệu duy trì hoạt động liên tục của trung tâm dữ liệu: một chiếc GPU hoạt động tối đa tiêu thụ khoảng 700 watt, cộng thêm chi phí làm mát; hóa đơn điện của một trung tâm dữ liệu AI quy mô lớn có thể dễ dàng vượt quá hàng trăm triệu USD mỗi năm.
Giờ hãy vẽ lại quá trình vật lý này trên bản đồ.
Một nhà phát triển Mỹ tại San Francisco gửi đi một yêu cầu API. Dữ liệu khởi hành từ California, đi qua cáp quang ngầm dưới Thái Bình Dương, đến một trung tâm dữ liệu ở Trung Quốc; cụm GPU bắt đầu hoạt động, điện từ lưới điện Trung Quốc đổ vào những con chip, quá trình suy luận hoàn tất và kết quả được gửi trở về. Toàn bộ quá trình này có thể chỉ mất một hoặc hai giây.
Điện năng chưa từng rời khỏi lưới điện Trung Quốc, nhưng giá trị của điện năng đã được chuyển giao xuyên biên giới thông qua token.
Ở đây tồn tại một điều kỳ diệu mà thương mại thông thường không thể đạt tới: token không có hình thể, không cần qua hải quan, không bị đánh thuế, thậm chí còn không xuất hiện trong bất kỳ thống kê thương mại hiện hành nào. Trung Quốc xuất khẩu một lượng lớn dịch vụ tính toán và điện năng, nhưng trong dữ liệu thương mại hàng hóa chính thức, điều này gần như vô hình.
Token trở thành sản phẩm phái sinh của điện năng; “token xuất khẩu” về bản chất chính là “điện năng xuất khẩu”.
Điều này cũng được hỗ trợ bởi mức giá điện tương đối thấp tại Trung Quốc, trung bình thấp hơn khoảng 40% so với Mỹ – đây là sự chênh lệch chi phí ở cấp độ vật lý, một lợi thế mà đối thủ khó có thể sao chép dễ dàng.
Bên cạnh đó, các mô hình ngôn ngữ lớn Trung Quốc còn sở hữu lợi thế về thuật toán và “cuộc đua khốc liệt” (nội quyển).
Kiến trúc MoE của DeepSeek V3 chỉ kích hoạt một phần tham số trong quá trình suy luận; các bài kiểm tra độc lập cho thấy chi phí suy luận của nó thấp hơn GPT-4o khoảng 36 lần. MiniMax M2.5 cũng có tổng số tham số 229 tỷ nhưng chỉ kích hoạt 10 tỷ.
Ở tầng cao nhất là “cuộc đua khốc liệt”: Alibaba, ByteDance, Baidu, Tencent, Moonshot, Zhipu, MiniMax… hơn chục công ty cùng chạy đua trên một đường đua, dẫm đạp lên nhau. Giá cả đã sớm sụp đổ dưới mức lợi nhuận hợp lý, “lỗ để gây tiếng vang” đã trở thành chuẩn mực ngành.
Xem kỹ hơn, điều này giống hệt với mô hình “sản xuất Trung Quốc xuất khẩu”: tận dụng lợi thế chuỗi cung ứng và cuộc đua khốc liệt trong ngành để đẩy mạnh giá token xuống mức thấp kỷ lục.
Từ Bitcoin đến Token
Trước token, đã từng có một lần “xuất khẩu điện năng”.
Khoảng năm 2015, các quản lý nhà máy điện ở Tứ Xuyên, Vân Nam và Tân Cương bắt đầu đón nhận một nhóm khách lạ.
Những người này thuê lại các nhà xưởng bỏ hoang, lắp đầy những cỗ máy dày đặc và vận hành chúng liên tục 24 giờ mỗi ngày. Những cỗ máy này chẳng sản xuất thứ gì ngoài việc giải một bài toán toán học liên miên; thỉnh thoảng, từ bài toán vô tận ấy, chúng “khai thác” được một đồng Bitcoin.
Đây là hình thái đầu tiên của “xuất khẩu điện năng”: biến nguồn thủy điện và điện gió rẻ tiền thành tài sản kỹ thuật số lưu thông toàn cầu thông qua phép toán băm của máy đào tiền, rồi bán đổi lấy đô la Mỹ trên các sàn giao dịch.
Điện năng không vượt qua bất kỳ biên giới nào, nhưng giá trị của nó, thông qua Bitcoin, đã chảy vào thị trường toàn cầu.
Những năm đó, sức mạnh tính toán của Trung Quốc từng chiếm hơn 70% tổng sức mạnh đào Bitcoin toàn cầu. Thủy điện và nhiệt điện của Trung Quốc, bằng cách thức gián tiếp này, đã tham gia vào một cuộc tái phân phối vốn toàn cầu.
Năm 2021, tất cả chấm dứt đột ngột. Lệnh quản lý siết chặt, thợ đào tứ tán, sức mạnh tính toán chuyển sang Kazakhstan, Texas (Mỹ) và Canada.
Nhưng logic này chưa bao giờ biến mất — nó chỉ đang chờ một lớp vỏ mới, cho đến khi ChatGPT xuất hiện, các mô hình ngôn ngữ lớn đua nhau trỗi dậy, các trại đào Bitcoin xưa kia lột xác thành trung tâm dữ liệu AI, máy đào trở thành GPU tính toán, và Bitcoin từng được “khai thác” nay trở thành token — điều duy nhất không thay đổi chính là điện năng.
Việc “Bitcoin xuất khẩu” và “token xuất khẩu” có cấu trúc nền tảng giống nhau, nhưng token hiện nay mang giá trị thương mại cao hơn.
Việc đào Bitcoin là một phép tính toán học thuần túy, sản phẩm là một tài sản tài chính; giá trị của Bitcoin đến từ tính khan hiếm và sự đồng thuận của thị trường, hoàn toàn không liên quan đến “nó đã tính toán điều gì”. Sức mạnh tính toán bản thân không mang tính sản xuất, mà giống như một sản phẩm phụ của cơ chế tin cậy.
Còn suy luận của mô hình ngôn ngữ lớn thì khác. GPU tiêu thụ điện năng để tạo ra các dịch vụ nhận thức thực tế: viết mã, phân tích, dịch thuật, sáng tạo nội dung. Giá trị của token đến trực tiếp từ hiệu dụng mà nó mang lại cho người dùng. Đây là một sự gắn kết sâu sắc hơn:một khi luồng công việc của nhà phát triển đã phụ thuộc vào một mô hình nhất định, chi phí chuyển đổi sẽ tích lũy và tăng dần theo thời gian.
Dĩ nhiên, còn một khác biệt then chốt: đào Bitcoin là hoạt động bị Trung Quốc trục xuất, còn “token xuất khẩu” là lựa chọn chủ động của toàn bộ cộng đồng nhà phát triển toàn cầu.
Cuộc chiến token
Sợi cáp ngầm dưới biển được lắp đặt năm 1858 đại diện cho chủ quyền của Đế chế Anh đối với “đường cao tốc thông tin”; bên nào sở hữu cơ sở hạ tầng thì bên đó định đoạt luật chơi.
“Token xuất khẩu” cũng là một cuộc chiến không tuyên bố, nhưng đầy trở ngại.
Chủ quyền dữ liệu là bức tường đầu tiên: một yêu cầu API từ nhà phát triển Mỹ được xử lý tại trung tâm dữ liệu Trung Quốc, nghĩa là dữ liệu về mặt vật lý đã đi qua lãnh thổ Trung Quốc. Đối với nhà phát triển cá nhân và ứng dụng nhỏ, đây không phải vấn đề; nhưng trong các tình huống liên quan đến dữ liệu nhạy cảm của doanh nghiệp, thông tin tài chính hay tuân thủ quy định của chính phủ, đây là một điểm yếu nghiêm trọng. Cũng vì vậy mà tỷ lệ thâm nhập của các mô hình Trung Quốc cao nhất trong lĩnh vực công cụ phát triển và ứng dụng cá nhân, nhưng gần như không tồn tại trong các hệ thống cốt lõi của doanh nghiệp.
Lệnh cấm xuất khẩu chip là bức tường thứ hai: sự phát triển AI của Trung Quốc đối mặt với các hạn chế xuất khẩu GPU cao cấp của NVIDIA; kiến trúc MoE và tối ưu hóa thuật toán chỉ có thể bù đắp một phần bất lợi này, trần giới hạn vẫn tồn tại.
Tuy nhiên, những trở ngại hiện tại chỉ là phần mở đầu; một chiến trường lớn hơn đang hình thành.
Token và mô hình AI đã trở thành một chiều kích chiến lược mới trong cuộc cạnh tranh giữa Trung Quốc và Hoa Kỳ, tầm quan trọng không kém ngành bán dẫn hay Internet thế kỷ XX, thậm chí còn gần hơn với một ẩn dụ cổ xưa hơn:cạnh tranh vũ trụ.
Năm 1957, Liên Xô phóng vệ tinh Sputnik 1, khiến cả nước Mỹ chấn động; ngay sau đó, chương trình Apollo được khởi động, với ngân sách tương đương hàng nghìn tỷ đô la ngày nay, nhằm đảm bảo không thất bại trong cuộc đua vào vũ trụ.
Logic của cuộc đua AI cũng tương tự đến kinh ngạc, nhưng mức độ khốc liệt sẽ vượt xa cuộc đua vào vũ trụ. Vũ trụ là không gian vật lý, người dân thường khó cảm nhận; còn AI thì thấm sâu vào những mạch máu kinh tế: từng dòng mã, từng hợp đồng, từng hệ thống ra quyết định của chính phủ — đều có thể đang chạy một mô hình ngôn ngữ lớn của quốc gia nào đó. Bên nào có mô hình trở thành tùy chọn mặc định trong cơ sở hạ tầng của nhà phát triển toàn cầu, bên đó sẽ vô hình trung giành được ảnh hưởng cấu trúc đối với nền kinh tế số toàn cầu.
Chính điều này khiến Washington thực sự lo ngại trước hiện tượng “token xuất khẩu” của Trung Quốc.
Khi kho mã nguồn, luồng công việc Agent và logic sản phẩm của một nhà phát triển đều được xây dựng xung quanh API của một mô hình Trung Quốc, chi phí chuyển đổi sẽ tăng theo cấp số nhân theo thời gian. Đến lúc đó, ngay cả khi Hoa Kỳ ban hành luật cấm, các nhà phát triển vẫn sẽ phản kháng bằng “tiếng chân” của mình – giống như ngày nay không một lập trình viên nào có thể từ bỏ GitHub.
Hiện tượng “token xuất khẩu” hôm nay có lẽ chỉ là phần mở đầu của cuộc đấu tranh dài hơi này. Các mô hình ngôn ngữ lớn Trung Quốc không tuyên bố muốn lật đổ điều gì; chúng chỉ đơn giản cung cấp dịch vụ với giá thấp hơn, gửi tới tay từng nhà phát triển trên toàn cầu – miễn là người đó có một khóa API.
Lần này, người đang lắp đặt “sợi cáp” là những đội ngũ kỹ sư viết mã tại Hàng Châu, Bắc Kinh, Thượng Hải, cùng các cụm GPU đang vận hành không ngừng nghỉ tại một tỉnh miền Nam Trung Quốc.
Cuộc cạnh tranh này không có đếm ngược – nó diễn ra liên tục 24 giờ mỗi ngày, tính bằng token, và chiến trường là từng thiết bị đầu cuối của nhà phát triển.
Chào mừng tham gia cộng đồng chính thức TechFlow
Nhóm Telegram:https://t.me/TechFlowDaily
Tài khoản Twitter chính thức:https://x.com/TechFlowPost
Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News












