
Phân tích toàn diện thị trường suy luận AI: Các dự án mã hóa làm thế nào để đột phá?
Tuyển chọn TechFlowTuyển chọn TechFlow

Phân tích toàn diện thị trường suy luận AI: Các dự án mã hóa làm thế nào để đột phá?
Lập luận mới là chiến trường cuối cùng của AI: các ông lớn điện toán đám mây truyền thống đấu với mạng phi tập trung — quyền riêng tư, xác minh và nền kinh tế đại lý, bên nào sẽ chiếm ưu thế?
Tác giả: 0xSammy (Khala Research)
Biên dịch: AIdidiaoJP, Foresight News
Thị trường suy luận AI hiện nay không còn giống một thị trường dịch vụ đám mây đơn nhất, mà giống hơn với một ván cờ “rủi ro”. Mỗi nhà cung cấp đều đang tranh giành những vùng lãnh thổ khác nhau: các nhà cung cấp đám mây quy mô lớn kiểm soát lục địa doanh nghiệp, các bộ định tuyến nắm giữ các hành lang thương mại, trong khi các mạng phi tập trung thì chiến đấu quyết liệt ở tiền tuyến mở.
Lõi của chu kỳ AI trước đây là huấn luyện mô hình, nhưng giờ đây ngày càng rõ ràng rằng khâu suy luận tiềm ẩn giá trị kinh tế khổng lồ. Nhiều người có thể lần đầu tiên nghe đến thuật ngữ “inference” (suy luận), vậy rốt cuộc nó là gì?
Huấn luyện tạo ra mô hình AI, còn suy luận là quá trình mô hình sinh ra câu trả lời khi có người đặt câu hỏi hoặc giao nhiệm vụ cho nó.
Tổng quan thị trường suy luận AI
Khâu huấn luyện chiếm vị trí nổi bật trên các tiêu đề vì nó làm nền tảng cho những đầu ra ấn tượng. Tuy nhiên thực tế là hiện nay suy luận mới chiếm phần lớn lợi ích kinh tế — mỗi prompt, mỗi vòng lặp agent, mỗi lần tạo ảnh, mỗi lệnh giao dịch, mỗi lần gọi công cụ và mỗi lần chỉnh sửa mã đều phải được thực thi ở đâu đó.
Bộ định tuyến là điểm nghẽn thực sự
Trong ván cờ “rủi ro”, vùng đất có giá trị nhất thường là những điểm nghẽn hẹp, nơi quyết định bước đi tiếp theo của quân đội. Trong thị trường suy luận, bộ định tuyến đảm nhận đúng vai trò như vậy. Chúng nằm giữa nhu cầu và nguồn cung, quyết định từng yêu cầu sẽ được chuyển tới đâu và nhà cung cấp nào sẽ được thanh toán.
Một ví dụ điển hình là OpenRouter, giao thức của nền tảng này tuần trước đã xử lý 4.700 nghìn tỷ token.
Hoạt động kinh tế này hoàn toàn chưa có dấu hiệu chậm lại, đặc biệt là khi hàng triệu tỷ agent sắp ra mắt.
Vậy một thị trường suy luận đầy đủ cần những yếu tố gì? Các thành phần cốt lõi bao gồm:
- Token đang trở thành đơn vị kế toán
- OpenRouter đang nhanh chóng trở thành lớp sàn giao dịch cốt lõi; tuần trước lượng token được sử dụng qua thị trường LLM của nền tảng này đạt 4.700 nghìn tỷ.
- Nguồn cung chuyên biệt: Fireworks, Together, Replicate, Baseten, Groq cùng các nhà cung cấp đám mây quy mô lớn hàng đầu.
- Các mạng AI mã hóa: Chutes, Akash, io.net, Nosana, Targon, Venice, NuNet… đang xây dựng phiên bản không cần giấy phép ở tầng cơ sở.
Đừng coi tất cả những nhà cung cấp này như đang cạnh tranh trên cùng một thị trường — thực tế chúng hoàn toàn không như vậy.
Các nhà cung cấp truyền thống bán độ tin cậy, trải nghiệm nhà phát triển và quy trình mua sắm doanh nghiệp.
Các mạng AI mã hóa lại tập trung vào nguồn cung rẻ hơn, khả năng truy cập mở, quyền riêng tư, khả năng xác minh và chu kỳ khuyến khích mới.
Sự kiện Anthropic gần đây cấm người dùng ngoài Hoa Kỳ sử dụng mô hình Mythos (Fable 5) khiến nhiều người nhận ra lại rủi ro khi phụ thuộc quá mức vào một mô hình độc quyền tiên tiến duy nhất.
Điều thú vị là hai thế giới này bắt đầu giao thoa: quyền riêng tư, tính toán bảo mật hoặc thanh toán gốc cho agent (Venice và Targon nổi bật trong lĩnh vực này).
Nhìn nhận thị trường sức mạnh tính toán AI như thế nào
Góc nhìn tốt hơn là chia thị trường thành hai phe: truyền thống và mã hóa:
Phía truyền thống bán độ tin cậy, trải nghiệm nhà phát triển và mua sắm doanh nghiệp.
Các mạng mã hóa chủ yếu cạnh tranh về khả năng truy cập mở, nguồn cung chi phí thấp hơn, quyền riêng tư, khả năng xác minh và cơ chế khuyến khích mới nhằm điều phối vốn toàn cầu một cách liền mạch.
Tại sao suy luận mới chính là thị trường AI thực sự
Lớp mô hình vẫn quan trọng, nhưng chất lượng mô hình đang bị nén lại nhanh hơn kỳ vọng. Các mô hình mã nguồn mở đã đạt 90–95% chất lượng của các mô hình tiên tiến nhất, nhưng chỉ tốn 10% chi phí (ví dụ: GLM-5.2 của Z.ai).
Các mô hình mã nguồn mở liên tục cải tiến, các phòng thí nghiệm Trung Quốc không ngừng đẩy giá xuống. Các mô hình tiên tiến vẫn duy trì được mức giá cao hơn, nhưng bên dưới chúng, cuộc cạnh tranh định giá bằng token đã rất khốc liệt.
Đây chính là lý do khiến lớp định tuyến trở nên then chốt: cùng một mô hình mã nguồn mở có thể được cung cấp bởi năm nhà cung cấp khác nhau với năm mức giá khác nhau; nhà phát triển không muốn mãi mãi hard-code một endpoint cố định, họ cần bộ định tuyến.
Bộ định tuyến có thể lựa chọn dựa trên nhiều yếu tố như giá cả, độ trễ, quyền riêng tư và độ tin cậy.
Nó nằm trên tất cả các nhà cung cấp, biến cục diện hỗn loạn thành một giao diện gọn gàng, thống nhất.
Đây chính là điều OpenRouter làm đúng, cũng giải thích vì sao các quỹ đầu tư mạo hiểm đã rót 113 triệu USD trong vòng tài trợ Series B gần đây để nắm bắt cơ hội định tuyến này.
OpenRouter đang nhanh chóng trở thành giao diện thị trường: chỉ một chìa khóa để truy cập hàng trăm mô hình từ nhiều nhà cung cấp khác nhau. Giá trị thực sự không nằm ở danh sách mô hình, mà ở việc cùng một yêu cầu có thể được định tuyến tới nhà cung cấp phù hợp nhất cho tác vụ đó.
Điều này bắt đầu giống thị trường năng lượng: người dùng không quan tâm điện được sản xuất từ nhà máy nào, họ chỉ quan tâm bóng đèn có sáng không, giá cả có hợp lý không và hệ thống có ổn định không.
Người dùng AI cũng sẽ ngày càng suy nghĩ theo cách này — họ không quan tâm cụm GPU nào đã xử lý token này, mà chỉ quan tâm phản hồi có nhanh, rẻ, riêng tư và đáng tin cậy hay không.
Các nhà cung cấp suy luận truyền thống
Phía truyền thống đang phân hóa thành bốn loại:
i) Các nhà cung cấp đám mây quy mô lớn (Hyperscalers): AWS, Google, Microsoft
Họ kiểm soát những “lục địa kiên cố”. Họ giành chiến thắng không phải vì luôn rẻ nhất, mà vì đã kiểm soát sẵn hệ thống mua sắm doanh nghiệp, tuân thủ pháp lý, xác thực danh tính, an ninh và hóa đơn. Việc tấn công trực diện vào vị thế này tốn kém vô cùng.
Họ chiến thắng nhờ niềm tin doanh nghiệp. Các công ty lớn mua không chỉ token, mà còn là sự tuân thủ, an ninh, tiện lợi trong mua sắm và trách nhiệm khi xảy ra sự cố.
ii) Thị trường định tuyến: OpenRouter và các cổng AI khác
Bộ định tuyến nằm trên các nhà cung cấp mô hình, gửi từng yêu cầu tới lựa chọn tối ưu. Khi vị thế dẫn đầu của các mô hình thay đổi hàng tuần, việc hard-code một mô hình duy nhất ngày càng trở nên mong manh. AI cần các bộ tổng hợp — giống như trong lĩnh vực mã hóa.
iii) Dịch vụ mô hình mã nguồn mở được tối ưu: Together, Fireworks, Baseten, Groq
Chúng không chỉ là API giá rẻ, mà là các công ty hạ tầng hiệu năng chuyên về tốc độ, xử lý theo lô, mở rộng quy mô, tinh chỉnh, endpoint tùy chỉnh và hỗ trợ vận hành sản xuất.
iv) Thị trường mô hình: Replicate và các nền tảng tương tự Hugging Face
Suy luận xa hơn hẳn việc trò chuyện. Hình ảnh, video, giọng nói, embedding, mô hình robot, mô phỏng và agent đa phương thức đều cần chạy mô hình. Thị trường giúp nhu cầu về các mô hình ít phổ biến trở nên dễ tiếp cận.
Các nhà cung cấp suy luận AI mã hóa
Các mạng phi tập trung là “lãnh thổ du kích”
Các mạng suy luận mã hóa không cố gắng chi tiêu nhiều hơn đối thủ tại chiến trường chính của AWS. Thay vào đó, chúng mở mặt trận mới: mô hình không bị kiểm duyệt, nguồn cung GPU rẻ hơn, suy luận riêng tư, thanh toán gốc cho agent và khối lượng công việc không đòi hỏi độ tin cậy ở mức các nhà cung cấp đám mây quy mô lớn.
Phía mã hóa thường bị gộp chung đơn giản thành “sức mạnh tính toán phi tập trung”, nhưng cách gọi này quá mơ hồ — ít nhất tồn tại năm hướng khác nhau:
- Mạng suy luận không máy chủ
- Thị trường GPU phi tập trung
- Mạng tính toán bảo mật
- Ứng dụng và cổng AI riêng tư
- Lớp điều phối
Chúng không nên được phân tích như nhau.
i) Chutes: Suy luận bản địa mã hóa
@chutes_ai nên được hiểu tốt nhất như một nền tảng suy luận phi tập trung, chứ không chỉ là thị trường GPU.
Cốt lõi nằm ở chỗ: nhà phát triển không muốn thuê GPU hay quản lý hạ tầng — họ chỉ muốn một endpoint hoạt động bình thường. Chutes cung cấp các mô hình mã nguồn mở thông qua API quen thuộc, với nguồn cung GPU phi tập trung ở tầng dưới.
Vấn đề then chốt là liệu lượng sử dụng cao nhất có thể chuyển hóa thành nhu cầu thanh toán và tái diễn (recurring). Token rẻ có ích, nhưng chỉ khi nhà phát triển tin tưởng thời gian hoạt động, độ trễ và độ tin cậy của nó.
Doanh thu mỗi nghìn tỷ token của Chutes liên tục tăng, cho thấy tiềm năng khả thi và sinh lời bền vững.
ii) Akash: Lớp đấu giá GPU
@akashnet là thị trường đám mây phi tập trung.
Người dùng định nghĩa nhu cầu về sức mạnh tính toán, nhà cung cấp đấu giá để đáp ứng, và khối lượng công việc được thực thi thông qua hợp đồng thuê. Nó giống một thị trường sức mạnh tính toán hơn là một bộ định tuyến suy luận trực tiếp.
Nó phù hợp nhất với các khối lượng công việc nhạy cảm về giá, chịu được dao động hạ tầng và không cần tích hợp sâu với AWS/Azure/Google Cloud. Chi phí có mối tương quan nhất định với giá token và đang xu hướng tăng.
iii) io.net: Đám mây GPU phi tập trung
@ionet gần hơn với vai trò nhà cung cấp đám mây GPU phi tập trung.
Điểm bán hàng cốt lõi là khả năng truy cập nguồn cung GPU phân tán với chi phí thấp hơn và tốc độ cấu hình nhanh hơn, phù hợp với các đội AI cần sức mạnh tính toán nhưng không muốn ký hợp đồng đám mây dài hạn hoặc chấp nhận giá của các nhà cung cấp đám mây quy mô lớn.
Thách thức nằm ở việc thực thi: xác minh phần cứng, độ tin cậy, lập lịch, hỗ trợ và hiệu năng nhất quán. Việc truy cập GPU thô mang giá trị, nhưng các lớp lợi nhuận cao hơn vẫn là định tuyến, quản lý suy luận và điều phối.
io.net thể hiện xuất sắc trong 30 ngày qua, doanh thu hàng năm đạt 12,3 triệu USD.
iv) Targon: Tính toán bảo mật
@TargonCompute (do @manifoldlabs phát triển) tập trung vào tính toán bảo mật cho khối lượng công việc AI.
Vấn đề mà nó giải quyết rất rõ ràng: nhiều người dùng không muốn chạy các prompt, mô hình hoặc dữ liệu nhạy cảm trên hạ tầng do bên thứ ba không rõ ràng vận hành.
Targon cung cấp môi trường thực thi được bảo vệ thông qua môi trường thực thi đáng tin cậy (TEE), máy ảo mã hóa, chứng thực từ xa và cơ sở hạ tầng GPU bảo mật. Nói đơn giản, nó chứng minh khối lượng công việc được thực thi trong môi trường an toàn và giảm thiểu nội dung mà nhà vận hành có thể quan sát.
Điều này đặc biệt liên quan đến suy luận riêng tư trong lĩnh vực tài chính, y tế và AI doanh nghiệp. Tính toán bảo mật không phải phép màu — nó chuyển sự tin cậy sang phần cứng, firmware và hệ thống chứng thực.
Năm ngoái, giao thức này báo cáo doanh thu hàng năm 10,4 triệu USD và cùng Intel xuất bản bài nghiên cứu về “Sức mạnh tính toán phi tập trung trên phần cứng không đáng tin cậy”.
v) Darkbloom: Suy luận riêng tư trên Mac không sử dụng
Darkbloom (do @eigenlabs phát triển) đi theo một hướng khác.
Nó không phân mảnh mô hình lớn lên các GPU ngẫu nhiên, mà biến các máy Mac Apple Silicon không sử dụng thành mạng suy luận riêng tư. Mô hình được chạy cục bộ trên Mac, các yêu cầu được mã hóa và định tuyến tới nhà cung cấp đã được xác minh.
Điểm bán hàng là quyền riêng tư và chi phí, chứ không phải tối đa hóa hiệu năng của mô hình tiên tiến nhất.
Điều này rất hữu ích, bởi “không có nút nào nắm giữ toàn bộ mô hình” không tự động nghĩa là prompt được bảo mật. Darkbloom nhắm mục tiêu rõ ràng hơn vào vấn đề quyền riêng tư, nhưng vẫn cần chứng minh quy mô nguồn cung, hiệu năng và lòng tin từ nhà phát triển.
Hiện mạng lưới đã có 300 máy, phục vụ 2 tỷ token và 1 triệu yêu cầu.
vi) Venice: Suy luận riêng tư dành cho người tiêu dùng
@AskVenice nằm ở vị trí khác biệt so với các mạng như Akash hay io.net. Nó giống hơn với một ứng dụng AI riêng tư và cổng suy luận, chứ không phải thị trường GPU chủ yếu.
Thông lượng cổng của nó đã đạt 85 tỷ token mỗi ngày (theo dữ liệu của @ErikVoorhees).
Đa số người dùng muốn một sản phẩm AI tôn trọng quyền riêng tư, có thể truy cập các mô hình mạnh mẽ và không thu thập dữ liệu quy mô lớn.
Venice đóng gói khái niệm hạ tầng thành trải nghiệm dành cho người tiêu dùng, xoay quanh prompt riêng tư, mô hình mã nguồn mở, khả năng truy cập không bị kiểm duyệt, chức năng API và sức mạnh tính toán được mã hóa thông qua VVV và DIEM.
Thành phần DIEM đặc biệt thú vị vì nó hướng tới khái niệm kinh tế agent rộng hơn: cung cấp quyền truy cập sức mạnh tính toán với giá 1 USD mỗi ngày. Thị trường gần đây đã gán cho khái niệm này một mức giá khá tốt.
Nếu agent cần truy cập liên tục vào suy luận, thì các điểm sức mạnh tính toán bắt đầu giống như tài sản gốc cho agent, và toàn bộ thị trường thứ cấp có thể được xây dựng xung quanh nó.
Một agent có thể trực tiếp nắm giữ và chi tiêu quyền lực tính toán sẽ thực tế hơn nhiều so với agent phụ thuộc vào con người thường xuyên thanh toán thẻ tín dụng.
Điều này làm nổi bật luận điểm sâu sắc hơn về AI mã hóa: cuối cùng agent cần truy cập vào vốn, danh tính, bộ nhớ và sức mạnh tính toán — và hệ thống mã hóa cung cấp khung lập trình cho các nguồn lực này.
Venice không cạnh tranh trực tiếp với OpenRouter về độ bao quát mô hình, mà cạnh tranh về quyền riêng tư, khả năng truy cập và sức mạnh tính toán được mã hóa. Đây là một phân khúc hợp lý (legitimate), nhưng vấn đề then chốt là nhu cầu về sản phẩm AI riêng tư có đủ lớn để hỗ trợ mô hình token vượt qua chu kỳ kể chuyện hiện tại hay không. Nhận định của tôi là khi AI ngày càng phổ biến, câu chuyện về quyền riêng tư sẽ ngày càng mạnh mẽ hơn.
vii) NuNet: Điều phối sức mạnh tính toán phân tán
@nunet_global thường được xếp vào nhóm dự án sức mạnh tính toán phi tập trung, nhưng khuôn khổ hữu ích hơn là “điều phối”.
Điều phối liên quan đến việc ghép khối lượng công việc với nguồn cung sức mạnh tính toán phù hợp nhất, và phối hợp việc thực thi giữa các máy, môi trường và vị trí khác nhau.
Khi AI vượt ra ngoài hạ tầng đám mây tập trung, điều này ngày càng trở nên quan trọng.
Các hệ thống AI trong tương lai rất có thể sẽ chạy trên nhiều nền tảng: GPU đám mây, thiết bị biên, máy chủ cục bộ, robot, điện thoại, cảm biến và mạng nhà cung cấp phi tập trung.
Robot kho có thể không chờ được phản hồi API xuyên khu vực; drone không thể giả định luôn có kết nối hoàn hảo; robot ngoài trời cần thực hiện suy luận cục bộ khi mạng không ổn định.
Do đó, điều phối đang trở thành một danh mục độc lập và có ý nghĩa.
Thách thức của NuNet là liệu có thể chuyển đổi vấn đề điều phối này thành một mạng kinh tế hoạt động (functioning), với nguồn cung, nhu cầu và mức độ áp dụng của nhà phát triển đủ lớn.
viii) OpenServ: Điều phối agent, chứ không chỉ suy luận
@openservai nên được hiểu tốt nhất như một nền tảng hạ tầng và điều phối agent, chứ không phải mạng suy luận phi tập trung.
Điều này rất quan trọng vì agent là một trong những nguồn nhu cầu suy luận rõ ràng nhất trong tương lai. Một chatbot thông thường có thể chỉ gọi mô hình một lần, trong khi agent sẽ gọi mô hình lặp đi lặp lại: suy luận, sử dụng công cụ, kiểm tra đầu ra, gọi mô hình khác, thực hiện hành động, rồi lặp lại.
Điều này tạo ra nhu cầu suy luận nặng nề, đã thu hút sự chú ý trong cộng đồng mã hóa.
Do đó, OpenServ liên quan đến thị trường suy luận từ phía nhu cầu chứ không phải phía cung. Nếu nền tảng này trở thành nơi hữu ích để nhà phát triển xây dựng, triển khai và điều phối agent, nó tự nhiên sẽ trở thành lớp định tuyến suy luận tới các nhà cung cấp khác nhau ở tầng dưới.
Vấn đề then chốt là liệu OpenServ có thể trở thành một lớp thực thi agent đích thực, hay chỉ là một thị trường agent khác kèm theo token.
Sau nhiều lần trao đổi với đội ngũ, tôi cho rằng năng lực của nó vượt xa điều sau; khung suy luận của nó đạt được một số điểm chuẩn đáng chú ý (notable), và lộ trình còn bao gồm mô hình độc quyền riêng.
Nếu OpenServ có thể kiểm soát luồng công việc vận hành agent hóa, suy luận sẽ trở thành đầu vào của nền tảng chứ không phải sản phẩm chính.
Trong một thế giới agent hóa, lớp có giá trị nhất sẽ là nơi agent dành nhiều thời gian và nguồn lực liên tục.
ix) Dolphin AI: Suy luận phi tập trung lấy sản phẩm làm trung tâm
@dphnAI thú vị ở chỗ nó khởi đầu từ nhu cầu mô hình chứ không phải từ thị trường GPU.
Gia đình mô hình Dolphin đã có tiếng tăm là các mô hình mã nguồn mở không bị kiểm duyệt, giúp mạng lưới có lý do tồn tại rõ ràng hơn.
Điều này rất quan trọng vì nhiều dự án suy luận phi tập trung đều đi theo hướng cung trước: “Chúng tôi có GPU, giờ ai sẽ mua?”
Dolphin lại ngược lại: bắt đầu từ tập hợp các mô hình mà mọi người đã muốn sử dụng, rồi xây dựng mạng suy luận phi tập trung xung quanh nhu cầu đó.
Kiến trúc của nó thường được gọi là peer-to-pool: chủ sở hữu GPU đóng góp công suất vào các “bể” mô hình cụ thể, thay vì mỗi người mua trực tiếp thuê một nút cụ thể. Các yêu cầu được định tuyến tới bể, và các nút khả dụng xử lý.
Đây là thiết kế tốt hơn cho nguồn cung người tiêu dùng không ổn định. Nếu ai đó đóng góp GPU chơi game không sử dụng, họ có thể không luôn trực tuyến; mô hình “bể” có thể hấp thụ sự biến động này một cách tự nhiên hơn so với thị trường cho thuê một-một.
Điều thú vị hơn nữa là việc xác minh. Dolphin đang thúc đẩy “chứng minh trọng số thực tế” (live-weight proofs). Nói đơn giản, đây là việc kiểm tra xem trọng số mô hình thực tế được tải trong quá trình phục vụ có khớp với mô hình mà nút tuyên bố đang chạy hay không.
Điều này rất quan trọng vì gian lận là một trong những vấn đề khó nhất trong suy luận phi tập trung. Một nút có thể tuyên bố đang chạy mô hình đắt tiền, nhưng âm thầm phục vụ phiên bản nhỏ hơn, rẻ hơn hoặc đã lượng tử hóa. Nếu mạng không thể phát hiện, toàn bộ thị trường sẽ mất tính đáng tin cậy.
x) c0mpute: Suy luận phân tán dành riêng cho agent
@c0mputeAI đáng chú ý vì nó cố gắng giải quyết một trong những vấn đề khó nhất của suy luận phi tập trung: chạy các mô hình lớn trên các GPU phân tán qua Internet mở.
Động cơ Shard của nó phân chia mô hình ra nhiều máy, thay vì yêu cầu một máy chủ khổng lồ chứa toàn bộ mô hình. Điều này đặc biệt liên quan đến các mô hình mã nguồn mở quy mô tiên tiến, vốn có thể quá lớn hoặc bị hạn chế nên không thể triển khai qua các tuyến lưu trữ thông thường.
Liên kết với @virtuals_io là góc nhìn then chốt từ phía nhu cầu. Virtuals đang xây dựng nền kinh tế agent, trong khi agent là người dùng suy luận nặng: chúng lập kế hoạch, gọi công cụ, thực hiện giao dịch, kiểm tra kết quả và lặp lại. Điều này tạo ra nhu cầu về suy luận giá rẻ, mở và không bị kiểm duyệt.
Cần lưu ý rằng điều này vẫn ở giai đoạn sơ khai. c0mpute cần chứng minh hiệu năng dưới tải thực, độ tin cậy của nút, xác minh và quyền riêng tư của prompt.
Nhưng hướng đi rất quan trọng: thị trường GPU bán quyền truy cập sức mạnh tính toán; c0mpute đang cố gắng phân phối chính mô hình.
Suy luận truyền thống so với suy luận mã hóa
Cả hai sẽ cùng tồn tại, mỗi bên đều có những ưu thế nổi bật và đáng được hiểu rõ.
Điều cần theo dõi
Lượng token thanh toán
Thị trường nên giảm bớt sự chú ý vào các thống kê xử lý token thô, trừ khi những token này tạo ra doanh thu. Hoạt động ở lớp miễn phí và sử dụng được trợ cấp có thể tạo ra các con số ấn tượng, nhưng không chứng minh được sự phù hợp thực sự giữa sản phẩm và thị trường.
Nhu cầu suy luận thanh toán mới là chỉ số then chốt — nó bền vững hơn và có thể hỗ trợ khả năng tồn tại lâu dài.
ii) Doanh thu trên mỗi GPU
Mạng sức mạnh tính toán phi tập trung chỉ bền vững khi giá trị mà GPU kiếm được trong mạng cao hơn giá trị kiếm được bên ngoài. Nếu việc phát hành token là lý do chính khiến nhà cung cấp tham gia, thì khi khuyến khích giảm, nguồn cung sẽ biến mất. Nhà cung cấp GPU sẽ tính toán chi phí cơ hội.
iii) Tích hợp bộ định tuyến: Phân phối
Phân phối thường quan trọng hơn chính hạ tầng.
Việc tích hợp OpenRouter, agent được lập trình, ví, điểm thanh toán, công cụ nhà phát triển và ứng dụng dành cho người tiêu dùng đều là các nguồn nhu cầu tiềm năng.
Điểm thanh toán là kênh mà phần mềm có thể thanh toán trực tiếp cho dịch vụ thông qua API.
iv) Xác minh
Gian lận GPU, công suất giả và nhà cung cấp không đáng tin cậy vẫn là những rủi ro thực sự.
Mạng cần hệ thống xác minh phần cứng mạnh mẽ (robust), lưu lượng mã hóa, hệ thống danh tiếng và hình phạt có ý nghĩa (meaningful) đối với hành vi xấu.
v) Bảo đảm quyền riêng tư
Suy luận riêng tư vẫn là một trong những cơ hội mạnh nhất của AI mã hóa, nhưng bảo đảm phải thực sự. Tiếp thị về quyền riêng tư thì dễ; thực thi an toàn, kiến trúc ưu tiên cục bộ, giảm thiểu dữ liệu và hạ tầng có thể kiểm toán thì khó hơn nhiều.
vi) Bắt giữ giá trị token
Mô hình token mạnh nhất sẽ gắn trực tiếp nhu cầu với việc sử dụng suy luận thực tế. Điều này có thể liên quan đến việc mua lại, hủy bỏ, yêu cầu đặt cược, quyền lực tính toán hoặc cơ chế gắn với doanh thu.
Chỉ dựa vào câu chuyện AI chung chung sẽ không đủ trong dài hạn.
Kết luận cốt lõi
Kết cục là kiểm soát nhu cầu
Trong ván cờ “rủi ro”, chỉ sở hữu những vùng lãnh thổ rời rạc là chưa đủ. Bạn cần những khu vực liên thông, các tuyến tiếp viện và đường tiếp tế bền vững.
Thị trường suy luận cũng vậy. Người chiến thắng sẽ kiểm soát nhu cầu, định tuyến, xác minh và thanh toán; chỉ sở hữu GPU thôi là chưa đủ.
Thị trường suy luận khiến AI bắt đầu giống hệ thống tài chính:
- Mỗi token được tạo ra đều mang chi phí,
- Mỗi endpoint đều mang lợi nhuận,
- Mỗi vòng lặp agent đều tạo ra nhu cầu,
- Mỗi bộ định tuyến đều giống một nhà tạo thị trường,
- Mỗi mạng GPU đều trở thành nguồn cung…
Các nhà cung cấp truyền thống hiện đang dẫn đầu về trải nghiệm nhà phát triển và lớp niềm tin doanh nghiệp.
Các mạng AI mã hóa thì đang khám phá một tiền tuyến khác: nguồn cung không cần giấy phép, suy luận riêng tư, sức mạnh tính toán có thể xác minh, quyền truy cập được mã hóa và thanh toán gốc cho agent (không giới hạn KYC).
Trong ngắn hạn, người chiến thắng ít khả năng là mạng phi tập trung nhất, mà nhiều khả năng là mạng khiến suy luận phi tập trung trở nên bình thường và đáng tin cậy — thông qua endpoint nhanh, tài liệu mạnh, thời gian hoạt động đáng tin cậy, định giá minh bạch, nguồn cung được xác minh và nhu cầu thanh toán thực sự.
Chutes vẫn là một trong những dự án đáng chú ý, vì nó gần nhất với việc chuyển đổi sức mạnh tính toán được hỗ trợ bởi Bittensor thành một thị trường suy luận hoạt động (functioning), chứ không chỉ là câu chuyện GPU đơn thuần. “Darkbloom” của Eigen Labs cũng vậy.
Akash và io.net đại diện cho những thách thức từ phía cung, Targon đại diện cho luận điểm về tính toán bảo mật, Venice đại diện cho lớp nhu cầu AI riêng tư, NuNet đại diện cho việc điều phối trong tương lai của sức mạnh tính toán phân tán hơn.
Luận điểm rộng hơn:
“Các mô hình AI có thể ngày càng trở nên hàng hóa hóa, nhưng thị trường suy luận ít khả năng đi theo cùng hướng.”
Giá trị lớn nhất sẽ thuộc về những thực thể định tuyến công việc, xác minh công việc, thanh toán công việc và bắt giữ nhu cầu.
Đây chính là nơi cơ hội AI mã hóa tiếp theo có thể xuất hiện… ít nhất là cho đến khi AI vật lý đảm nhận được vai trò trong xã hội.
Chào mừng tham gia cộng đồng chính thức TechFlow
Nhóm Telegram:https://t.me/TechFlowDaily
Tài khoản Twitter chính thức:https://x.com/TechFlowPost
Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News












