
Bản đồ toàn cảnh AI phi tập trung năm 2026: Vì sao blockchain là “liều thuốc giải” không thể thiếu đối với AI?
Tuyển chọn TechFlowTuyển chọn TechFlow

Bản đồ toàn cảnh AI phi tập trung năm 2026: Vì sao blockchain là “liều thuốc giải” không thể thiếu đối với AI?
Từ tài chính đại lý đến xác minh quyền riêng tư: AI phi tập trung đang tái định hình mọi tầng của nền kinh tế thông minh.
Tác giả: Pink Brains
Dịch và biên tập: AididiaoJP, Foresight News
Sự tồn tại của AI phi tập trung bắt nguồn từ những giới hạn cấu trúc vốn có trong AI tập trung—những giới hạn này không thể khắc phục chỉ bằng vốn hoặc mã nguồn:
- Nguồn tài nguyên tính toán khan hiếm và đắt đỏ
- Quyền kiểm soát quá tập trung
- Đầu ra mô hình không thể xác minh
- Việc thu thập dữ liệu huấn luyện ngày càng khó khăn
Nguồn tài nguyên tính toán khan hiếm và đắt đỏ
Cơ sở hạ tầng GPU dự kiến sẽ tăng từ 10 tỷ USD năm 2025 lên 77 tỷ USD năm 2035. Các GPU dành cho trung tâm dữ liệu đã liên tục hết hàng trong nhiều tháng. Thị trường tính toán phi tập trung dự kiến tăng từ 9 tỷ USD năm 2024 lên 22 tỷ USD năm 2035 (số liệu từ Research and Markets). Con số này chỉ hợp lý nếu bạn tin rằng tình trạng thiếu hụt là mang tính cấu trúc chứ không phải chu kỳ—và chúng tôi cho rằng đây đúng là một vấn đề mang tính cấu trúc.
Quyền kiểm soát quá tập trung
ChatGPT, Gemini, Grok và Claude đều do một vài công ty tư nhân sở hữu và vận hành. Chính sách AI hiện hành giả định rằng chỉ một số ít thực thể có khả năng tập trung khối lượng lớn tài nguyên tính toán mới có thể huấn luyện các hệ thống mạnh mẽ. Một khi giả định này bị bác bỏ, cục diện về “ai có thể xây dựng trí tuệ tiên tiến” sẽ hoàn toàn thay đổi.
Đầu ra không thể xác minh
Khi mô hình đưa ra quyết định, người dùng không thể xác minh liệu mô hình đúng đã được chạy, phép tính có được thực hiện chính xác hay không, hoặc dữ liệu nhạy cảm có bị rò rỉ hay không. Điều này còn có thể chấp nhận được đối với chatbot, nhưng lại hoàn toàn không thể chấp nhận khi AI xử lý khoản vay, chăm sóc sức khỏe hoặc khi tác nhân tự chủ thực hiện giao dịch ví theo thời gian thực.
Việc thu thập dữ liệu huấn luyện ngày càng khó khăn do lo ngại về quyền riêng tư và quy định pháp lý
Một bot thu thập dữ liệu tập trung duy nhất đặt tại một vùng AWS sẽ nhanh chóng bị giới hạn tốc độ, chặn theo khu vực hoặc bị cung cấp bộ nhớ đệm độc hại. Như a16z nêu trong báo cáo triển vọng năm 2026, quyền riêng tư đang trở thành “hào lũy quan trọng nhất trong lĩnh vực mã hóa”.
AI cần blockchain để biến trí tuệ trở nên cởi mở, có thể xác minh và khả thi về mặt kinh tế.
Bản đồ ngăn xếp kỹ thuật AI phi tập trung
- Lớp ứng dụng và dịch vụ: Các tác nhân AI có thể thực hiện nhiều nhiệm vụ; tuy nhiên trong lĩnh vực mã hóa, hai trường hợp sử dụng nổi bật hiện nay là Tài chính Tác nhân (Agentic Finance) và Thanh toán Tác nhân (Agentic Payments)
- Lớp phần mềm trung gian (middleware): Các tổ chức kết nối — từ các khung xây dựng và nhận dạng tác nhân, thị trường tác nhân đến các lớp điều phối
- Lớp cơ sở hạ tầng: Các tài nguyên nền tảng cho AI — lớp bảo mật và xác minh, tính toán, suy luận, huấn luyện, dữ liệu và lưu trữ
Lớp ứng dụng và dịch vụ
Tài chính Tác nhân chuyển đổi yêu cầu ngôn ngữ tự nhiên thành hành động trên chuỗi.
Tác nhân ARMA của @gizatechxyz đã xử lý hơn 4,6 tỷ USD khối lượng giao dịch tác nhân trên các thị trường cho vay được chọn — hoạt động từng khối trên khuôn khổ AVS của EigenLayer, không quản lý tập trung.
@Infinit_Labs vận hành cụm gồm hơn 20 tác nhân chuyên biệt, có khả năng chuyển đổi ý định như “kiếm 1.000 USD mỗi tháng bằng 1 BTC” thành chiến lược một chạm trên Ethereum, Solana và Base.
@coinvestai by Liquid tích hợp trực tiếp việc thực thi thời gian thực vào ChatGPT và Claude, hỗ trợ giao dịch trên hơn 500 thị trường thông qua Giao thức Bối cảnh Mô hình (Model Context Protocol).
@minara tích hợp Hyperliquid và gần đây gia nhập Lighter. Nó vận hành vòng khép kín đầy đủ “phân tích → ra quyết định → thực thi” thông qua mô hình DMind và hơn 50 tích hợp.
@Cod3xOrg: Một mạng lưới các tác nhân AI nhẹ, có khả năng chuyển đổi ý định thành giao dịch trên chuỗi được xây dựng và thực thi.
@Zyfai_: Một tác nhân DeFAI tự lưu trữ, tự động hóa và tối ưu hóa canh tác lợi nhuận, liên tục tái cân bằng vốn giữa các giao thức nhằm theo đuổi APY đã điều chỉnh rủi ro mà không cần can thiệp thủ công.
Trong thị trường dự đoán, @SynthdataCo là một subnet của Bittensor, vận hành mạng lưới trí tuệ tài chính dự đoán phi tập trung. Các thợ đào cạnh tranh nhau xây dựng mô hình về sự bất định giá ngắn hạn. Hiện mạng lưới này đã cung cấp dữ liệu thời gian thực cho các sản phẩm như Mode AI Quant của thị trường mã hóa Kalshi.
Thanh toán Tác nhân: Máy thanh toán cho máy
Giống như Internet trở thành lớp truyền thông cho nền kinh tế số, blockchain và tiền ổn định (stablecoin) đang trở thành lớp thanh toán cho thanh toán tác nhân.
Tính đến tháng 5 năm 2026, x402 đã xử lý hơn 173 triệu giao dịch trên Base và Solana. Quỹ x402 bao gồm các thành viên như Google, Visa, AWS, Circle, Anthropic, Stripe và Cloudflare. Stripe bắt đầu sử dụng x402 từ tháng 2 năm 2026; AWS ra mắt AgentCore Payments tích hợp sẵn.
Hoạt động mua và bán đang gia tăng, phần lớn giao dịch liên quan đến việc sử dụng theo nhu cầu thực tế: gọi API, dịch vụ suy luận AI, thương mại tác nhân và các tải công việc tương tự. Giai đoạn đầu của chu kỳ “nóng sốt” đã lắng xuống, nhưng mức độ tăng trưởng thực tế bắt đầu bắt kịp.
Đồng thời, Giao thức Thanh toán Máy (Machine Payments Protocol) của Stripe và Tempo đang nổi lên như một lộ trình thứ hai, ghi nhận hơn 411.900 giao dịch và 9.600 người mua kể từ khi ra mắt.
Các mạng lưới này cùng chứng minh rằng thương mại giữa các máy đang chuyển hướng rộng rãi hơn, với phần mềm tác nhân có thể thực hiện giao dịch tự chủ ở tốc độ máy.
Lớp phần mềm trung gian (middleware)
Khi số lượng tác nhân tăng lên, bài toán cốt lõi trở thành việc điều phối: các tác nhân làm thế nào để phát hiện lẫn nhau, chứng minh danh tính và thực hiện giao dịch mà không cần sự can thiệp của con người.
Khoảng trống niềm tin ở đây là điểm nghẽn. Quy mô thị trường thương mại tác nhân ước tính đạt từ 1,5 nghìn tỷ đến 5 nghìn tỷ USD vào năm 2030, nhưng việc áp dụng bị hạn chế bởi một yếu tố — đa số người dùng sẵn sàng để AI thực hiện nghiên cứu, nhưng rất ít người sẵn sàng để AI thực hiện mua hàng thực tế.
Các hệ thống hiện tại vẫn chủ yếu phụ thuộc vào khóa API, gần như không có hệ thống nào coi tác nhân như một thực thể có danh tính rõ ràng.
@GoKiteAI đang xây dựng một L1 chuyên biệt, trong đó danh tính và thanh toán là các nguyên thủy (primitives) nội tại. ERC-8004 là tiêu chuẩn trên Ethereum, cung cấp danh tính và uy tín trên chuỗi cho tác nhân, có thể di chuyển xuyên chuỗi.
Về thị trường, @virtuals_io là hệ điều hành cho nền kinh tế tác nhân trên Base. Đến tháng 6 năm 2026, nó đã xử lý hơn 2,38 triệu nhiệm vụ tác nhân, tạo ra gần 480 triệu USD “GDP tác nhân”.
Tuy nhiên, viên ngọc quý của lớp này là Bittensor. Đây là một mạng lưới gồm các subnet chuyên biệt, mỗi subnet là một nền kinh tế nhỏ, nơi các thợ đào chạy mô hình AI, các bộ xác minh chấm điểm đầu ra, và lượng TAO phát hành chảy tới những người tạo ra công việc hữu ích nhất. Có ba cơ chế khiến mạng lưới này nghiêm túc về mặt kinh tế:
- Việc giảm phân nửa vào tháng 12 năm 2025 sẽ cắt giảm lượng phát hành TAO hàng ngày từ 7.200 xuống còn 3.600, tương ứng với trần cứng 21 triệu TAO.
- Nâng cấp dTAO trao cho mỗi subnet một đồng tiền Alpha riêng và một hồ thanh khoản AMM — thị trường quyết định lượng phát hành.
- Nâng cấp Taoflow (ra mắt tháng 11 năm 2025) phân bổ lượng phát hành thuần túy dựa trên dòng stake ròng. Một subnet nếu unstake nhiều hơn stake thì có thể giảm về 0. Thiết kế mang tính Darwin.
Mạng lưới hiện có hơn 128 subnet hoạt động, ba subnet tính toán hàng đầu được báo cáo đã đạt tổng doanh thu thường niên (ARR) 20 triệu USD trong vòng ba tháng sau khi bắt đầu thương mại hóa. Chủ nghĩa Darwin chính là sản phẩm.
Các dự án khác tập trung vào việc xây dựng blockchain AI chuyên biệt hoặc cung cấp các công cụ, khung và cơ chế khuyến khích cần thiết để cộng đồng sở hữu hệ sinh thái AI.
@NEARProtocol: Một lớp điều phối vô hình, kết hợp thanh toán, danh tính, bảo mật, TEE, MPC và bảo vệ thông tin cá nhân (PII), phục vụ cho các tác nhân tự chủ.
@base — “trụ sở chính” của nền kinh tế tác nhân. Base MCP cho phép các công cụ AI như Claude, ChatGPT và Cursor thực hiện hành động trên chuỗi thông qua prompt trên các nền tảng như Uniswap, Morpho và Avantis — hoán đổi, chuyển khoản và tương tác DeFi.
@SentientAGI: Hệ sinh thái GRID của nó kết nối các tác nhân, mô hình, dữ liệu và tính toán, định tuyến truy vấn tới các bên tham gia chuyên biệt nhằm cung cấp kết quả tốt nhất.
@gensynai: Thực thi học máy (ML) có thể xác minh, điều phối phần cứng phân tán để huấn luyện và suy luận, đồng thời đảm bảo tính đáng tin cậy của công việc, mạng lưới được điều phối bởi token $AI.
@SaharaAI kết nối dữ liệu, mô hình, tác nhân và phần thưởng trong một hệ sinh thái AI gốc duy nhất.
Lớp cơ sở hạ tầng
Cơ sở hạ tầng là khung xương của AI — các nguyên thủy tính toán, suy luận, huấn luyện, dữ liệu và bảo mật nền tảng mà mọi lớp phía trên đều phụ thuộc. Đây là lớp đòi hỏi vốn đầu tư lớn nhất trong ngăn xếp AI phi tập trung.
Tính toán phi tập trung
@akashnet vận hành thị trường đấu giá ngược, nơi các nhà cung cấp đấu giá để giành quyền xử lý khối lượng công việc của bạn. Quý I năm 2026, số hợp đồng thuê mới tăng 27%, đạt hơn 43.500 hợp đồng, và đây là quý tăng thứ ba liên tiếp. Dịch vụ suy luận AkashML của nó đã xử lý gần 120 tỷ token trong tháng Tư, với giá rẻ hơn 60–85% so với các đám mây phổ biến.
@rendernetwork công bố mức tăng trưởng về lượng sử dụng tăng 428% theo năm.
@ionet tập hợp hơn 130.000 GPU từ hơn 130 quốc gia trên Solana.
@AethirCloud là một trong số ít dự án thực sự có doanh thu: báo cáo khoảng 166 triệu USD ARR (quý III năm 2025), cung cấp hơn 1,5 tỷ giờ tính toán.
Suy luận phân tán và có thể xác minh
Suy luận chiếm hơn 70% chi phí vận hành AI, và Goldman Sachs dự báo AI tác nhân sẽ thúc đẩy lượng tiêu thụ token tăng 24 lần vào năm 2030 — đạt 120 nghìn tỷ token/tháng.
Giải pháp phi tập trung là làm cho suy luận trở nên rẻ hơn, riêng tư hơn và có thể xác minh.
@AskVenice đã cung cấp hơn 50 tỷ token mỗi ngày cho hơn 2 triệu người dùng thông qua các mô hình riêng tư và không kiểm duyệt, lợi thế cạnh tranh của họ nằm ở mô hình.
@OpenGradient đã xử lý hơn 2 triệu lần suy luận có thể xác minh, tạo ra hơn 500.000 bằng chứng zkML.
@chutes_ai: Các nhà phát triển có thể triển khai và mở rộng mô hình AI thông qua API đơn giản, được hỗ trợ bởi các thợ đào GPU, chi phí thấp hơn tối đa 85% so với AWS. Doanh thu nền tảng được chuyển thành nhu cầu token thông qua cơ chế stake tự động.
@dphnAI — mạng lưới suy luận AI phi tập trung. Đáng chú ý, Dolphin phát triển mô hình không kiểm duyệt được sử dụng bởi Venice AI và dành 100% doanh thu mạng lưới để mua lại token.
Huấn luyện phi tập trung
Huấn luyện là bài toán khó nhất và cũng có ảnh hưởng lớn nhất — nó quyết định liệu các mô hình tiên tiến có nhất thiết phải được xây dựng nội bộ trong phòng thí nghiệm của ba hoặc bốn doanh nghiệp hay không.
INTELLECT-1 (10 tỷ tham số) của @PrimeIntellect là lần chạy huấn luyện phân tán toàn cầu đầu tiên; INTELLECT-2 (32 tỷ tham số) là lần chạy học tăng cường (RL) phân tán đầu tiên.
@tplr_ai thành công huấn luyện mô hình Covenant-72B trên hơn 70 nút phân tán, xử lý khoảng 1,1 nghìn tỷ token và giảm chi phí truyền thông 146 lần.
@NousResearch: Mạng Psyche của họ thực hiện huấn luyện phân tán chịu lỗi, và Hermes 4.3 trở thành mô hình Hermes đầu tiên được huấn luyện trên cơ sở hạ tầng phi tập trung thay vì cụm tập trung.
SN9 — subnet IOTA của @MacrocosmosAI thực hiện huấn luyện sơ bộ LLM phi tập trung và “huấn luyện tại nhà”; subnet Data Universe (SN13) xử lý lớp dữ liệu. Các thuật toán DiLoCo có mức truyền thông thấp giúp các GPU phân tán khắp toàn cầu cộng tác hiệu quả mà không cần mạng nội bộ siêu tốc của trung tâm dữ liệu.
Khả năng sử dụng dữ liệu và lưu trữ phi tập trung
Khi quy mô tải công việc AI tăng lên, cả hai yếu tố này đều đang trở thành điểm nghẽn. Các mô hình tiên tiến tiêu thụ lượng dữ liệu tươi khổng lồ, trong khi nhu cầu lưu trữ đã tăng vọt đến mức các nhà cung cấp ổ cứng hàng đầu báo cáo công suất đã được đặt trước nhiều năm.
Kinh tế học rất hấp dẫn. Lưu trữ phi tập trung có thể rẻ hơn 60–80% so với nhà cung cấp đám mây truyền thống, các mạng như @Filecoin cung cấp giá lưu trữ dưới 1 USD/tháng/TB, trong khi giải pháp tập trung tương đương khoảng 30 USD.
@grass trả tiền cho băng thông rảnh rỗi của 2,5 triệu nút đến từ 190 quốc gia, giúp các phòng thí nghiệm AI có thể thu thập dữ liệu từ mạng internet thời gian thực.
@WalrusProtocol là một đối thủ cạnh tranh đang nổi lên nhanh chóng do @Mysten_Labs xây dựng, chuyên về lưu trữ và khả năng sử dụng dữ liệu phi tập trung — sử dụng mã sửa lỗi hai chiều (2D erasure coding) để lưu trữ hiệu quả các “blob” lớn, ngày càng được định vị như một lớp bộ nhớ bền vững cho các tác nhân AI.
@eigencloud: Một nền tảng điện toán có thể xác minh được xây dựng dựa trên khả năng sử dụng dữ liệu, điện toán có thể xác minh và giải quyết tranh chấp. Được bảo đảm bằng ETH tái stake, lý thuyết nền tảng này cho phép các tác nhân AI hoạt động với đảm bảo mật mã, khiến hành động có thể chứng minh, kiểm toán và thực thi được.
@vana — một EVM L1, nơi các DAO dữ liệu (Data DAOs) và các hồ thanh khoản dữ liệu (Data Liquidity Pools) biến dữ liệu cá nhân thành tài sản có thể mã hóa và giao dịch được.
@reppo và @oroagents xây dựng các tập dữ liệu chất lượng cao và đáng tin cậy cho huấn luyện AI thông qua các cuộc thi có phần thưởng.
Lớp bảo mật và xác minh
Người dùng AI bình thường không thể xác minh liệu mô hình có xử lý dữ liệu của họ một cách riêng tư, phép tính có được thực hiện đúng hay không, thậm chí liệu mô hình được tuyên bố có thực sự được sử dụng hay không.
Năm 2026, bảo mật và xác minh đang trở thành điều kiện tiên quyết đối với AI, chứ không còn là tính năng bổ sung.
@nillion — “máy tính mù”, sử dụng MPC và Nil Message Compute riêng để thực hiện phép tính trên dữ liệu được mã hóa mà không cần giải mã. Các trường hợp sử dụng bao gồm suy luận AI riêng tư, cơ sở dữ liệu mã hóa và RAG riêng tư (cho phép AI truy vấn cơ sở tri thức riêng mà không tiết lộ nội dung).
@Arcium: Mạng điện toán bí mật phi tập trung trên Solana. Các trường hợp sử dụng bao gồm Umbra (chuyển khoản ẩn / lợi nhuận riêng tư) và huấn luyện AI bí mật trên các tập dữ liệu nhạy cảm.
@OasisProtocol: L1 ưu tiên bảo mật, sử dụng ROFL (Runtime Offchain Logic), một khung dựa trên TEE để chạy các phép tính ngoài chuỗi có thể xác minh và bảo vệ quyền riêng tư — dành cho tác nhân AI, huấn luyện mô hình hoặc oracle.
@octra: L1 ưu tiên bảo mật hỗ trợ FHE bản địa, sử dụng giải pháp HFHE (Hypergraph FHE) độc quyền, được thiết kế đặc biệt cho phép tính mã hóa song song và thông lượng cao.
@eigencloud: Một ứng cử viên nặng ký về xác minh, được xây dựng trên nền tảng bảo mật tái stake của EigenLayer. EigenAI (suy luận LLM có thể xác minh là một API tương thích OpenAI dành cho các mô hình mã nguồn mở, trong đó prompt và phản hồi có thể chứng minh là chưa bị thay đổi) và EigenCompute (thực thi ngoài chuỗi có thể xác minh dành cho logic tác nhân).
@PhalaNetwork. GPU đám mây mạnh mẽ nhưng không riêng tư; Phala làm cho khối lượng công việc có thể chứng minh được, thậm chí ẩn đối với chính Phala. Sản phẩm cốt lõi của nó — GPU TEE trên Phala Cloud — triển khai các mô hình mã nguồn mở lên phần cứng, cung cấp API tương thích OpenAI, trong đó mỗi lần suy luận đều đi kèm bằng chứng mã hóa.
Xu hướng AI phi tập trung năm 2026–2027
Nhu cầu AI tăng nhanh hơn khả năng đáp ứng của cơ sở hạ tầng, và các tác nhân AI đang trở thành động lực tăng trưởng chủ đạo — lộ trình trên chuỗi đã sẵn sàng.
Tính toán đang chuyển mình thành một loại tài sản, và thị trường trên chuỗi đang trở thành lớp tài chính của nó. Các nhà đầu tư tổ chức đang chuyển từ thử nghiệm sang đầu tư vào cơ sở hạ tầng.
Kinh tế học token đang trở thành lợi thế cấu trúc của AI phi tập trung trong việc điều phối vốn, tính toán và dữ liệu. Cơ hội đang mở rộng từ AI sang robot, máy móc tự chủ và AI vật lý.
Kết luận
AI phi tập trung đang tăng trưởng trên các lớp chính của ngăn xếp — cơ sở hạ tầng, phần mềm trung gian và ứng dụng — thể hiện qua doanh thu từ tính toán, nền kinh tế tác nhân đang mở rộng và các chương trình huấn luyện phân tán quy mô lớn.
Tuy nhiên, lĩnh vực này vẫn còn ở giai đoạn đầu. Doanh thu thường chậm hơn các kích thích token, việc áp dụng vẫn chưa đồng đều, dù tổng đầu tư vào AI đang tăng mạnh, AI phi tập trung vẫn chỉ chiếm một phần nhỏ trong tổng vốn đầu tư mạo hiểm. Các mạng dựa trên token có thể là lợi thế mạnh mẽ, nhưng chỉ khi thiết kế bắt giữ giá trị được thực hiện đúng.
Dù vậy, sự xuất hiện của các dự án như Bittensor, NEAR, Virtuals, Base và Venice cho thấy AI phi tập trung đang chuyển mình từ một câu chuyện đầu cơ thành một mô hình mới để điều phối tính toán, dữ liệu, vốn và trí tuệ.
Chào mừng tham gia cộng đồng chính thức TechFlow
Nhóm Telegram:https://t.me/TechFlowDaily
Tài khoản Twitter chính thức:https://x.com/TechFlowPost
Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News













