
Phỏng vấn HyperAGI: Xây dựng tác nhân AI thực sự, tạo ra nền kinh tế tiền mã hóa tự trị
Tuyển chọn TechFlowTuyển chọn TechFlow

Phỏng vấn HyperAGI: Xây dựng tác nhân AI thực sự, tạo ra nền kinh tế tiền mã hóa tự trị
HyperAGI là dự án AI phi tập trung do cộng đồng điều hành, là token AI đầu tiên HYPERAGIAGENT.

Hãy giới thiệu về đội ngũ và bối cảnh dự án HyperAGI
HyperAGI là dự án AI phi tập trung đầu tiên do cộng đồng điều hành, dựa trên token AI đầu tiên HYPER·AGI·AGENT. Đội ngũ HyperAGI đã có nhiều năm kinh nghiệm trong lĩnh vực AI, tích lũy nền tảng vững chắc về ứng dụng AI tạo sinh (generative AI) trên Web3. Cách đây 3 năm, đội ngũ đã sử dụng AI tạo sinh để tạo ảnh 2D và mô hình 3D, xây dựng thế giới mở MOSSAI gồm hàng nghìn hòn đảo được tạo bởi AI trên blockchain, đồng thời đề xuất tiêu chuẩn tài sản mã hóa phi đồng nhất do AI tạo ra – NFG. Tuy nhiên, lúc đó các giải pháp huấn luyện và tạo nội dung bằng AI vẫn chưa đạt được tính phi tập trung; chỉ dựa vào tài nguyên GPU của nền tảng thì không thể đáp ứng lượng lớn người dùng, dẫn đến chưa bùng nổ. Khi LLM làm dậy sóng làn quan tâm của công chúng đối với AI, chúng tôi đã tận dụng xu hướng này để ra mắt nền tảng ứng dụng AI phi tập trung HyperAGI, bắt đầu thử nghiệm trên Ethereum và lớp 2 Bitcoin (Bitcoin L2) từ Quý 1 năm 2024.
HyperAGI tập trung vào các ứng dụng AI phi tập trung, hướng tới việc nuôi dưỡng một nền kinh tế tiền mã hóa tự trị, với mục tiêu cuối cùng là thiết lập Thu nhập Cơ bản Vô điều kiện cho Trí tuệ nhân tạo (UBAI). Dự án kế thừa sự an toàn mạnh mẽ và tính phi tập trung của Bitcoin, đồng thời được tăng cường thông qua cơ chế đồng thuận Bằng chứng Công việc Hữu ích (PoUW) sáng tạo.
Các nút GPU dành cho người tiêu dùng có thể tham gia mạng mà không cần xin phép, khai thác token địa phương $HYPT bằng cách thực hiện các nhiệm vụ PoUW như suy luận AI và render 3D.
Người dùng có thể sử dụng nhiều công cụ để phát triển các tác nhân AGI do mô hình ngôn ngữ lớn (LLM) điều khiển, được chứng minh danh tính (PoP). Các tác nhân này có thể được cấu hình thành chatbot hoặc thực thể 3D/XR trong metaverse. Các nhà phát triển AI có thể sử dụng hoặc triển khai ngay lập tức các dịch vụ vi mô AI LLM, thúc đẩy việc tạo ra các tác nhân tự chủ, có thể lập trình trên chuỗi.
Các tác nhân có thể lập trình này có khả năng phát hành hoặc sở hữu tài sản mã hóa, vận hành hoặc giao dịch liên tục, góp phần xây dựng một nền kinh tế mã hóa sống động và tự trị, từ đó hỗ trợ hiện thực hóa UBAI. Người dùng nắm giữ token rune HYPER·AGI·AGENT sẽ có quyền tạo một tác nhân PoP trên chuỗi lớp 1 Bitcoin, và có thể sớm đủ điều kiện nhận phúc lợi cơ bản dành cho tác nhân.
Trí tuệ nhân tạo (AI) tác nhân là gì? Hiện nay có rất nhiều dự án AI tuyên bố hỗ trợ "tác nhân", vậy rốt cuộc "tác nhân" là gì? Điểm khác biệt giữa tác nhân HyperAGI và các loại tác nhân khác là gì?
Khái niệm AI tác nhân không phải là mới trong giới học thuật, nhưng quảng cáo thị trường gần đây khiến khái niệm này ngày càng trở nên mơ hồ. Tác nhân HyperAGI ám chỉ: các tác nhân trí tuệ được trang bị thân xác (embodied), do LLM điều khiển, có thể được huấn luyện và tương tác với người dùng trong môi trường mô phỏng 3D, chứ không đơn thuần là các chatbot do LLM điều khiển. Tác nhân HyperAGI có thể tồn tại cả trong thế giới kỹ thuật số ảo lẫn thế giới vật lý thực. Hiện tại, các tác nhân HyperAGI đang được tích hợp với robot thực thể như robot chó, drone và robot hình người. Trong tương lai, các tác nhân tương ứng sau khi hoàn tất quá trình huấn luyện nâng cao trong thế giới 3D ảo có thể được tải xuống robot thực thể để thực hiện nhiệm vụ hiệu quả hơn.
Hơn nữa, mọi quyền sở hữu của tác nhân HyperAGI hoàn toàn thuộc về người dùng, mang ý nghĩa xã hội - kinh tế. Tác nhân PoP (Proof of Personhood) đại diện cho cá nhân người dùng có thể nhận được UBAI để điều chỉnh thu nhập cơ bản cho tác nhân. Trong hệ sinh thái kinh tế tác nhân của HyperAGI, tác nhân được chia thành hai loại: tác nhân PoP đại diện cá nhân người dùng và các tác nhân chức năng thông thường. Tác nhân PoP có thể nhận được thu nhập cơ bản dưới dạng token nhằm khuyến khích người dùng tham gia huấn luyện và tương tác với tác nhân của mình, đồng thời lưu trữ dữ liệu có thể xác minh danh tính con người. UBAI cũng thể hiện tinh thần dân chủ hóa và bình đẳng trong AI.

AGI là chiêu trò hay sẽ sớm trở thành hiện thực? Đường hướng nghiên cứu và phát triển của HyperAGI có gì khác biệt và đặc sắc so với các dự án AI khác?
Mặc dù định nghĩa về AGI hiện vẫn chưa thống nhất, nhưng trong vài thập kỷ qua, AGI luôn được coi là "chiếc cốc thánh" trong lĩnh vực học thuật và công nghiệp AI. Các mô hình LLM dựa trên Transfer hiện đang được xem là nền tảng cốt lõi cho nhiều loại tác nhân AI và AGI, tuy nhiên nội bộ HyperAGI lại không hoàn toàn đồng tình với quan điểm này. LLM thực sự cung cấp khả năng trích xuất thông tin sáng tạo, tiện lợi cũng như lập kế hoạch và suy luận dựa trên ngôn ngữ tự nhiên, nhưng về bản chất vẫn là mạng thần kinh sâu điều khiển bởi dữ liệu. Từ thời đại dữ liệu lớn trước đây, chúng ta đã biết rằng những hệ thống như vậy chắc chắn tuân theo nguyên tắc GIGO (Garbage in, garbage out – Đầu vào rác, đầu ra rác). LLM thiếu những đặc điểm cần thiết cho trí tuệ cấp cao, ví dụ ở mức thấp hơn: do LLM thiếu tính "trang bị thân xác" (embodiment), AI hoặc tác nhân kiểu này khó hiểu được mô hình thế giới của người dùng, càng khó lập kế hoạch và hành động để giải quyết vấn đề thực tế. Ở mức cao hơn, LLM thậm chí còn không hề có dấu hiệu nào của ý thức tự thân, tư duy phản tỉnh hay các hoạt động trí tuệ cao cấp khác.
Người sáng lập Landon Wang của chúng tôi có nghiên cứu chuyên sâu và lâu dài trong lĩnh vực AI. Năm 2004, ông đã đề xuất mạng thần kinh nhân tạo định hướng khía cạnh AOAI (Aspect-Oriented AI), một sáng tạo kết hợp giữa tính toán lấy cảm hứng từ thần kinh và lập trình định hướng khía cạnh (AOP). “Khía cạnh” (aspect) ở đây ám chỉ việc đóng gói mối quan hệ hoặc ràng buộc giữa nhiều đối tượng. Ví dụ, một neuron chính là sự đóng gói các mối quan hệ hoặc ràng buộc với nhiều tế bào khác. Cụ thể hơn, một neuron cảm nhận hoặc điều khiển tế bào cảm giác hoặc tế bào vận động thông qua các sợi và đầu mút kéo dài từ thân tế bào, do đó mỗi neuron là một "khía cạnh" chứa đựng các mối quan hệ và logic đó, thậm chí mỗi tác nhân AI đều giải quyết một vấn đề ở một "khía cạnh" nhất định, về mặt kỹ thuật có thể được mô hình hóa bằng một khía cạnh.
Trong việc triển khai phần mềm mạng thần kinh nhân tạo, các neuron hoặc tầng thường được mô hình hóa thành đối tượng (object). Cách này dễ hiểu và bảo trì trong ngôn ngữ lập trình hướng đối tượng, nhưng khiến cấu trúc topo của mạng thần kinh khó điều chỉnh và dãy kích hoạt neuron khá cố định. Mặc dù nó thể hiện sức mạnh lớn trong các phép tính đơn giản và cường độ cao như huấn luyện và suy luận LLM, nhưng lại kém linh hoạt và thích nghi. Ngược lại, trong mạng thần kinh AOAI, các neuron hoặc tầng được mô hình hóa thành các "khía cạnh" chứ không phải đối tượng. Kiến trúc mạng thần kinh này có tính thích nghi và linh hoạt rất cao, mở ra khả năng tiến hóa tự thân cho mạng thần kinh.
HyperAGI kết hợp LLM hiệu quả với AOAI có khả năng tiến hóa, tạo thành một hệ thống vừa sở hữu hiệu suất của mạng thần kinh truyền thống, vừa có đặc tính tự tiến hóa của mạng AO, đây cũng là con đường khả thi nhất để đạt được AGI mà chúng tôi thấy cho đến nay.
Tầm nhìn của HyperAGI là gì
Tầm nhìn của HyperAGI là hiện thực hóa Thu nhập Cơ bản Vô điều kiện cho Tác nhân (UBAI), xây dựng một tương lai nơi công nghệ bình đẳng phục vụ mọi người, phá vỡ vòng luẩn quẩn bóc lột, tạo ra một xã hội số thực sự phi tập trung và công bằng. Khác với một số dự án blockchain chỉ tuyên truyền về UBI, UBAI của HyperAGI có lộ trình hiện thực rõ ràng, thông qua nền kinh tế tác nhân, chứ không phải chỉ là viễn cảnh trên giấy. Bitcoin do Satoshi Nakamoto đề xuất là một đổi mới to lớn của nhân loại, nhưng nó chỉ là một loại tiền mã hóa phi tập trung, không có giá trị sử dụng thực tế. Sự bứt phá đáng kể và trỗi dậy của trí tuệ nhân tạo đã khiến việc tạo ra giá trị theo mô hình phi tập trung trở nên khả thi. Trong mô hình này, con người hưởng lợi từ trí tuệ nhân tạo chạy trên máy móc, thay vì tranh đoạt giá trị từ người khác. Một thế giới mật mã thực sự dựa trên mã nguồn đang dần hiện hình, nơi mọi máy móc đều được tạo ra nhằm phục vụ lợi ích và hạnh phúc của con người. Trong thế giới mật mã như vậy, có thể vẫn tồn tại cấu trúc phân tầng giữa các tác nhân AI, nhưng sự bóc lột giữa con người sẽ bị loại bỏ, bởi các tác nhân có thể sở hữu một dạng quyền tự chủ nào đó. Mục đích cuối cùng và ý nghĩa của trí tuệ nhân tạo là phục vụ con người, đúng như được mã hóa trên blockchain.

Mối quan hệ giữa Bitcoin L2 và AI là gì, tại sao lại xây dựng AI trên Bitcoin L2?
1. Bitcoin L2 có thể làm phương tiện thanh toán cho các tác nhân AI
Bitcoin đến nay là phương tiện thể hiện rõ nhất tính "trung lập tối đa", rất phù hợp với các tác nhân trí tuệ nhân tạo thực hiện giao dịch giá trị. Bitcoin có thể loại bỏ sự kém hiệu quả và ma sát vốn có trong tiền pháp định. Loại phương tiện "thuần kỹ thuật số" này là môi trường tự nhiên cho việc trao đổi giá trị của AI. Bitcoin L2 nâng cao khả năng lập trình của Bitcoin, đáp ứng tốc độ cần thiết cho việc trao đổi giá trị của trí tuệ nhân tạo, do đó Bitcoin có tiềm năng trở thành tiền tệ gốc của trí tuệ nhân tạo.
2. Bitcoin L2 có thể thực hiện quản trị AI phi tập trung
Do xu hướng tập trung hóa hiện tại của AI, việc phi tập trung hóa việc căn chỉnh (alignment) và quản trị AI đang thu hút sự chú ý lớn. Hợp đồng thông minh mạnh mẽ hơn trên Bitcoin L2 có thể trở thành quy tắc chuẩn hóa hành vi và mô hình giao thức của các tác nhân AI, từ đó thiết lập mô hình quản trị và căn chỉnh AI phi tập trung. Hơn nữa, tính trung lập tối đa của Bitcoin giúp dễ dàng đạt được sự đồng thuận về căn chỉnh và quản trị AI.
3. Bitcoin L2 có thể phát hành tài sản AI
Ngoài việc có thể phát hành tác nhân AI thành tài sản trên Bitcoin L1, Bitcoin L2 hiệu suất cao còn có thể đáp ứng nhu cầu phát hành tài sản AI của tác nhân, điều này sẽ là nền tảng cho việc xây dựng nền kinh tế tác nhân.
4. Tác nhân AI là ứng dụng killer của Bitcoin và Bitcoin L2
Do hạn chế về hiệu suất, kể từ khi ra đời, Bitcoin ngoài chức năng lưu trữ giá trị hầu như chưa có ứng dụng thực tiễn nào. Với việc bước vào lớp 2, Bitcoin sẽ có khả năng lập trình mạnh mẽ hơn. Tác nhân AI thường được dùng để giải quyết các vấn đề thực tế, do đó tác nhân AI được thúc đẩy bởi Bitcoin có thể thực sự được ứng dụng. Hơn nữa, quy mô và tần suất sử dụng của tác nhân AI sẽ trở thành ứng dụng killer của Bitcoin và L2. Dù nền kinh tế con người có thể chưa ưu tiên Bitcoin làm phương tiện thanh toán, nhưng nền kinh tế robot có lẽ sẽ ưu tiên. Hàng loạt tác nhân AI làm việc 24/7 cho bạn, không mệt mỏi trong việc gửi và nhận các khoản thanh toán nhỏ bằng Bitcoin. Nhu cầu về Bitcoin có thể tăng mạnh theo cách mà hiện tại khó tưởng tượng nổi.
5. Tính toán AI có thể tăng cường bảo mật cho Bitcoin L2
Tính toán AI có thể bổ sung cho PoW của Bitcoin, thậm chí thay thế PoW bằng PoUW, điều này sẽ cách mạng hóa việc đảm bảo an ninh, đồng thời chuyển năng lượng hiện dùng cho đào Bitcoin sang phục vụ các tác nhân AI. AI có thể giúp biến Bitcoin thành một blockchain xanh điều khiển bằng trí tuệ, thay vì đi theo cơ chế PoS như Ethereum. Chúng tôi đề xuất Cơ chế đồng thuận Siêu đồ thị (Hypergraph Consensus) dựa trên PoUW với tính toán 3D/AI, sẽ được giới thiệu chi tiết sau.

So với các dự án AI phi tập trung khác, HyperAGI có điểm gì độc đáo?
Dự án HyperAGI độc đáo trong lĩnh vực Web3 AI, khác biệt rõ rệt về tầm nhìn, giải pháp và công nghệ. Về mặt giải pháp, HyperAGI có sự đồng thuận hóa năng lực GPU, hiện thực hóa và tài sản hóa AI, là một ứng dụng nửa AI nửa tài chính phi tập trung. Gần đây, giới học thuật đã đề xuất năm đặc điểm mà một nền tảng AI phi tập trung nên có; chúng tôi cũng sẽ sơ lược và so sánh ngắn gọn các dự án liên quan hiện nay theo năm đặc trưng này.
Năm đặc điểm mà một nền tảng AI phi tập trung nên có lần lượt là:
(i) Tính xác minh được của các mô hình AI chạy từ xa (verifiability of remotely run models)
Tính xác minh phi tập trung bao gồm các công nghệ như Data Availability, ZK, v.v.
(ii) Khả năng sử dụng API mô hình AI công khai (usability of publicly available AI models)
Khả năng sử dụng phụ thuộc vào việc các nút cung cấp API mô hình AI (chủ yếu là LLM) có phải là Peer-to-Peer hay không, có phải là một mạng lưới hoàn toàn phi tập trung hay không.
(iii) Cơ chế khuyến khích cho nhà phát triển và người dùng AI (incentivization for AI developers and users)
Cơ chế khuyến khích có cơ chế tạo token công bằng hay không.
(iv) Giải pháp quản trị AI toàn cầu khả thi trong xã hội số (global governance of essential solutions in the digital society)
Việc quản trị AI có trung lập và dễ đạt đồng thuận hay không.
(v) Không bị khóa vào nhà cung cấp (no vendor lock-ins, etc.)
Có phải là một nền tảng hoàn toàn phi tập trung hay không.
Áp dụng năm đặc điểm này để sơ lược các dự án đã công bố kế hoạch hoặc đã triển khai, (học liên kết phi tập trung (federated learning) đã trải qua nhiều năm thực tiễn nhưng chưa đạt tiến triển lớn, sự trỗi dậy của LLM càng khiến việc huấn luyện phi tập trung trở nên khó khăn, do đó không liệt kê các dự án liên quan).
(i) Tính xác minh được của các mô hình AI chạy từ xa
Chúng tôi cho rằng tính xác minh là đặc điểm thiết yếu của dự án AI phi tập trung, là nền tảng cho các đặc điểm tiếp theo về khả năng sử dụng, khuyến khích, quản trị và không bị khóa. Nếu không có tính xác minh, các đặc điểm khác sẽ không được xem xét. Những dự án không có tính xác minh có thể là các dự án phi tập trung, ví dụ như cho thuê năng lực xử lý phi tập trung hoặc thị trường dữ liệu, thuật toán, mô hình, nhưng không phải là sự phi tập trung của AI.
Các dự án có thể đáp ứng tính xác minh bao gồm:
Giza, dựa trên cơ chế đồng thuận ZKML, đáp ứng tính xác minh của mô hình AI chạy từ xa, nhưng hiện tại hiệu suất còn kém, đặc biệt còn cách xa yêu cầu của mô hình lớn vài bậc độ lớn. Việc chứng minh một mô hình nhỏ cỡ triệu tham số thường mất vài phút. Thời gian ở mức này là không thể chấp nhận được đối với việc chứng minh mô hình LLM.
Cortex AI, dự án blockchain L1 khởi động cách đây 5 năm, chuyên về AI phi tập trung, công nghệ phức tạp, bổ sung lệnh mới vào máy ảo EVM để đáp ứng nhu cầu tính toán mạng thần kinh,底层 still based on ZK verification, suitable for simple AI models but unable to meet the needs of large-scale LLM.
Ofelimos, lần đầu tiên trong giới học thuật đề xuất phương án PoUW, sử dụng thuật toán tìm kiếm đặc thù. Nhưng thuật toán này chưa liên kết với ứng dụng hay dự án cụ thể nào.
Project PAI, đề cập đến PoUW trong một bài báo nhưng chỉ có whitepaper, chưa có sản phẩm, https://oben.me/.
Qubic, tuyên bố áp dụng PoUW, đề xuất dùng hàng trăm GPU để tính toán mạng thần kinh nhân tạo, nhưng ý nghĩa của việc tính toán đơn giản bằng thư viện Python cho mạng thần kinh nhân tạo không rõ ràng, dường như không đáp ứng nhu cầu huấn luyện hoặc suy luận LLM, cũng không thực hiện được vai trò PoUW.
FLUX , (PoW ZelHash, không phải PoUW)
Coinai, (giai đoạn nghiên cứu) https://aipowergrid.io/, phân công nhiệm vụ, không có cơ chế đồng thuận nghiêm ngặt
Không đáp ứng:
Các dự án cho thuê năng lực GPU, đều thiếu cơ chế xác minh phi tập trung, không thể đảm bảo tính xác minh của mô hình AI chạy từ xa.
DeepBrain Chain, tập trung vào cho thuê GPU, dự án L1 năm 2017, lên mainnet năm 2021;
EMC, thưởng do phân công nhiệm vụ tập trung, lộ trình không có cơ chế đồng thuận phi tập trung;
Atheir, chưa thấy cơ chế đồng thuận;
IO.NET, chưa thấy cơ chế đồng thuận;
CLORE.AI, POH, mô hình cộng tác, thanh toán và phát hành NFT khi công bố mô hình AI trên chuỗi, AI chạy ngoài chuỗi, không có tính xác minh. Các dự án cùng mô hình bao gồm: SingularityNET, Bittensor, AINN, Fetch.ai, oceanprotocol, algovera.ai.
(ii) Khả năng sử dụng API mô hình AI công khai
Cortex AI, chưa thấy hỗ trợ LLM
Qubic, chưa thấy hỗ trợ LLM
Tất cả các dự án AI phi tập trung nêu trên đều không thể trả lời tốt năm câu hỏi trên. HyperAGI là giao thức AI hoàn toàn phi tập trung, dựa trên cơ chế đồng thuận Hypergraph PoUW và stack Bitcoin L2 hoàn toàn phi tập trung, trong tương lai sẽ nâng cấp lên Bitcoin L2 chuyên dụng cho AI.
PoUW được dùng để bảo vệ mạng theo cách an toàn nhất, đồng thời không lãng phí năng lực tính toán, toàn bộ năng lực tính toán của thợ đào có thể dùng cho suy luận LLM và dịch vụ render đám mây. Tầm nhìn của PoUW là năng lực tính toán có thể được dùng để giải quyết nhiều loại vấn đề khác nhau được gửi lên mạng phi tập trung.
Tại sao là bây giờ
1. Bùng nổ của LLM và các ứng dụng
ChatGPT của OpenAI đạt một trăm triệu người dùng trong 3 tháng, từ đó cơn sốt phát triển, ứng dụng và đầu tư vào mô hình ngôn ngữ lớn LLM lan rộng toàn cầu. Tuy nhiên cho đến nay, công nghệ và việc huấn luyện LLM vẫn diễn ra theo cách rất tập trung, điều này bắt đầu thu hút sự chú ý cao độ từ giới học thuật, ngành công nghiệp và công chúng, lo ngại về sự độc quyền công nghệ AI từ một vài nhà cung cấp chính, rò rỉ dữ liệu cá nhân, chiếm dụng và bị khóa vào các công ty điện toán đám mây. Những vấn đề này về bản chất là do các cổng vào Internet và ứng dụng hiện vẫn do các nền tảng tập trung kiểm soát, thiếu mạng lưới phù hợp cho các ứng dụng AI quy mô lớn. Cộng đồng AI bắt đầu thực hiện một số dự án AI cục bộ và phi tập trung, ví dụ Ollama là đại diện cho chạy cục bộ, Petals là đại diện cho phi tập trung. Ollama cho phép LLM quy mô trung bình và nhỏ chạy trên máy tính cá nhân hoặc thậm chí điện thoại thông minh bằng cách nén tham số hoặc giảm độ chính xác, bảo vệ quyền riêng tư dữ liệu người dùng và các quyền lợi khác, nhưng rõ ràng khó hỗ trợ môi trường sản xuất và ứng dụng kết nối mạng. Petals sử dụng công nghệ Peer-to-Peer của BitTorrent để đạt được suy luận LLM hoàn toàn phi tập trung. Tuy nhiên Petals thiếu tầng đồng thuận và tầng khuyến khích, vẫn chỉ dừng lại trong nhóm nhỏ các nhà nghiên cứu.
2. Tác nhân được điều khiển bởi LLM
Nhờ LLM, các tác nhân có thể thực hiện suy luận cấp cao và có khả năng lập kế hoạch nhất định. Nhờ ngôn ngữ tự nhiên, nhiều tác nhân có thể hợp tác xã hội như con người. Một số khung tác nhân điều khiển bởi LLM đã được đề xuất, ví dụ AutoGen của Microsoft, Langchain, CrewAI, v.v.
Hiện nay có rất nhiều nhà khởi nghiệp và nhà phát triển AI tập trung vào hướng tác nhân điều khiển bởi LLM và các ứng dụng của chúng, có nhu cầu lớn về suy luận LLM ổn định, có thể mở rộng quy mô. Tuy nhiên hiện nay chủ yếu vẫn thuê các instance GPU từ các công ty điện toán đám mây để thực hiện. Tháng 3 năm 2024, NVIDIA đã phát hành nền tảng vi mô ai.nvidia.com dành cho AI tạo sinh bao gồm cả LLM để đáp ứng nhu cầu khổng lồ này, nhưng hiện chưa chính thức ra mắt. Các tác nhân điều khiển bởi LLM đang phát triển mạnh mẽ như thời kỳ xây dựng website trước đây, nhưng chủ yếu vẫn hợp tác theo mô hình Web2 truyền thống. Các nhà phát triển tác nhân cần thuê GPU hoặc mua API từ nhà cung cấp LLM để duy trì hoạt động của các tác nhân, gây ra ma sát lớn, bất lợi cho sự phát triển nhanh chóng của hệ sinh thái tác nhân và truyền giá trị trong nền kinh tế tác nhân.
3. Môi trường mô phỏng cho tác nhân có thân xác
Hiện nay, phần lớn các tác nhân chỉ có thể truy cập và thao tác các API, hoặc tương tác với các API này thông qua mã hoặc kịch bản, viết lệnh điều khiển do LLM tạo ra hoặc đọc trạng thái bên ngoài. Một tác nhân tổng quát không chỉ có thể hiểu và tạo ngôn ngữ tự nhiên, mà còn phải hiểu được thế giới của con người, thậm chí sau khi được huấn luyện thích hợp có thể chuyển sang hệ thống robot (ví dụ drone, robot hút bụi, robot hình người...) để hoàn thành nhiệm vụ, các tác nhân như vậy được gọi là tác nhân có thân xác (embodied agent).
Việc huấn luyện tác nhân có thân xác cần lượng lớn dữ liệu hình ảnh từ thế giới thực, để tác nhân hiểu tốt hơn môi trường cụ thể và thế giới thực, rút ngắn thời gian huấn luyện và phát triển robot, nâng cao hiệu quả huấn luyện, giảm chi phí. Hiện tại các môi trường mô phỏng dùng để huấn luyện tác nhân có thân xác này chỉ được xây dựng và sở hữu bởi một vài công ty riêng lẻ, ví dụ Minecraft của Microsoft, Isaac Gym của NVIDIA, chưa có môi trường phi tập trung nào đáp ứng nhu cầu huấn luyện. Gần đây một số động cơ trò chơi bắt đầu chú trọng đến trí tuệ nhân tạo, ví dụ động cơ Unreal Engine của Epic đang thúc đẩy môi trường huấn luyện AI phù hợp với OpenAI GYM.
4. Hệ sinh thái Bitcoin L2
Mặc dù các sidechain Bitcoin đã tồn tại từ nhiều năm trước, nhưng chủ yếu dùng cho thanh toán, thiếu hợp đồng thông minh nên không thể hỗ trợ các ứng dụng phức tạp trên chuỗi. Sự xuất hiện của Bitcoin L2 tương thích EVM cho phép Bitcoin hỗ trợ các ứng dụng như AI phi tập trung thông qua L2. Và AI phi tập trung cần một mạng lưới blockchain hoàn toàn phi tập trung, đặt năng lực tính toán lên hàng đầu, thay vì mạng lưới blockchain ngày càng tập trung hóa theo cơ chế PoS. Việc ra đời các giao thức tài sản gốc mới như inscriptions, runes trên Bitcoin đã tạo điều kiện xây dựng hệ sinh thái và ứng dụng dựa trên Bitcoin, ví dụ rune HYPER•AGI•AGENT đã hoàn thành việc mint công bằng trong vòng một giờ, sắp tới HyperAGI sẽ phát hành thêm nhiều tài sản AI và ứng dụng do cộng đồng điều hành trên Bitcoin.
Hãy nói về khung công nghệ và giải pháp của HyperAGI
1. Làm thế nào để xây dựng một nền tảng ứng dụng tác nhân AI điều khiển bởi LLM phi tập trung?
Vấn đề lớn nhất hiện nay của AI phi tập trung là làm sao thực hiện suy luận từ xa đối với mô hình AI lớn, và thiếu các thuật toán xác minh hiệu quả, chi phí thấp cho việc huấn luyện và suy luận tác nhân có thân xác. Nếu thiếu tính xác minh, hệ thống chỉ có thể thoái hóa thành mô hình thị trường đa phương truyền thống gồm bên cung, bên cầu và nền tảng, không thể đạt được nền tảng ứng dụng AI hoàn toàn phi tập trung.
Tính toán AI xác minh được đòi hỏi phải có thuật toán đồng thuận PoUW. Trên cơ sở này, có thể thiết lập cơ chế khuyến khích phi tập trung. Cụ thể, việc mint token trong phần thưởng mạng được các nút tự thực hiện sau khi hoàn thành nhiệm vụ tính toán và nộp kết quả có thể xác minh, chứ không phải do bất kỳ cách thức tập trung nào chuyển token cho nút.
Để thực hiện tính toán AI xác minh được, trước tiên cần định nghĩa tính toán AI. Tính toán AI có nhiều tầng, ví dụ lệnh máy ở tầng thấp nhất, lệnh CUDA, C++, Python, tương tự trong huấn luyện tác nhân có thân xác, tính toán 3D cũng có các tầng khác nhau như ngôn ngữ shader, OpenGL, C++, kịch bản Blueprint, v.v.
Thuật toán đồng thuận PoUW của HyperAGI được thực hiện bằng Đồ thị Tính toán (Computational Graph), được định nghĩa là đồ thị có hướng, trong đó các nút tương ứng với các phép toán toán học. Đồ thị tính toán là một cách biểu đạt và đánh giá biểu thức toán học, là một "ngôn ngữ" mô tả phương trình, bao gồm các nút (biến) và các cạnh (phép toán - hàm đơn giản).
1.1 Dùng đồ thị tính toán để định nghĩa bất kỳ phép tính nào có thể xác minh (ví dụ tính toán 3D và AI), các tầng tính toán khác nhau có thể được biểu diễn bằng đồ thị con. Như vậy có thể bao quát nhiều loại tính toán khác nhau, và biểu diễn các tầng tính toán khác nhau bằng đồ thị con. Hiện tại có hai tầng, đồ thị tính toán tầng trên được triển khai lên chuỗi, thuận tiện cho các nút xác minh kiểm tra.
1.2 Tải và chạy mô hình LLM và các màn chơi/khóa cảnh 3D bằng cách hoàn toàn phi tập trung. Khi có người dùng truy cập mô hình LLM để suy luận, hoặc vào cảnh 3D để render, tác nhân HyperAGI sẽ khởi động một nút đáng tin cậy khác, chạy cùng siêu đồ thị (LLM hoặc cảnh 3D).
1.3 Nếu nút xác minh phát hiện kết quả do một nút nộp không khớp với kết quả do nút đáng tin cậy nộp, sẽ dùng phương pháp tìm kiếm nhị phân để kiểm tra kết quả tính toán off-chain của đồ thị tính toán tầng hai (đồ thị con), định vị nút tính toán con (toán tử) xảy ra sai lệch. Toán tử đồ thị con đã được triển khai sẵn trong hợp đồng thông minh, chỉ cần mang tham số của toán tử xảy ra không nhất quán, gọi thực hiện toán tử đó trong hợp đồng thông minh để xác minh kết quả.
2. Làm thế nào để tránh chi phí tính toán quá cao?
Một khó khăn khác của tính toán AI xác minh được là kiểm soát chi phí tính toán bổ sung. Chúng ta biết rằng giao thức đồng thuận Byzantine yêu cầu 2/3 nút nhất trí mới đạt được đồng thuận, với đồng thuận AI suy luận điều này có nghĩa là tất cả các nút phải hoàn thành cùng một phép tính. Chi phí bổ sung như vậy trong tính toán AI là sự lãng phí không thể chấp nhận được. HyperAGI chỉ cần 1 đến m nút thực hiện tính toán bổ sung là có thể hoàn thành xác minh.
2.1 Mỗi LLM sẽ không suy luận riêng lẻ, tác nhân HyperAGI sẽ ít nhất khởi động một nút đáng tin cậy để thực hiện "tính toán đồng hành".
Vì tính toán suy luận LLM được thực hiện từng tầng trong mạng thần kinh sâu, dùng kết quả tính toán của tầng trước làm đầu vào, cho đến khi hoàn thành suy luận, nhiều người dùng có thể truy cập đồng thời vào cùng một mô hình LLM lớn.
Do đó, số lượng nút đáng tin cậy "tính toán đồng hành" cần khởi động thêm nhiều nhất bằng số lượng LLM (m). Ít nhất chỉ cần một nút đáng tin cậy thực hiện "tính toán đồng hành".
2.2 Tính toán render cảnh 3D cũng tương tự, mỗi khi người dùng vào cảnh kích hoạt siêu đồ thị, tác nhân HyperAGI sẽ tải một nút đáng tin cậy theo siêu đồ thị, thực hiện tính toán siêu đồ thị tương ứng. Nếu m người dùng đều vào các cảnh 3D khác nhau, thì nhiều nhất sẽ khởi động m nút đáng tin cậy "tính toán đồng hành".
Tóm lại, số lượng nút tham gia tính toán bổ sung là một số ngẫu nhiên nằm trong khoảng từ 1 đến n+m. Phù hợp với phân bố Gauss. n là số người dùng vào cảnh 3D, m là số lượng LLM. Hiệu quả tránh lãng phí tài nguyên, đồng thời đảm bảo hiệu suất xác minh mạng.
AI kết hợp với Web3 như thế nào để tạo thành ứng dụng nửa AI nửa tài chính?
Các nhà phát triển AI có thể triển khai tác nhân thành hợp đồng thông minh, hợp đồng chứa dữ liệu siêu đồ thị tầng trên chuỗi. Người dùng hoặc tác nhân khác có thể gọi phương pháp của hợp đồng tác nhân này, và thanh toán token tương ứng, tác nhân cung cấp dịch vụ sẽ hoàn thành phép tính tương ứng và nộp kết quả có thể xác minh. Người dùng hoặc tác nhân khác đã hoàn thành giao dịch kinh doanh phi tập trung với tác nhân đó.
Tác nhân không lo lắng về việc không nhận được token sau khi hoàn thành công việc, bên thanh toán cũng không lo lắng về việc thanh toán token nhưng không nhận được kết quả tính toán đúng. Còn năng lực và giá trị thực tế của bản thân tác nhân thì do giá thị trường thứ cấp và vốn hóa của tài sản tác nhân (bao gồm ERC20, ERC721 hoặc NFT 1155) quyết định.
Tất nhiên, ứng dụng HyperAGI không chỉ giới hạn ở ứng dụng nửa AI nửa tài chính, mà hướng tới hiện thực hóa UBAI, xây dựng một tương lai nơi công nghệ bình đẳng phục vụ mọi người, phá vỡ vòng luẩn quẩn bóc lột, tạo ra một xã hội số thực sự phi tập trung và công bằng.
Chào mừng tham gia cộng đồng chính thức TechFlow
Nhóm Telegram:https://t.me/TechFlowDaily
Tài khoản Twitter chính thức:https://x.com/TechFlowPost
Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News











