
Manus sẽ mang lại điều gì cho sự bùng nổ lớn của các trường hợp sử dụng Web3 DeFAI?
Tuyển chọn TechFlowTuyển chọn TechFlow

Manus sẽ mang lại điều gì cho sự bùng nổ lớn của các trường hợp sử dụng Web3 DeFAI?
Việc hiện thực hóa tầm nhìn DeFai thực sự cần giải quyết nhiều vấn đề phức tạp như giới hạn năng lực của mô hình AI đơn thể, đảm bảo tính nguyên tử trong tương tác và hợp tác đa phương tiện, điều phối và phân bổ tài nguyên thống nhất cho hệ thống đa phương tiện, cơ chế xử lý lỗi và sự cố của hệ thống, v.v.
Bài viết: Haotian
Tỉnh dậy sau một giấc ngủ, nhiều người bạn nhắn tôi xem #manus, được quảng cáo là một AI Agent thực sự mang tính phổ quát toàn cầu, có khả năng tư duy độc lập, lập kế hoạch và thực hiện các nhiệm vụ phức tạp, đồng thời giao kết quả hoàn chỉnh. Nghe thì rất tuyệt, nhưng ngoài những dòng trạng thái đầy lo lắng về nguy cơ mất việc trong mạng xã hội ra, liệu nó sẽ mang lại điều gì cho sự bùng nổ ứng dụng DeFai trong web3? Dưới đây là suy nghĩ của tôi:
1) Khoảng một tháng trước, OpenAI đã ra mắt sản phẩm cùng loại có tên Operator, AI có thể tự động hoàn thành các tác vụ như đặt nhà hàng, mua sắm, đặt vé, gọi đồ ăn... trong trình duyệt, người dùng có thể giám sát trực quan và giành lại quyền kiểm soát bất cứ lúc nào.
Sự xuất hiện của Agent này không thu hút nhiều thảo luận, lý do là vì nó vẫn vận hành trên nền tảng mô hình đơn lẻ, vẫn dùng khung gọi công cụ cũ, khiến người dùng chỉ cần nghĩ đến việc phải can thiệp vào các quyết định then chốt là đã mất niềm tin để giao phó nhiệm vụ.
2) Manus thoạt nhìn cũng không khác biệt mấy, chỉ bổ sung thêm một số tình huống ứng dụng như sàng lọc hồ sơ xin việc, nghiên cứu cổ phiếu, mua bất động sản v.v., nhưng điểm khác biệt thực sự nằm ở khung kiến trúc và hệ thống thực thi. Manus được điều khiển bởi mô hình đa phương tiện (multimodal), đồng thời sáng tạo áp dụng hệ thống chữ ký kép (multi-signature).
Nói ngắn gọn, để mô phỏng chu trình hành động PDCA (Kế hoạch - Thực thi - Kiểm tra - Hành động) của con người, AI sẽ do nhiều mô hình lớn phối hợp hoàn thành, mỗi mô hình chuyên trách một giai đoạn cụ thể, vừa giảm rủi ro ra quyết định của mô hình đơn lẻ, vừa nâng cao hiệu suất thực thi. Hệ thống "chữ ký kép" thực chất là cơ chế xác minh quyết định thông qua sự cộng tác giữa nhiều mô hình — yêu cầu sự xác nhận đồng thuận từ nhiều mô hình chuyên môn để đảm bảo độ tin cậy của quyết định và hành động thực thi.
3) So sánh như vậy, ưu thế của Manus rõ ràng nổi bật. Cộng với video demo thể hiện loạt thao tác mượt mà, thực sự mang lại cảm giác trải nghiệm ấn tượng. Nhưng xét một cách khách quan, bước cải tiến của Manus so với Operator mới chỉ là khởi đầu, chưa đạt tới mức độ cách mạng đột phá.
Vấn đề then chốt nằm ở độ phức tạp của các nhiệm vụ thực thi, cũng như định nghĩa về tỷ lệ dung sai và tỷ lệ thành công đầu ra khi input từ người dùng không chuẩn hóa. Bằng không, theo hướng sáng tạo này, liệu các tình huống ứng dụng DeFai trong web3 có thể lập tức triển khai được ngay không? Rõ ràng là chưa thể:
Ví dụ: Trong môi trường DeFai, khi Agent thực hiện quyết định giao dịch, cần có một lớp Oracle Agent chịu trách nhiệm thu thập, xác thực dữ liệu trên chuỗi, tổng hợp phân tích dữ liệu, đồng thời theo dõi giá thời gian thực để nắm bắt cơ hội giao dịch. Quá trình này đặt ra thử thách lớn về phân tích thời gian thực — có thể chỉ một giây trước cơ hội còn tồn tại, nhưng sau khi mô hình lớn Oracle truyền dữ liệu sang Agent thực thi giao dịch thì cơ hội đã biến mất (thời điểm套利 đã đóng);
Điều này phơi bày điểm yếu lớn nhất của các mô hình đa phương tiện dạng này khi đưa ra quyết định thực thi: làm sao để kết nối mạng, truy cập chuỗi, lấy và phân tích dữ liệu cấp độ Real-Time, sau đó phát hiện cơ hội giao dịch rồi nhanh chóng tận dụng. Môi trường mạng Internet còn đỡ, vì giá cả trên nhiều website thương mại điện tử không thay đổi liên tục, ít gây rối loạn cân bằng động cho toàn bộ hệ thống phối hợp đa phương tiện. Nhưng trên blockchain, thách thức kiểu này xảy ra mọi lúc, mọi nơi.
4) Vì vậy, nói chung lại, sự xuất hiện của Manus chắc chắn sẽ tạo ra một làn sóng lo lắng trong mạng xã hội web2, bởi nhiều công việc văn phòng và xử lý thông tin mang tính lặp lại cao có thể bị AI thay thế. Nhưng cứ để họ lo lắng đi.
Còn về tác động thúc đẩy ứng dụng DeFai trong web3, chúng ta cần nhìn nhận một cách khách quan:
Phải thừa nhận rằng: ý nghĩa đương nhiên rất lớn, bởi triết lý LLM OS và Less Structure more intelligence mà nó đề xuất, đặc biệt là hệ thống chữ ký kép, sẽ mở ra nhiều cảm hứng sâu sắc cho việc kết hợp DeFi và AI trong web3.
Nó thực tế đã điều chỉnh một sai lầm nghiêm trọng của phần lớn dự án DeFai: đừng vội vàng kỳ vọng một mô hình lớn duy nhất có thể tự chủ suy nghĩ + ra quyết định... các mục tiêu phức tạp, điều này trong lĩnh vực tài chính là hoàn toàn không thực tế.
Việc hiện thực hóa tầm nhìn DeFai thực thụ đòi hỏi phải giải quyết hàng loạt vấn đề phức tạp: giới hạn năng lực của mô hình AI đơn lẻ, đảm bảo tính nguyên tử (atomicity) trong tương tác và phối hợp đa phương tiện, lập kế hoạch và phân bổ tài nguyên thống nhất trong hệ thống đa phương tiện, cơ chế dung sai và xử lý lỗi hệ thống v.v.
Ví dụ: Agent lớp Oracle, phụ trách thu thập và phân tích dữ liệu trên chuỗi, theo dõi giá cả, tạo nguồn dữ liệu hiệu lực;
Agent lớp ra quyết định, phân tích dữ liệu từ Oracle, đánh giá rủi ro, xây dựng chiến lược và kế hoạch hành động;
Agent lớp thực thi, dựa trên các phương án từ lớp ra quyết định, xem xét điều kiện thực tế để triển khai, bao gồm tối ưu phí gas, trạng thái cross-chain, xung đột sắp xếp giao dịch v.v.
Chỉ khi toàn bộ chuỗi Agent này đồng thời mạnh mẽ, và có một khung hệ thống quy mô lớn được thiết lập hoàn chỉnh, thì cuộc cách mạng DeFai thực sự mới bùng nổ.
Chào mừng tham gia cộng đồng chính thức TechFlow
Nhóm Telegram:https://t.me/TechFlowDaily
Tài khoản Twitter chính thức:https://x.com/TechFlowPost
Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News














