
Thời đại tác nhân trí tuệ nhân tạo: Cuộc đối đầu và cộng sinh giữa AI và tiền mã hóa
Tuyển chọn TechFlowTuyển chọn TechFlow

Thời đại tác nhân trí tuệ nhân tạo: Cuộc đối đầu và cộng sinh giữa AI và tiền mã hóa
Trong tương lai, các tác nhân thông minh sẽ cùng với sức mạnh phi tập trung định hình lại thế giới số dưới một hình thức hoàn toàn mới.
Tác giả: Zeke, Nhà nghiên cứu YBB Capital

1. Từ sự thay lòng đổi dạ trong việc thu hút sự chú ý
Trong năm qua, do thiếu câu chuyện ứng dụng hấp dẫn và không theo kịp tốc độ bùng nổ của hạ tầng, lĩnh vực tiền mã hóa dần biến thành một cuộc chơi giành giật tài nguyên chú ý. Từ Silly Dragon đến Goat, từ Pump.fun đến Clanker, sự ham thích cái mới và chán cũ trong nhận thức đã khiến cuộc cạnh tranh này ngày càng gay gắt. Bắt đầu bằng cách kiếm tiền thô tục nhất để thu hút ánh nhìn, nhanh chóng chuyển sang mô hình nền tảng nơi người cung cấp và người tiêu dùng sự chú ý được thống nhất, rồi đến cả sinh vật silicon trở thành nguồn cung cấp nội dung mới. Trong muôn hình vạn trạng của Meme Coin, cuối cùng cũng xuất hiện một thứ khiến cả nhà đầu tư nhỏ lẻ và VC có thể đồng thuận: AI Agent.

Sự chú ý rốt cuộc vẫn là một trò chơi tổng bằng không; tuy nhiên, đầu cơ thực sự có thể thúc đẩy sự phát triển tự phát của mọi thứ. Trong bài viết về UNI, chúng tôi từng điểm lại thời kỳ khởi đầu của kỷ nguyên vàng blockchain – sự tăng trưởng mạnh mẽ của DeFi bắt nguồn từ thời đại khai thác LP do Compound Finance mở ra. Việc ra vào các mỏ khai thác với APY lên tới hàng ngàn thậm chí hàng vạn phần trăm từng là cách thức đấu tranh nguyên thủy nhất trên chuỗi thời điểm đó, dù kết quả cuối cùng là sụp đổ tan hoang. Nhưng sự đổ xô ồ ạt của những "thợ đào vàng" thực sự đã để lại thanh khoản chưa từng có cho blockchain, và DeFi cuối cùng đã thoát khỏi phạm trù đầu cơ thuần túy, trở thành một phân nhánh trưởng thành, đáp ứng nhu cầu tài chính của người dùng ở nhiều phương diện như thanh toán, giao dịch, chênh lệch giá, staking... Hiện tại, AI Agent cũng đang trải qua giai đoạn tự phát này, và điều chúng ta đang tìm kiếm là cách Crypto có thể tích hợp tốt hơn với AI để cuối cùng đưa tầng ứng dụng lên một tầm cao mới.
2. Trí tuệ nhân tạo tự chủ như thế nào?
Trong bài viết trước, chúng tôi đã giới thiệu sơ lược về nguồn gốc của AI Meme: Truth Terminal, cũng như triển vọng tương lai của AI Agent. Bài viết này tập trung trước hết vào bản thân AI Agent.
Chúng ta hãy bắt đầu từ định nghĩa của AI Agent. "Agent" là một thuật ngữ khá cổ xưa nhưng chưa rõ ràng trong lĩnh vực AI, chủ yếu nhấn mạnh tính Autonomous (tính tự chủ) – tức là bất kỳ hệ thống AI nào có khả năng cảm nhận môi trường và phản hồi đều có thể gọi là Agent. Theo định nghĩa hiện đại, AI Agent gần giống với "trí tuệ nhân tạo", tức là thiết lập một hệ thống mô phỏng quá trình ra quyết định của con người cho mô hình lớn, và trong giới học thuật, hệ thống này được coi là con đường hứa hẹn nhất hướng tới AGI (trí tuệ nhân tạo phổ quát).
Trong các phiên bản GPT ban đầu, chúng ta dễ dàng cảm nhận thấy mô hình lớn rất giống con người, nhưng khi trả lời những câu hỏi phức tạp, nó thường chỉ đưa ra những đáp án mơ hồ. Nguyên nhân cốt lõi là vì mô hình lúc đó dựa trên xác suất chứ không phải nhân quả, đồng thời thiếu đi những kỹ năng mà con người có như sử dụng công cụ, trí nhớ, khả năng lập kế hoạch... Trong khi đó, AI Agent có thể khắc phục những hạn chế này. Vì vậy, nếu dùng một công thức để tóm tắt thì: AI Agent = LLM (mô hình ngôn ngữ lớn) + Planning (lập kế hoạch) + Memory (trí nhớ) + Tools (công cụ).
Mô hình lớn dựa trên prompt giống như một con người tĩnh lặng – chỉ khi chúng ta nhập dữ liệu thì nó mới sống động. Trong khi đó, mục tiêu của trí tuệ nhân tạo là trở thành một con người chân thực hơn. Các Agent hiện nay trong cộng đồng chủ yếu là các mô hình được tinh chỉnh dựa trên phiên bản Llama 70b hoặc 405b mã nguồn mở của Meta (hai phiên bản khác nhau về số lượng tham số), có khả năng ghi nhớ và sử dụng API để truy cập công cụ, nhưng ở các khía cạnh khác vẫn cần sự trợ giúp hoặc đầu vào từ con người (bao gồm cả tương tác, hợp tác với các Agent khác). Do đó, hiện tại các Agent chủ yếu tồn tại dưới dạng KOL trên mạng xã hội. Để Agent giống con người hơn, cần bổ sung khả năng lập kế hoạch và hành động, trong đó chuỗi suy luận (chain of thought) đóng vai trò đặc biệt quan trọng.
3. Chuỗi suy luận (Chain of Thought - CoT)
Khái niệm Chuỗi suy luận (Chain of Thought, CoT) lần đầu tiên xuất hiện trong bài báo năm 2022 của Google mang tên "Chain-of-Thought Prompting Elicits Reasoning in Large Language Models". Bài báo chỉ ra rằng bằng cách tạo ra một chuỗi các bước suy luận trung gian, có thể tăng cường khả năng suy luận của mô hình, giúp mô hình hiểu và giải quyết vấn đề phức tạp tốt hơn.

Một ví dụ điển hình về CoT Prompt bao gồm ba phần: Mô tả nhiệm vụ rõ ràng, cơ sở lý luận hỗ trợ giải pháp, và ví dụ minh họa cụ thể. Cách tiếp cận cấu trúc này giúp mô hình hiểu yêu cầu nhiệm vụ, từng bước tiếp cận đáp án thông qua suy luận logic, từ đó nâng cao hiệu quả và độ chính xác khi giải quyết vấn đề. CoT đặc biệt phù hợp với các nhiệm vụ đòi hỏi phân tích sâu và suy luận đa bước, như giải toán, soạn thảo báo cáo dự án... Với các tác vụ đơn giản, CoT có thể không mang lại lợi thế rõ rệt, nhưng đối với nhiệm vụ phức tạp, nó có thể cải thiện đáng kể hiệu suất của mô hình, giảm tỷ lệ lỗi nhờ chiến lược giải quyết từng bước, nâng cao chất lượng hoàn thành nhiệm vụ.
Khi xây dựng AI Agent, CoT đóng vai trò then chốt. Agent cần hiểu thông tin nhận được và từ đó đưa ra quyết định hợp lý. CoT cung cấp phương pháp tư duy có trật tự, giúp Agent xử lý và phân tích thông tin đầu vào một cách hiệu quả, biến kết quả phân tích thành hướng dẫn hành động cụ thể. Phương pháp này không chỉ tăng cường độ tin cậy và hiệu quả trong ra quyết định của Agent, mà còn nâng cao tính minh bạch của quá trình ra quyết định, khiến hành vi của Agent trở nên dễ dự đoán và dễ theo dõi hơn. Bằng cách chia nhỏ nhiệm vụ thành nhiều bước nhỏ, CoT giúp Agent cân nhắc kỹ lưỡng từng điểm ra quyết định, giảm thiểu sai lầm do quá tải thông tin. Đồng thời, CoT cũng làm cho quá trình ra quyết định của Agent trở nên minh bạch hơn, người dùng dễ dàng hiểu được căn cứ ra quyết định. Trong quá trình tương tác với môi trường, CoT cho phép Agent liên tục học thông tin mới và điều chỉnh chiến lược hành vi.
CoT như một chiến lược hiệu quả, không chỉ nâng cao khả năng suy luận của mô hình ngôn ngữ lớn, mà còn đóng vai trò quan trọng trong việc xây dựng các AI Agent thông minh và đáng tin cậy hơn. Nhờ CoT, các nhà nghiên cứu và lập trình viên có thể tạo ra các hệ thống thông minh thích nghi tốt hơn với môi trường phức tạp và có mức độ tự chủ cao. Trong ứng dụng thực tế, CoT thể hiện ưu thế riêng biệt, đặc biệt khi xử lý nhiệm vụ phức tạp – bằng cách chia nhỏ nhiệm vụ thành nhiều bước, không chỉ nâng cao độ chính xác khi giải quyết, mà còn tăng tính giải thích và kiểm soát được mô hình. Phương pháp từng bước này có thể giảm đáng kể sai sót ra quyết định do thông tin quá nhiều hoặc quá phức tạp. Đồng thời, phương pháp này cũng nâng cao khả năng truy vết và xác minh toàn bộ giải pháp.
Chức năng cốt lõi của CoT nằm ở việc kết hợp kế hoạch, hành động và quan sát, bù đắp khoảng cách giữa suy luận và hành động. Mô hình tư duy này cho phép AI Agent xây dựng biện pháp đối phó hiệu quả khi dự đoán các tình huống bất thường, đồng thời tích lũy thông tin mới, kiểm chứng dự đoán ban đầu và cung cấp cơ sở suy luận mới khi tương tác với môi trường bên ngoài. CoT giống như một động cơ mạnh mẽ về độ chính xác và ổn định, giúp AI Agent duy trì hiệu suất làm việc cao trong môi trường phức tạp.
4. Nhu cầu giả đúng đắn
Crypto nên kết hợp với những khía cạnh nào trong stack công nghệ AI? Trong bài viết năm ngoái, tôi cho rằng việc phi tập trung hóa năng lực tính toán và dữ liệu là bước then chốt giúp tiết kiệm chi phí cho doanh nghiệp nhỏ và nhà phát triển cá nhân. Trong phân loại các ngách nhỏ của Crypto x AI do Coinbase tổng hợp năm nay, chúng ta thấy sự phân chia chi tiết hơn:
(1) Tầng tính toán (mạng lưới tập trung cung cấp tài nguyên GPU cho các nhà phát triển AI);
(2) Tầng dữ liệu (mạng lưới hỗ trợ truy cập, tổ chức và xác minh dữ liệu AI theo cách phi tập trung);
(3) Tầng trung gian (nền tảng hoặc mạng lưới hỗ trợ phát triển, triển khai và lưu trữ mô hình AI hoặc Agent);
(4) Tầng ứng dụng (sản phẩm dành cho người dùng tận dụng cơ chế AI trên chuỗi, dù là B2B hay B2C).
Mỗi tầng trong bốn lớp phân chia này đều mang một tầm nhìn lớn lao, tổng kết lại mục tiêu chung là chống lại sự độc quyền của các gã khổng lồ Thung lũng Silicon trong thời đại internet tiếp theo. Như tôi đã nói năm ngoái: liệu chúng ta thật sự phải chấp nhận việc các gã khổng lồ Thung lũng Silicon độc quyền kiểm soát năng lực tính toán và dữ liệu? Dưới sự độc quyền của họ, các mô hình lớn đóng nguồn bên trong trở thành một hộp đen. Khoa học là tôn giáo mà con người hiện đại tin tưởng nhất, nhưng trong tương lai, mỗi câu trả lời của mô hình lớn sẽ bị một bộ phận lớn coi là chân lý – vậy làm sao để kiểm chứng chân lý ấy? Theo viễn cảnh của các gã khổng lồ Thung lũng Silicon, quyền hạn mà các Agent cuối cùng sở hữu sẽ vượt xa trí tưởng tượng, ví dụ như quyền thanh toán từ ví bạn, quyền sử dụng thiết bị đầu cuối – làm sao đảm bảo con người không có ác ý?
Phi tập trung hóa là câu trả lời duy nhất, nhưng đôi khi chúng ta cần cân nhắc hợp lý: có bao nhiêu người sẵn sàng chi trả cho những tầm nhìn lớn lao này? Trước đây, chúng ta có thể bỏ qua vòng kín thương mại và dùng Token để bù đắp sai lệch do lý tưởng hóa gây ra. Nhưng tình hình hiện tại rất nghiêm trọng, Crypto x AI cần thiết kế dựa trên thực tế. Ví dụ, tầng tính toán nên cân bằng hai đầu cung-cầu như thế nào khi hiệu suất thấp và không ổn định, để đạt được sức cạnh tranh sánh ngang đám mây tập trung? Dự án tầng dữ liệu sẽ có bao nhiêu người dùng thực sự, làm sao kiểm tra tính xác thực và hiệu lực của dữ liệu cung cấp, và ai là khách hàng thực sự cần những dữ liệu này? Hai tầng còn lại cũng tương tự – trong thời đại này, chúng ta không cần quá nhiều nhu cầu giả tưởng trông có vẻ đúng.
5. Meme tạo ra SocialFi
Như tôi đã nói ở đoạn đầu, Meme đã nhanh chóng hình thành dạng SocialFi phù hợp với Web3. Friend.tech là Dapp khai hỏa cho làn sóng ứng dụng xã hội lần này, nhưng tiếc thay thất bại do thiết kế Token vội vã. Pump.fun chứng minh tính khả thi của mô hình nền tảng thuần túy – không phát hành Token, không đặt quy tắc. Người cung cấp và người tiêu dùng sự chú ý được thống nhất: bạn có thể đăng meme, livestream, phát hành token, bình luận, giao dịch trên nền tảng – tất cả đều tự do, Pump.fun chỉ thu phí dịch vụ. Điều này về cơ bản giống mô hình kinh tế chú ý trên các mạng xã hội như YouTube, Instagram hiện nay, chỉ khác đối tượng thu phí, còn về cách chơi thì Pump.fun mang đậm chất Web3 hơn.

Clanker trên Base là người kế thừa tinh hoa, nhờ vào hệ sinh thái tích hợp do chính Base trực tiếp xây dựng, có Dapp xã hội riêng hỗ trợ, tạo thành vòng khép kín nội bộ hoàn chỉnh. Meme Agent là dạng 2.0 của Meme Coin – con người luôn thích cái mới, và Pump.fun hiện tại vừa đúng lúc đang ở đỉnh sóng gió. Xét theo xu hướng, việc trí tuệ nhân tạo silicon thay thế những meme tục tĩu của sinh vật carbon chỉ là vấn đề thời gian.
Tôi đã nhắc đến Base vô số lần, chỉ là mỗi lần nội dung khác nhau. Xét theo dòng thời gian, Base chưa bao giờ là người đi trước, nhưng luôn là người chiến thắng.
6. Trí tuệ nhân tạo còn có thể là gì nữa?
Xét trên góc độ thực tế, trong một thời gian dài tới đây, trí tuệ nhân tạo khó có thể phi tập trung hóa. Theo cách xây dựng Agent trong lĩnh vực AI truyền thống, đây không phải vấn đề đơn giản có thể giải quyết bằng cách phi tập trung hóa và mở mã nguồn quá trình suy luận. Nó cần truy cập nhiều API để tiếp cận nội dung Web2, chi phí vận hành rất cao, thiết kế chuỗi suy luận và hợp tác giữa nhiều Agent thường vẫn phụ thuộc vào con người làm trung gian. Chúng ta sẽ trải qua một giai đoạn chuyển tiếp dài, cho đến khi xuất hiện một hình thái tích hợp phù hợp, có thể giống như UNI. Nhưng như bài viết trước, tôi vẫn tin rằng trí tuệ nhân tạo sẽ tạo ra ảnh hưởng lớn đến ngành của chúng ta, giống như CEX tồn tại trong lĩnh vực của chúng ta – không đúng nhưng rất quan trọng.
Bài tổng quan về "AI Agent" do Stanford & Microsoft công bố tháng trước mô tả rộng rãi ứng dụng của Agent trong y tế, robot thông minh, thế giới ảo, và trong phụ lục bài viết đã có rất nhiều thí nghiệm cho thấy GPT-4V đóng vai trò Agent tham gia phát triển game 3A đỉnh cao.
Không cần quá gò ép tốc độ kết hợp với phi tập trung hóa. Tôi mong rằng trước tiên trí tuệ nhân tạo sẽ bổ sung đầy đủ khả năng và tốc độ từ dưới lên – chúng ta có quá nhiều vùng hoang tàn câu chuyện và vũ trụ ảo trống rỗng cần nó lấp đầy. Ở giai đoạn thích hợp, chúng ta hãy nghĩ đến việc biến nó thành UNI tiếp theo.
Chào mừng tham gia cộng đồng chính thức TechFlow
Nhóm Telegram:https://t.me/TechFlowDaily
Tài khoản Twitter chính thức:https://x.com/TechFlowPost
Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News














