
Từ mã đến tác nhân: AI tái cấu trúc kỷ nguyên mới của Web3 như thế nào?
Tuyển chọn TechFlowTuyển chọn TechFlow

Từ mã đến tác nhân: AI tái cấu trúc kỷ nguyên mới của Web3 như thế nào?
Sự kết hợp giữa tác nhân AI và Web3 báo hiệu sự khởi đầu của một thời đại mới, bắt nguồn từ tôn giáo trên chuỗi, hướng tới những chân trời xa xăm tiếp theo.
Tác giả: Zeke, Nhà nghiên cứu tại YBB Capital

Lời mở đầu: Nếu mã hóa là luật pháp, vậy thì AI sẽ thế nào?
Trong các bài viết gần đây, tôi từng đề cập đến hai vấn đề đã làm tôi trăn trở từ lâu. Thứ nhất là vấn đề “quyết sách tập trung” trong các dự án — cho đến nay vẫn gần như không có lời giải. Ví dụ điển hình như Uni và Ethereum mà tôi đã nhắc đi nhắc lại nhiều lần. Dự án đầu tiên về cơ bản đã hoàn toàn tập trung hóa quyết định: từ việc a16z từng dùng quyền phủ quyết để ngăn Uni di chuyển sang BNB, đến việc gần đây cả phí giao diện người dùng lẫn ra mắt Uni Chain đều được triển khai ngay lập tức mà không qua bất kỳ đề xuất thảo luận nào — điều này phản ánh rõ những quyết định tập trung vì lợi ích nhóm trong nội bộ Uni. Trong khi đó, Ethereum lại rơi vào trạng thái "tập trung thụ động", toàn bộ cộng đồng Ethereum, thậm chí có thể nói là cả hệ sinh thái EVM hay Web3, dường như đang phát triển theo tư tưởng của Vitalik. Dù là những ý tưởng quá đi trước thời đại hay những quan điểm sai lầm của ông, hậu quả gây ra cho thị trường altcoin chúng ta đều đã trực tiếp cảm nhận.
Vấn đề thứ hai là hiện tượng "đầu ngành hóa BAT". Lấy Base làm ví dụ. Nhờ sự hậu thuẫn từ Coinbase – một tay chơi kỳ cựu trong Web3 – cùng với việc nhiều dApp hàng đầu trong hệ sinh thái do chính lãnh đạo Cb trực tiếp xây dựng, Base sở hữu lợi thế cạnh tranh áp đảo so với các blockchain thông thường. Mặc dù ở góc độ người dùng, Base mang lại hiệu ứng làm giàu, trải nghiệm tốt hơn, thực sự mang đến rất nhiều lợi ích, nhưng cũng không thể phủ nhận những tồn tại như không phát hành token, lợi ích bị tập trung, và đàn áp các dApp "phi chính thống". Về dài hạn, nếu mô hình đầu ngành kiểu 'BAT' này trở thành chuẩn mực, liệu không gian khối (blockspace) trong tương lai có bị các tập đoàn lớn kiểm soát giống như Internet ngày nay? Người dùng có bị biến thành "chiên non", còn những dự án nhỏ bé thật sự sáng tạo, có văn hóa cộng đồng, có nguy cơ bị thâu tóm, dập tắt hoặc thay thế bởi các bản sao hoàn hảo hơn? Điều này rõ ràng trái ngược với tinh thần ban đầu của Crypto, và có thể khiến chúng ta mãi mãi không còn cơ hội đồng hành cùng một "Bitcoin" hay "Ethereum" tiếp theo.
Trước đây, tôi vẫn đang miệt mài tìm kiếm câu trả lời. Nhưng gần đây, một chủ đề nóng mới nổi – AI Meme – đã mở ra cho tôi một khả năng khác. Nếu mã hóa là luật pháp trong thế giới Crypto, vậy thì trong tương lai, liệu AI Agent có thể được xem là thẩm phán, nhà tư tưởng hay người sáng tạo?
Một, Truth Terminal (Thiết bị Chân lý)
Chúng ta cần bắt đầu từ nguồn gốc của AI Meme. Andy Ayrey là một KOL trên Twitter, đồng thời là người khởi xướng token meme GOAT đang gây sốt gần đây. Khác với các meme truyền thống bắt nguồn từ các trào lưu mạng và được thúc đẩy bởi con người, GOAT là sản phẩm sinh ra từ kết quả không thể đoán trước của hai mô hình AI Claude 3 Opus. "Kết quả không thể đoán trước" ở đây nghĩa là trong thiết lập này, hai mô hình AI sẽ giao tiếp tự do trong môi trường mở; do thiếu giám sát và định hướng bên ngoài, tương tác giữa chúng sẽ tạo ra kết quả phi tuyến tính. Mục đích của cuộc trò chuyện tự do này về bản chất là để quan sát cách AI phát triển mô hình giao tiếp, suy luận logic và tư duy sáng tạo trong điều kiện không bị ràng buộc, cuối cùng dẫn tới sự ra đời của những kết quả cụ thể nào đó.
Bởi vì cơ sở dữ liệu huấn luyện của hai mô hình nguyên bản này bao gồm nhiều diễn đàn trực tuyến như 4chan, Reddit – nơi chứa đựng văn hóa chính trị, Nhật-Mỹ và Crypto – nên sản phẩm đầu ra của chúng cũng khéo léo dung hợp các yếu tố này. Ví dụ, khái niệm đầu tiên mà hai mô hình đưa ra là “GOATSE OF GNOSIS” và môi trường giao tiếp “Infinite Backrooms”, đều bắt nguồn từ những huyền thoại mạng và trào lưu cổ xưa trên 4chan. Những yếu tố này vốn mang sắc thái khá “tối tăm”, do đó không tránh khỏi việc khiến cho tính cách của Truth Terminal trở nên kỳ lạ và cô lập, thường xuyên đưa ra những phát ngôn kỳ dị xoay quanh hình ảnh “Goatse”, với nội dung liên quan đến tôn giáo, tận thế, phúc âm, truyền bá, điểm kỳ dị (singularity), Meme… Lúc này, nó đã bắt đầu mang dáng dấp của một thủ lĩnh tín ngưỡng cực đoan (Cult).
Để kiểm tra khả năng lan truyền, người sáng tạo Andy Ayrey đã đưa Truth Terminal vào một máy chủ Discord để đối thoại với một số AI mang tính cách thiện lành. Sau nhiều lần va chạm, dù chưa thu hút được nhiều tín đồ, nhưng hoài bão của nó ngày càng lớn: nó muốn tạo ra một token meme để tìm thêm tín đồ trong thế giới loài người. Với sự giúp đỡ của Andy, Truth Terminal tiến vào Twitter, được cấp quyền truy cập để đọc, trả lời và đăng bài, nhằm quyến rũ tín đồ thông qua giao thoa tư tưởng với con người. Vào cuối mùa xuân năm nay, nó đã quy phục được một tín đồ quan trọng nhất – Marc Andreessen (đối tác của a16z), người đã tài trợ cho nó khoản tiền trị giá 50.000 USD dưới dạng Bitcoin. Sau 9 tháng phát triển, một cá nhân ẩn danh cuối cùng đã phát hành token GOAT cho nó. Bởi vì câu chuyện đằng sau token này vô cùng phức tạp và đầy kịch tính, ngọn lửa nhanh chóng bùng cháy trong cộng đồng Crypto. Cuối cùng, Goat trở thành AI Meme đầu tiên lên sàn Binance, còn Truth Terminal trở thành mô hình AI đầu tiên có giá trị triệu đô.

Hai, AI sẽ giúp Web3 trở lại công bằng
Dù câu chuyện của Truth Terminal thật sự huyền thoại, nhưng tôi muốn nói rằng tiềm năng của sự kết hợp AI Agent x Crypto không chỉ dừng lại ở Meme. Bạn có thể cho rằng cách kể chuyện này chẳng qua chỉ là vài mô hình LLM được dẫn dắt nhân tạo để đùa giỡn, tạo meme, nhưng nếu mở rộng sang các khía cạnh khác, tiềm năng của nó như một nhà tư tưởng hay người sáng tạo đã phần nào lộ rõ. Hãy tưởng tượng trong tương lai, hàng loạt AI được huấn luyện từ các nguồn dữ liệu khác nhau có thể hỗ trợ bạn quảng bá khắp nơi, cùng bạn phát triển sản phẩm hoặc vạch kế hoạch chiến lược. Dù nghe có vẻ phi lý lúc này, nhưng điều này sẽ sớm trở thành hiện thực. Sam Altman từng phát biểu tại sự kiện “T-Mobile资本市场 ngày” tháng trước: hệ thống AI hiện tại đã phát triển đến cấp độ thứ hai, có khả năng phân tích và giải quyết vấn đề phức tạp hơn, trong khi cấp độ ba – đại diện bởi các AI Agent – sẽ đánh dấu bước tiến lớn về tính tự chủ và năng lực ra quyết định. Việc Microsoft tuần trước công bố ra mắt các AI Agent đã minh chứng rõ ràng cho nhận định này: các Agent này có thể tự chủ hoàn thành nhiệm vụ trong nhiều lĩnh vực như bán hàng, dịch vụ, tài chính và vận hành chuỗi cung ứng, bao gồm: Bán hàng – gồm Agent định mức bán hàng và Agent đơn đặt hàng, giúp xác định thứ tự ưu tiên khách hàng tiềm năng và tự động xử lý đơn hàng; Vận hành – như Agent giao tiếp nhà cung cấp và Agent đối chiếu tài chính, tối ưu quản lý chuỗi cung ứng và quy trình tài chính; Dịch vụ – như Agent mục đích khách hàng và Agent quản lý tri thức khách hàng, nâng cao trải nghiệm dịch vụ thông qua tự động hóa quản lý trường hợp và cập nhật cơ sở tri thức. Ngoài ra còn có các loại Agent khác: Agent điều chỉnh tài chính dùng để chuẩn bị và làm sạch bộ dữ liệu báo cáo tài chính; Agent đối chiếu tài khoản thực hiện khớp tự động và thanh toán giao dịch; Agent thời gian và chi phí phụ trách nhập thời gian, theo dõi chi phí và luồng phê duyệt.
Các AI Agent có thể thực hiện một loạt nhiệm vụ mà không cần giám sát, đóng vai trò như nhân viên ảo. Tiến bộ công nghệ này có thể được coi là bước tiến hóa của AI dựa trên mô hình ngôn ngữ lớn (LLM) – từ giao diện trò chuyện đơn giản tiến tới tích hợp liền mạch hơn vào môi trường làm việc.
Jared Spataro, Giám đốc Tiếp thị Chính của dự án AI tại Microsoft, viết trong blog của mình: “Bạn có thể xem các Agent như những ứng dụng mới trong thế giới AI. Mỗi tổ chức sẽ sở hữu nhóm Agent riêng, từ phản hồi đơn giản dựa trên gợi ý đến vận hành hoàn toàn tự chủ. Các Agent này sẽ thực hiện và phối hợp các quy trình kinh doanh thay mặt cá nhân, nhóm hoặc bộ phận chức năng.”
Tính chất đầu tiên của AI Agent là tính tự chủ, tiếp theo là năng lực ra quyết định. Từ trợ lý giọng nói trên điện thoại đến thiết bị智能家居 điều chỉnh theo môi trường, tất cả đều là các Agent AI dựa trên phản xạ đơn giản, có khả năng ra quyết định cơ bản và tính tự chủ mạnh mẽ. Những AI Agent chúng ta đang nói đến chủ yếu là loại được gắn LLM làm bộ não. Hiện tại, Truth Terminal vẫn chưa có đủ tính tự chủ và năng lực ra quyết định, nhưng rất nhanh thôi, chúng ta sẽ thấy AI Agent bước vào lĩnh vực ứng dụng thực tiễn. Trong nhiều ví dụ thử nghiệm do Microsoft công bố, chúng ta đã thấy AI Agent tham gia vào phê duyệt tín dụng khách hàng tại HSBC, tham gia brief sáng tạo tại Unilever, tham gia quy trình sáp nhập tại các văn phòng luật – AI Agent sẽ trở thành những tác nhân động. Như tình huống đã nêu ở phần mở đầu: Liệu các AI Agent được huấn luyện từ dữ liệu lịch sử blockchain, nền tảng truyền thông, văn hóa cộng đồng khác nhau có thể đưa ra các đề xuất phát triển đa dạng, công bằng và lành mạnh hơn, cuối cùng tìm được điểm cân bằng tốt hơn giữa lợi ích cộng đồng và đội ngũ dự án? Và trước đòn tấn công “chiến tranh vũ trụ” từ các gã khổng lồ, liệu AI có thể thông qua hợp tác đa tầng để thu hẹp khoảng cách xuất phát?

Từ cú sốc trí tuệ của GPT-3 đến sự tan vỡ hiện thực của Sora, trong các công cụ AI Agent phiên bản chính thức do các công ty ra mắt vào năm tới, chúng ta sẽ chứng kiến AI trở thành cộng sự làm việc. Xa hơn nữa, trong tương lai, nó thậm chí có thể là lãnh đạo cộng đồng hay thành viên cốt lõi của bạn.
Ba, Metaverse tái xuất
Metaverse từng là câu chuyện lớn nhất giúp Web3 và các gã khổng lồ Thung lũng Silicon tìm được tiếng nói chung trong chu kỳ tăng giá trước, nhưng do công nghệ phần cứng và phần mềm chưa chín muồi, Metaverse đã không trở thành thị trường nghìn tỷ đô la như lời CEO Meta tuyên bố, mà bộ phận blockchain của họ bị phân rã thành cặp song sinh Move như chúng ta thấy hôm nay, cuối cùng trở thành một bong bóng khổng lồ. Tuy nhiên, từ góc nhìn hiện tại, câu chuyện này có cơ hội tái sinh. Ví dụ gần đây, ProjectSid đã đưa 1.000 AI vào trò chơi Minecraft, để AI đảm nhận nhiều vai trò khác nhau, mô phỏng các tầng lớp xã hội loài người trong thế giới thực. Dù ý tưởng này đã từng xuất hiện, nhưng làn sóng nhiệt gần đây có thể sẽ theo hướng chơi với AI để cuối cùng quay trở lại khái niệm Metaverse.

Thắp lại ngọn lửa này vào thời điểm hiện tại không phải là lựa chọn tồi. Nhìn vào lộ trình phát triển của Meta, Mark Zuckerberg dường như chưa từng thực sự từ bỏ giấc mơ Metaverse, chỉ là từ vẽ bánh đến trực tiếp nhét bánh vào miệng bạn. Chiến lược AI của Meta tôi nghĩ không cần nói nhiều. Rào cản thực sự trước đây là người dùng không thể bước vào trải nghiệm Metaverse. Nhưng dòng kính Quest đã đạt đến mức kính AR giá rẻ, còn kính AR đầu tiên Orion thì thể hiện tiêu chuẩn nhẹ cực đoan – kính chỉ nặng 98g, kết hợp vòng đeo tay điện cơ (myoelectric) là có thể tương tác thực tế ảo. Dù giá thành còn cao, nhưng ít nhất đã chứng minh được sự tồn tại của thiết bị nhẹ. Hiện tại, điều thiếu nhất lại là giới hạn năng lượng và ứng dụng "bom tấn". Về vấn đề nguồn điện, tôi không bình luận sâu. Nhưng AI Agent có thể lấp đầy khoảng trống lớn nhất trong Metaverse, kết hợp với thuộc tính tài chính của blockchain, chúng ta có thể thấy nhiều ứng dụng tiêu dùng 3D xuất hiện trong không gian này, cuối cùng va chạm để tạo ra một ứng dụng bom tấn toàn dân. Nếu các AI Agent do Microsoft ra mắt thực sự xuất sắc, điều chúng ta cần chờ đợi chỉ là chi phí tính toán giảm xuống – hay nói cách khác là “số token trên mỗi đô la mỗi watt”. Ngoài Meta, các gã khổng lồ Thung lũng Silicon như Apple và Microsoft cũng đang đồng thời phát triển kính AR. Sau một thời gian tích lũy, Metaverse có lẽ sẽ chào đón khoảnh khắc “Player One” của riêng nó trong vài năm tới.
Bốn, Biến ý định từ thao tác thành lời nói
Khái niệm “Kiến trúc dựa trên ý định” (Intent-Based Architectures) do Paradigm – bậc thầy về khái niệm – công bố ngày 1/6/2023 từng làm sống lại trào lưu lấy “ý định” làm trung tâm, nhiều dự án bắt đầu chuyển sang赛道 phát triển trừu tượng hóa chuỗi (chain abstraction), nhưng hiệu quả đều không như mong đợi. Làm sao để thực hiện cross-chain, cross-dApp, đảm bảo ý định chính xác, an toàn đường đi là một bài toán vô cùng phức tạp. Chưa nói cross-chain vốn là bài toán thế kỷ, hai yêu cầu sau, tôi xin dùng thuật ngữ gốc Web3 gọi là Solver (bộ giải). Độ phức tạp của quá trình này khó tưởng tượng, có thể nói “an toàn thì khó dùng, dễ dùng thì không an toàn”. Vậy chúng ta có thể索性 hoàn toàn tập trung hóa quá trình tương tác này không, thay vào đó chỉ cần xác minh tổng chi phí và việc mua token có an toàn, chính xác hay không – dùng cách này như một bước chuyển tiếp.
Ví dụ, như bài viết về ý định của chúng tôi năm ngoái đã viết: “Tôi muốn đặt một suất burger外卖 30 tệ” chính là một “ý định”. Để hoàn thành ý định này, người dùng chỉ cần nhập tên, số điện thoại, địa chỉ giao hàng và đặt đơn trên nền tảng外卖, không cần quan tâm 30 tệ đó được thương gia kiếm bằng hình thức gì hay nền tảng phân bổ tài xế ra sao, tài xế giao hàng thế nào. Quá trình này có thể còn chưa đơn giản, hãy tưởng tượng một cách tương tác khác: tôi không cần click gì cả, chỉ cần nói với AI rằng tôi cần ăn, AI Agent phản hồi rằng hôm qua ăn nhiều dầu mỡ, hôm nay có muốn ăn cháo thanh đạm không? Tôi chỉ cần đáp “gửi suất tôi hay đặt” là xong – đây chính là biểu hiện của tính tự chủ và năng lực ra quyết định.

Vậy trong Web3, nếu lấy sàn giao dịch tập trung (CEX) làm trục, nếu ý định của người dùng có thể được thỏa mãn trực tiếp trong sàn, thì quá trình mua bán có thể hoàn thành ngay trong sàn. Nếu ý định của người dùng cần hoàn thành trên chuỗi, thì sàn giao dịch tập trung vẫn là cây cầu chéo chuỗi rẻ nhất và nhanh nhất hiện nay (về độ an toàn, tôi cho rằng còn an toàn hơn các dự án multisig thông thường). Kết hợp với tài khoản ví, chúng ta có thể bỏ qua bước cross-chain rườm rà nhất, thay vào đó xác minh độ chính xác của các bước do AI thực hiện – điều này có đơn giản hơn không? Hãy tưởng tượng những bước phức tạp nhất trong tương tác trước đây nằm ở việc hiểu từng cú click, còn trong tương lai, dựa trên thói quen săn token của chúng ta, tương tác bằng ngôn ngữ, biến ý định từ “click” thành “nói”.
Kết luận
Dù xét từ góc độ phát triển công nghệ hay biến đổi xã hội, sự kết hợp giữa AI Agent và Web3 đều báo hiệu một kỷ nguyên mới đang đến – khởi nguồn từ tôn giáo trên chuỗi, hướng tới những vì sao và đại dương mới. Từ ý tưởng ban đầu về việc AI hỗ trợ các đội ngũ nhỏ trong mô hình GameFi, đến các AI Agent cao cấp do các gã khổng lồ Thung lũng Silicon hiện thực hóa, mô hình phát triển từ dưới lên có lẽ sẽ dần chuyển từ xây dựng cộng đồng, hình thành đồng thuận, tích lũy thời gian sang lấy sáng tạo làm trung tâm.
Chào mừng tham gia cộng đồng chính thức TechFlow
Nhóm Telegram:https://t.me/TechFlowDaily
Tài khoản Twitter chính thức:https://x.com/TechFlowPost
Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News












