
ArkStream Capital: Agent AI có thể trở thành cứu cánh cho Web3+AI?
Tuyển chọn TechFlowTuyển chọn TechFlow

ArkStream Capital: Agent AI có thể trở thành cứu cánh cho Web3+AI?
Đối với các dự án Web3, việc tích hợp công nghệ AI vào các sản phẩm ứng dụng không thuộc lõi AI có thể trở thành lợi thế chiến lược.
Tác giả: James,ArkStream Capital
TL;DR
-
Các dự án AI Agent trong lĩnh vực khởi nghiệp Web2 chủ yếu tập trung vào dịch vụ doanh nghiệp, trong khi ở lĩnh vực Web3, các dự án liên quan đến huấn luyện mô hình và nền tảng tích hợp lại nổi bật nhờ vai trò then chốt trong việc xây dựng hệ sinh thái.
-
Dù hiện tại số lượng dự án AI Agent trong Web3 chỉ chiếm khoảng 8%, nhưng tỷ trọng vốn hóa thị trường của nhóm này trong toàn ngành AI lại lên tới 23%, cho thấy sức cạnh tranh mạnh mẽ. Chúng tôi dự đoán rằng khi công nghệ trưởng thành và được thị trường công nhận rộng rãi hơn, sẽ xuất hiện nhiều dự án có định giá vượt quá 1 tỷ USD.
-
Đối với các sản phẩm ứng dụng không thuộc lõi AI trong Web3, việc tích hợp công nghệ AI có thể trở thành lợi thế chiến lược. Các dự án AI Agent nên chú trọng xây dựng hệ sinh thái toàn diện và thiết kế mô hình kinh tế token để thúc đẩy tính phi tập trung và hiệu ứng mạng lưới.
Sóng AI: Thực trạng hàng loạt dự án ra đời và định giá tăng vọt
Kể từ khi ChatGPT ra mắt vào tháng 11 năm 2022, chỉ trong vòng hai tháng đã thu hút hơn 100 triệu người dùng. Đến tháng 5 năm 2024, doanh thu hàng tháng của ChatGPT đã đạt mức đáng kinh ngạc là 20,3 triệu USD. Sau khi phát hành ChatGPT, OpenAI cũng nhanh chóng tung ra các phiên bản nâng cấp như GPT-4, GPT-4o. Trước đà phát triển mạnh mẽ này, các gã khổng lồ công nghệ truyền thống đều nhận ra tầm quan trọng của các mô hình AI tiên tiến như LLM và lần lượt công bố mô hình cũng như ứng dụng riêng. Ví dụ, Google ra mắt mô hình ngôn ngữ lớn PaLM2, Meta giới thiệu Llama3, còn các công ty Trung Quốc thì phát triển Văn Tâm Nhất Ngôn, Trí Phổ Thanh Ngôn... Rõ ràng, lĩnh vực AI đã trở thành mảnh đất tranh giành quyết liệt.
Cuộc đua giữa các gã khổng lồ công nghệ không chỉ thúc đẩy sự phát triển ứng dụng thương mại mà còn phản ánh qua thống kê nghiên cứu AI mã nguồn mở: Báo cáo AI Index 2024 cho thấy số lượng dự án liên quan đến AI trên GitHub đã tăng vọt từ 845 dự án năm 2011 lên khoảng 1,8 triệu vào năm 2023. Đặc biệt, sau khi GPT ra mắt, số lượng dự án năm 2023 tăng 59,3% so với năm trước, phản ánh rõ sự hào hứng của cộng đồng nhà phát triển toàn cầu đối với nghiên cứu AI.
Sự nhiệt tình với công nghệ AI được thể hiện rõ trên thị trường đầu tư, nơi thị trường đầu tư vào AI đang bùng nổ. Trong quý II/2024, toàn cầu có tới 16 khoản đầu tư vào AI trị giá hơn 150 triệu USD – gấp đôi so với quý I. Tổng vốn huy động của các startup AI tăng vọt lên 24 tỷ USD, tăng hơn một lần so với cùng kỳ. Trong đó, xAI của Elon Musk huy động được 6 tỷ USD, định giá 24 tỷ USD, trở thành startup AI có định giá cao thứ hai, chỉ sau OpenAI.

Top 10 dự án AI gọi vốn thành công nhất Q2/2024, Nguồn: Yiou, https://www.iyiou.com/data/202407171072366
Sự phát triển thần tốc của công nghệ AI đang tái cấu trúc lại bản đồ công nghệ với tốc độ chưa từng có. Từ cuộc cạnh tranh khốc liệt giữa các gã khổng lồ công nghệ, sự bùng nổ của các dự án cộng đồng mã nguồn mở, đến sự cuồng nhiệt của thị trường vốn dành cho các khái niệm AI – dự án mới liên tục ra đời, mức đầu tư lập kỷ lục mới, định giá cũng vì thế mà tăng theo. Nhìn chung, thị trường AI đang ở giai đoạn vàng phát triển mạnh mẽ, với những bước tiến lớn trong mô hình ngôn ngữ lớn (LLM) và kỹ thuật tạo nội dung tăng cường truy xuất (RAG). Tuy nhiên, các mô hình này vẫn gặp thách thức khi chuyển đổi lợi thế công nghệ thành sản phẩm thực tế, chẳng hạn như tính bất định trong đầu ra mô hình, rủi ro "ảo giác" (hallucination) khi sinh thông tin sai lệch, hay vấn đề minh bạch mô hình. Những vấn đề này càng trở nên quan trọng trong các ứng dụng yêu cầu độ tin cậy cao.
Trong bối cảnh đó, chúng tôi bắt đầu nghiên cứu về AI Agent, bởi AI Agent nhấn mạnh vào giải quyết vấn đề thực tế và tương tác toàn diện với môi trường. Sự chuyển đổi này đánh dấu bước tiến hóa của công nghệ AI từ các mô hình ngôn ngữ đơn thuần sang những hệ thống trí tuệ thực sự có khả năng hiểu, học hỏi và giải quyết các vấn đề thực tiễn. Vì vậy, chúng tôi nhìn thấy hy vọng từ sự phát triển của AI Agent – nó đang từng bước thu hẹp khoảng cách giữa công nghệ AI và giải quyết vấn đề thực tế. Trong khi công nghệ AI tiếp tục tái cấu trúc kiến trúc năng suất, thì công nghệ Web3 lại đang tái cấu trúc quan hệ sản xuất trong nền kinh tế số. Khi ba yếu tố chính của AI – dữ liệu, mô hình và năng lực tính toán – kết hợp với các nguyên lý cốt lõi của Web3 như phi tập trung, kinh tế token và hợp đồng thông minh, chúng tôi dự đoán sẽ xuất hiện một loạt ứng dụng sáng tạo. Trong lĩnh vực tiềm năng này, AI Agent với khả năng tự thực hiện nhiệm vụ đang thể hiện tiềm năng lớn để ứng dụng quy mô lớn.
Vì vậy, chúng tôi đi sâu nghiên cứu các ứng dụng đa dạng của AI Agent trong Web3, từ cơ sở hạ tầng, lớp trung gian, ứng dụng, đến thị trường dữ liệu và mô hình, nhằm xác định và đánh giá các loại hình dự án và kịch bản ứng dụng triển vọng nhất, để hiểu sâu sắc hơn về sự tích hợp chặt chẽ giữa AI và Web3.
Làm rõ khái niệm: Giới thiệu và phân loại tổng quan về AI Agent
Giới thiệu cơ bản
Trước khi giới thiệu AI Agent, để giúp người đọc dễ hiểu hơn về định nghĩa và khác biệt với mô hình, chúng tôi lấy một ví dụ thực tế: Giả sử bạn đang lên kế hoạch cho một chuyến du lịch. Mô hình ngôn ngữ lớn (LLM) truyền thống sẽ cung cấp thông tin điểm đến và lời khuyên du lịch. Công nghệ tạo nội dung tăng cường truy xuất (RAG) có thể cung cấp nội dung điểm đến phong phú và cụ thể hơn. Còn AI Agent giống như J.A.R.V.I.S trong phim Iron Man – không chỉ hiểu nhu cầu của bạn mà còn chủ động tìm kiếm chuyến bay và khách sạn, thực hiện đặt chỗ, rồi thêm lịch trình vào lịch cá nhân.
Hiện tại, định nghĩa phổ biến trong ngành về AI Agent là: một hệ thống trí tuệ có khả năng cảm nhận môi trường và hành động phù hợp, thu thập thông tin môi trường qua cảm biến, xử lý và ảnh hưởng ngược lại môi trường thông qua bộ thực thi (Stuart Russell & Peter Norvig, 2020). Theo chúng tôi, AI Agent là trợ lý tích hợp các khả năng như LLM, RAG, trí nhớ, lập kế hoạch nhiệm vụ và sử dụng công cụ. Nó không chỉ cung cấp thông tin đơn thuần mà còn có thể lập kế hoạch, phân chia nhiệm vụ và thực sự thực hiện.
Theo định nghĩa và đặc điểm này, ta có thể thấy AI Agent đã len lỏi vào cuộc sống, được ứng dụng trong nhiều bối cảnh khác nhau. AlphaGo, Siri, hay hệ thống lái xe tự động cấp độ L5 trở lên của Tesla đều có thể coi là những ví dụ về AI Agent. Điểm chung của các hệ thống này là đều có thể cảm nhận đầu vào từ người dùng bên ngoài và đưa ra phản hồi ảnh hưởng đến môi trường thực tế.
Lấy ChatGPT làm ví dụ để làm rõ khái niệm, cần nhấn mạnh rằng Transformer là kiến trúc kỹ thuật tạo nên mô hình AI, GPT là dòng mô hình phát triển dựa trên kiến trúc đó, còn GPT-1, GPT-4, GPT-4o lần lượt là các phiên bản đại diện cho các giai đoạn phát triển khác nhau của mô hình. Còn ChatGPT là một AI Agent phát triển từ mô hình GPT.
Tổng quan phân loại
Thị trường AI Agent hiện tại chưa hình thành tiêu chuẩn phân loại thống nhất. Chúng tôi đã gắn thẻ cho 204 dự án AI Agent trên cả thị trường Web2 và Web3, dựa trên nhãn đặc trưng của mỗi dự án, chia thành phân loại cấp một và cấp hai. Cấp một gồm ba loại: cơ sở hạ tầng, tạo nội dung và tương tác người dùng, sau đó phân chia chi tiết hơn theo trường hợp sử dụng thực tế:

-
Hạng mục Cơ sở hạ tầng: Tập trung vào xây dựng các thành phần nền tảng trong lĩnh vực Agent, bao gồm nền tảng, mô hình, dữ liệu, công cụ phát triển, và các dịch vụ B2B nền tảng, đã khá trưởng thành.
-
Hạng mục Công cụ phát triển: Cung cấp các công cụ hỗ trợ và framework cho nhà phát triển để xây dựng AI Agent.
-
Hạng mục Xử lý dữ liệu: Xử lý và phân tích dữ liệu dưới nhiều định dạng khác nhau, chủ yếu phục vụ ra quyết định và cung cấp nguồn dữ liệu huấn luyện.
-
Hạng mục Huấn luyện mô hình: Cung cấp dịch vụ huấn luyện mô hình AI, bao gồm suy luận, xây dựng và thiết lập mô hình.
-
Hạng mục Dịch vụ B2B: Hướng đến người dùng doanh nghiệp, cung cấp các giải pháp chuyên biệt, tự động hóa cho từng ngành dọc.
-
Hạng mục Nền tảng tích hợp: Nền tảng tích hợp nhiều dịch vụ và công cụ AI Agent.
-
Hạng mục Tương tác: Tương tự hạng mục tạo nội dung, nhưng khác ở chỗ là tương tác hai chiều liên tục. Agent loại tương tác không chỉ tiếp nhận và hiểu nhu cầu người dùng mà còn phản hồi thông qua các công nghệ như xử lý ngôn ngữ tự nhiên (NLP), đạt được tương tác hai chiều với người dùng.
-
Hạng mục Đồng hành cảm xúc: Cung cấp hỗ trợ và đồng hành về mặt cảm xúc bằng AI.
-
Hạng mục Dạng GPT: AI Agent dựa trên mô hình GPT (Transformer được huấn luyện trước để tạo nội dung).
-
Hạng mục Tìm kiếm: Chuyên về chức năng tìm kiếm, cung cấp khả năng truy xuất thông tin chính xác hơn.
-
Hạng mục Tạo nội dung: Các dự án này chuyên tạo nội dung, tận dụng công nghệ mô hình lớn để sinh ra nội dung dưới nhiều hình thức theo chỉ dẫn người dùng, chia thành bốn loại: văn bản, hình ảnh, video và âm thanh.
Phân tích thực trạng phát triển AI Agent Web2
Theo thống kê của chúng tôi, việc phát triển AI Agent trong Internet truyền thống Web2 cho thấy xu hướng tập trung rõ rệt. Cụ thể, khoảng hai phần ba dự án tập trung vào hạng mục Cơ sở hạ tầng, trong đó chủ yếu là Dịch vụ B2B và Công cụ phát triển. Chúng tôi cũng phân tích hiện tượng này.
Ảnh hưởng của mức độ trưởng thành công nghệ: Hạng mục Cơ sở hạ tầng chiếm ưu thế trước hết nhờ mức độ trưởng thành công nghệ. Các dự án này thường xây dựng dựa trên các công nghệ và framework đã được kiểm chứng qua thời gian, giảm thiểu khó khăn và rủi ro phát triển. Có thể coi là những "cái xẻng" trong lĩnh vực AI, cung cấp nền tảng vững chắc cho việc phát triển và ứng dụng AI Agent.
Động lực từ nhu cầu thị trường: Một yếu tố then chốt khác là nhu cầu thị trường. So với thị trường tiêu dùng, thị trường doanh nghiệp có nhu cầu cấp thiết hơn với công nghệ AI, đặc biệt trong việc tìm kiếm giải pháp nâng cao hiệu quả vận hành và giảm chi phí. Đồng thời, đối với các nhà phát triển, dòng tiền ổn định từ doanh nghiệp thuận lợi hơn cho việc phát triển các dự án tiếp theo.
Giới hạn về bối cảnh ứng dụng: Đồng thời, chúng tôi nhận thấy các ứng dụng tạo nội dung AI có bối cảnh ứng dụng hạn chế hơn trong thị trường B2B. Do tính bất ổn trong đầu ra, doanh nghiệp thiên về các ứng dụng có thể ổn định nâng cao năng suất. Điều này khiến tỷ lệ các AI tạo nội dung trong kho dự án thấp hơn.
Xu hướng này phản ánh sự cân nhắc thực tế về mức độ trưởng thành công nghệ, nhu cầu thị trường và bối cảnh ứng dụng. Với sự tiến bộ không ngừng của công nghệ AI và nhu cầu thị trường ngày càng rõ ràng, chúng tôi dự đoán cấu trúc này có thể điều chỉnh, nhưng hạng mục Cơ sở hạ tầng vẫn sẽ là nền tảng vững chắc cho sự phát triển của AI Agent.
Phân tích các dự án AI Agent hàng đầu trong Web2

Tổng hợp các dự án AI Agent hàng đầu trong Web2, Nguồn: Cơ sở dữ liệu dự án ArkStream
Chúng tôi đi sâu phân tích một số dự án AI Agent hiện tại trên thị trường Web2, lấy ba dự án Character AI, Perplexity AI, Midjourney làm ví dụ.
Character AI:
-
Giới thiệu sản phẩm: Character.AI cung cấp hệ thống hội thoại dựa trên trí tuệ nhân tạo và công cụ tạo nhân vật ảo. Nền tảng cho phép người dùng tạo, huấn luyện và tương tác với các nhân vật ảo, những nhân vật này có thể thực hiện hội thoại bằng ngôn ngữ tự nhiên và thực hiện các nhiệm vụ cụ thể.
-
Phân tích dữ liệu: Character.AI đạt 277 triệu lượt truy cập trong tháng 5, có hơn 3,5 triệu người dùng hoạt động hàng ngày, phần lớn trong độ tuổi 18-34, cho thấy nhóm người dùng trẻ. Trên thị trường vốn, Character AI thể hiện tốt khi huy động 150 triệu USD, định giá 1 tỷ USD, do a16z dẫn vốn.
-
Phân tích công nghệ: Character AI ký thỏa thuận cấp phép sử dụng mô hình ngôn ngữ lớn của Alphabet (công ty mẹ Google) theo hình thức không độc quyền, cho thấy họ sử dụng công nghệ tự phát triển. Đáng chú ý, các nhà sáng lập Noam Shazeer và Daniel De Freitas từng tham gia phát triển mô hình ngôn ngữ hội thoại Llama của Google.
Perplexity AI:
-
Giới thiệu sản phẩm: Perplexity có khả năng trích xuất và cung cấp câu trả lời chi tiết từ Internet. Thông qua trích dẫn và liên kết tham khảo đảm bảo độ tin cậy và chính xác thông tin, đồng thời nó hướng dẫn, khuyến khích người dùng đặt câu hỏi sâu hơn và tìm kiếm từ khóa, đáp ứng nhu cầu tra cứu đa dạng.
-
Phân tích dữ liệu: Số lượng người dùng hoạt động hàng tháng của Perplexity đạt 10 triệu, lượng truy cập vào ứng dụng di động và máy tính để bàn tăng 8,6% vào tháng 2, thu hút khoảng 50 triệu người dùng. Trên thị trường vốn, Perplexity AI gần đây thông báo huy động được 62,7 triệu USD, định giá 1,04 tỷ USD, do Daniel Gross dẫn vốn, với sự tham gia của Stan Druckenmiller và NVIDIA.
-
Phân tích công nghệ: Perplexity sử dụng chủ yếu mô hình GPT-3.5 được tinh chỉnh, cùng hai mô hình lớn được tinh chỉnh từ mô hình mã nguồn mở: pplx-7b-online và pplx-70b-online. Mô hình phù hợp với nghiên cứu học thuật chuyên môn và truy vấn lĩnh vực dọc, đảm bảo độ chân thực và độ tin cậy thông tin.
Midjourney:
-
Giới thiệu sản phẩm: Người dùng có thể tạo hình ảnh với nhiều phong cách và chủ đề khác nhau trên Midjourney thông qua Prompts, bao phủ nhu cầu sáng tạo từ chân thực đến trừu tượng. Nền tảng còn cung cấp chức năng trộn và chỉnh sửa hình ảnh, cho phép người dùng chồng hình và chuyển đổi phong cách. Tính năng tạo hình ảnh theo thời gian thực đảm bảo người dùng nhận được hình ảnh trong vài chục giây đến vài phút.
-
Phân tích dữ liệu: Nền tảng đã có 15 triệu người dùng đăng ký, với 1,5 - 2,5 triệu người dùng hoạt động. Đồng thời, theo thông tin thị trường công khai, Midjourney không huy động vốn từ các tổ chức đầu tư, mà tự phát triển bền vững nhờ uy tín và nguồn lực từ người sáng lập David, người từng nhiều lần khởi nghiệp thành công.
-
Phân tích công nghệ: Midjourney sử dụng mô hình riêng, không công khai. Kể từ khi phát hành Midjourney V4 vào tháng 8 năm 2022, nền tảng luôn sử dụng mô hình tạo sinh dựa trên khuếch tán (diffusion). Được cho là mô hình có tham số huấn luyện từ 30 đến 40 tỷ, con số lớn này là nền tảng vững chắc cho sự đa dạng và độ chính xác trong việc tạo hình ảnh.
Bế tắc trong thương mại hóa
Sau khi trải nghiệm nhiều AI Agent Web2, chúng tôi quan sát thấy lộ trình phát triển sản phẩm phổ biến: từ ban đầu tập trung vào nhiệm vụ nhỏ, đến sau mở rộng khả năng xử lý các kịch bản đa nhiệm phức tạp hơn. Xu hướng này không chỉ thể hiện tiềm năng của AI Agent trong nâng cao hiệu quả và đổi mới sáng tạo, mà còn báo hiệu vai trò ngày càng quan trọng trong tương lai. Qua thống kê sơ bộ 125 dự án AI Agent trong Web2, chúng tôi thấy các dự án chủ yếu tập trung vào tạo nội dung (như Jasper AI), công cụ phát triển (như Replit), và đặc biệt là dịch vụ B2B (như Cresta) với số lượng nhiều nhất. Phát hiện này trái ngược với kỳ vọng ban đầu – chúng tôi tưởng rằng khi công nghệ mô hình AI ngày càng trưởng thành, thị trường C2C sẽ chứng kiến sự bùng nổ của AI Agent. Nhưng sau khi phân tích, chúng tôi nhận ra: Con đường thương mại hóa AI Agent C2C gập ghềnh và phức tạp hơn nhiều so với dự kiến.
Lấy ví dụ Character.AI, một mặt, nó có hiệu suất lưu lượng truy cập tốt nhất. Nhưng do mô hình kinh doanh đơn giản, chỉ dựa vào phí đăng ký 9,9 USD, đối mặt với doanh thu đăng ký ít ỏi trong khi chi phí suy luận người dùng cao, cuối cùng vẫn bị Google mua lại toàn bộ đội ngũ do khó biến lưu lượng thành tiền và vấn đề dòng tiền. Trường hợp này cho thấy, dù có lưu lượng và vốn tốt đến đâu, các ứng dụng AI Agent C2C vẫn gặp khó khăn lớn trong thương mại hóa. Nó phản ánh rằng phần lớn sản phẩm vẫn chưa đạt đến tiêu chuẩn thay thế hoặc hỗ trợ hiệu quả con người, dẫn đến người dùng C2C chưa sẵn sàng chi trả mạnh mẽ cho các sản phẩm hiện tại. Trong khảo sát nghiên cứu thực tế, chúng tôi thấy nhiều startup gặp phải vấn đề tương tự Character.ai – phát triển AI Agent C2C không hề suôn sẻ, mà cần khám phá sâu hơn về độ trưởng thành công nghệ, giá trị sản phẩm và đổi mới mô hình kinh doanh để thực hiện tiềm năng và giá trị trên thị trường C2C.
So sánh định giá của phần lớn dự án AI Agent với các dự án đỉnh cao như OpenAI, xAI, vẫn còn khoảng cách từ 10-50 lần. Không thể phủ nhận rằng trần thương mại hóa của ứng dụng Agent C2C vẫn rất cao, chứng tỏ đây vẫn là một赛道 tốt. Nhưng tổng hợp các phân tích trên, chúng tôi cho rằng so với C2C, thị trường B2B có thể là điểm đến cuối cùng của AI Agent. Doanh nghiệp xây dựng nền tảng, tích hợp AI Agent vào các phần mềm quản lý như CRM, OA văn phòng, trong các lĩnh vực dọc, không chỉ nâng cao hiệu quả vận hành mà còn mở rộng không gian ứng dụng cho AI Agent. Vì vậy, chúng tôi có lý do tin rằng dịch vụ B2B sẽ là hướng phát triển chính của AI Agent trong môi trường Internet truyền thống Web2 trong ngắn hạn.
Phân tích thực trạng và triển vọng phát triển AI Agent Web3
Tổng quan dự án
Theo phân tích trước, ngay cả các ứng dụng AI Agent đã huy động vốn đỉnh cao và có lưu lượng người dùng tốt vẫn gặp khó khăn trong việc tạo doanh thu. Tiếp theo, chúng tôi sẽ đi sâu phân tích tình hình phát triển hiện tại của các dự án AI Agent trong Web3. Thông qua đánh giá một loạt các dự án tiêu biểu – bao gồm đổi mới công nghệ, biểu hiện thị trường, phản hồi người dùng và tiềm năng phát triển – nhằm khai thác các đề xuất mang tính gợi mở. Hình bên dưới là một số dự án tiêu biểu đã phát hành token và có vốn hóa cao trên thị trường hiện nay:

Tổng hợp các dự án AI Agent hàng đầu trong Web2, Nguồn: Cơ sở dữ liệu dự án ArkStream
Theo thống kê thị trường AI Agent Web3 của chúng tôi, loại hình phát triển dự án cũng cho thấy xu hướng tập trung rõ rệt. Phần lớn dự án thuộc hạng mục Cơ sở hạ tầng, đồng thời thiếu vắng các dự án tạo nội dung. Hầu hết dự án cố gắng giải quyết nhu cầu huấn luyện mô hình bằng cách kêu gọi người dùng cung cấp dữ liệu phân tán, năng lực tính toán. Hoặc cố gắng xây dựng nền tảng tích hợp một cửa, nhúng nhiều dịch vụ và công cụ AI Agent, từ công cụ phát triển đến ứng dụng tương tác phía trước, ứng dụng tạo sinh... Trong khi đó, ngành AI Agent truyền thống hiện chủ yếu giới hạn ở việc điều chỉnh tham số mã nguồn mở hoặc áp dụng mô hình hiện có để xây dựng ứng dụng, phương pháp này chưa tạo ra hiệu ứng mạng lưới đáng kể ở cả cấp độ doanh nghiệp và người dùng cá nhân.
Phân tích thực trạng
Chúng tôi cho rằng hiện tượng này hiện tại có thể do một số yếu tố thúc đẩy:
Mismatch giữa thị trường và công nghệ: Điểm kết nối giữa Web3 và AI Agent hiện tại so với thị trường truyền thống chưa có lợi thế rõ ràng. Ưu điểm thực sự của nó nằm ở cải thiện quan hệ sản xuất, tối ưu hóa tài nguyên và hợp tác theo cách phi tập trung. Điều này có thể khiến một số ứng dụng tương tác và tạo nội dung thiếu sức cạnh tranh trước các đối thủ truyền thống có thực lực công nghệ và tài chính mạnh.
Giới hạn bối cảnh ứng dụng: Trong môi trường Web3, có thể không có nhiều nhu cầu thực tế để tạo hình ảnh, video hay văn bản. Ngược lại, đặc tính phi tập trung và phân tán của Web3 chủ yếu được dùng để giảm chi phí và tăng hiệu quả trong lĩnh vực AI truyền thống, chứ không phải mở rộng bối cảnh ứng dụng mới.
Gốc rễ của hiện tượng này, theo chúng tôi, có thể truy ngược về trạng thái phát triển hiện tại của ngành AI và định hướng tương lai. Có lẽ chính vì công nghệ AI hiện tại vẫn ở giai đoạn sơ khai, giống như giai đoạn chuyển tiếp khi động cơ hơi nước bị thay thế bởi động cơ điện trong Cách mạng Công nghiệp, chưa đạt đến thời đại điện khí hóa phổ biến.
Chúng tôi có lý do tin rằng xu hướng phát triển AI trong tương lai có thể đi theo con đường tương tự. Mô hình tổng quát sẽ dần định hình, trong khi các mô hình tinh chỉnh sẽ phát triển đa dạng. Ứng dụng AI sẽ phân tán rộng rãi đến từng doanh nghiệp và người dùng cá nhân, trọng tâm sẽ chuyển sang kết nối và tương tác giữa các mô hình. Xu hướng này cực kỳ phù hợp với triết lý Web3, bởi Web3 nổi tiếng với tính tổ hợp (composability) và không cần cho phép (permissionless), hoàn toàn ăn khớp với tư tưởng tinh chỉnh mô hình phân tán. Nhà phát triển được trao quyền tự do hơn, có thể thoải mái tổ hợp và điều chỉnh các mô hình khác nhau. Đồng thời, đặc tính phi tập trung cũng mang lại lợi thế độc đáo trong bảo vệ quyền riêng tư dữ liệu, phân bổ tài nguyên tính toán cho việc huấn luyện mô hình.
Cùng với tiến bộ công nghệ, đặc biệt là sự xuất hiện của các công nghệ mới như LoRA (Low-Rank Adaptation), chi phí và ngưỡng kỹ thuật tinh chỉnh mô hình được giảm mạnh. Điều này khiến việc phát triển mô hình công khai cho bối cảnh cụ thể hoặc đáp ứng nhu cầu cá nhân hóa người dùng trở nên dễ dàng hơn. Các dự án AI Agent trong Web3 có thể tận dụng tối đa tiến bộ này để khám phá các phương pháp huấn luyện mới, cơ chế khuyến khích sáng tạo, cũng như các mô hình chia sẻ và hợp tác mô hình mới – điều khó thực hiện trong các hệ thống tập trung truyền thống.
Ngoài ra, sự tập trung của các dự án Web3 vào huấn luyện mô hình cũng thể hiện tính toán chiến lược về vị trí quan trọng trong toàn bộ hệ sinh thái AI. Vì vậy, sự tập trung của các dự án AI Agent trong ngành Web3 vào lĩnh vực huấn luyện mô hình là sự hội tụ tự nhiên giữa xu hướng phát triển công nghệ, nhu cầu thị trường và lợi thế của ngành Web3. Tiếp theo, chúng tôi sẽ lấy ví dụ một số dự án huấn luyện mô hình trong ngành Web2&3 để so sánh.
Các dự án huấn luyện mô hình
Humans.ai
-
Giới thiệu dự án: Humans.ai là thư viện thuật toán AI đa dạng và môi trường huấn luyện triển khai, bao phủ nhiều lĩnh vực như hình ảnh, video, âm thanh, văn bản. Nền tảng không chỉ hỗ trợ nhà phát triển huấn luyện và tối ưu hóa mô hình mà còn cho phép họ chia sẻ và giao dịch mô hình của mình. Một điểm đổi mới nổi bật là Humans.ai sử dụng NFT làm phương tiện lưu trữ mô hình AI và dữ liệu đặc điểm sinh học người dùng, khiến quá trình tạo nội dung AI trở nên cá nhân hóa và an toàn hơn.
-
Phân tích dữ liệu: Token Heart của Humans.ai có vốn hóa khoảng 68 triệu USD. Có 56k người theo dõi Twitter, chưa công bố dữ liệu người dùng.
-
Phân tích công nghệ: Humans.ai không tự phát triển mô hình, mà sử dụng phương pháp mô-đun, đóng gói tất cả các mô hình cung cấp vào NFT, mang lại giải pháp AI linh hoạt và có thể mở rộng cho người dùng.
FLock.io
-
Giới thiệu dự án: FLock.io là nền tảng cộng sáng tạo AI dựa trên công nghệ Học Liên bang (Federated Learning) – một phương pháp học máy phi tập trung nhấn mạnh bảo mật dữ liệu. Nền tảng giải quyết các điểm đau trong ngành AI như mức độ tham gia công chúng thấp, bảo vệ quyền riêng tư không đủ và sự độc quyền công nghệ AI của các công ty lớn. Cho phép người dùng đóng góp dữ liệu trong khi bảo vệ quyền riêng tư, thúc đẩy dân chủ hóa và phi tập trung hóa công nghệ AI.
-
Phân tích dữ liệu: Đầu năm 2024 hoàn thành vòng hạt giống 6 triệu USD, do Lightspeed Faction và Tagus Capital dẫn vốn, với sự tham gia của DCG, OKX Ventures.
-
Phân tích công nghệ: Kiến trúc công nghệ của FLock.io dựa trên Học Liên bang, một phương pháp phi tập trung đồng thời bảo vệ quyền riêng tư dữ liệu. Ngoài ra, FLock.io còn sử dụng zkFL, mã hóa đồng dạng (homomorphic encryption) và tính toán an toàn đa bên (SMPC) để tăng cường bảo vệ quyền riêng tư dữ liệu.
Đây là các dự án huấn luyện mô hình AI Agent trong ngành Web3. Trong Web2 cũng có các nền tảng tương tự cung cấp dịch vụ huấn luyện mô hình, ví dụ như Predibase.
Predibase
-
Giới thiệu dự án: Predibase chuyên về tối ưu hóa AI và mô hình ngôn ngữ lớn, cho phép người dùng tinh chỉnh và triển khai các mô hình ngôn ngữ lớn mã nguồn mở như Llama, CodeLlama, Phi. Nền tảng hỗ trợ nhiều công nghệ tối ưu như lượng hóa, thích nghi hạng thấp (low-rank adaptation) và huấn luyện phân tán tiết kiệm bộ nhớ.
-
Phân tích dữ liệu: Predibase thông báo hoàn thành vòng A 12,2 triệu USD do Felicis dẫn vốn, các doanh nghiệp lớn như Uber, Apple, Meta và các startup như Paradigm, Koble.ai đều là người dùng nền tảng.
-
Phân tích công nghệ: Người dùng Predibase đã huấn luyện hơn 250 mô hình, hiện nền tảng sử dụng kiến trúc LoRAX và framework Ludwig: LoRAX cho phép người dùng phục vụ hàng nghìn mô hình LLM tinh chỉnh trên một GPU đơn, giảm mạnh chi phí mà không ảnh hưởng đến thông lượng hay độ trễ. Ludwig là framework khai báo, Predibase dùng để phát triển, huấn luyện, tinh chỉnh và triển khai các mô hình học sâu và mô hình ngôn ngữ lớn tiên tiến nhất.
-
Phân tích dự án: Nền tảng Predibase có tính thân thiện với người dùng, cung cấp dịch vụ xây dựng ứng dụng AI tùy chỉnh cho mọi cấp độ người dùng, dù là người dùng C2C/B2B hay người mới hay giàu kinh nghiệm trong lĩnh vực AI.
Đối với người mới, tính năng tự động hóa một cú nhấp chuột của Predibase đơn giản hóa quá trình xây dựng và huấn luyện mô hình. Nền tảng tự động hoàn tất các bước xây dựng và triển khai phức tạp. Đối với người dùng có kinh nghiệm, nền tảng cung cấp các tùy chọn tùy chỉnh sâu hơn. Không chỉ cung cấp dịch vụ tự động mà còn cho phép người dùng truy cập và điều chỉnh các thiết lập tham số chuyên sâu hơn. Khi so sánh các nền tảng huấn luyện mô hình AI truyền thống với các dự án AI trong lĩnh vực Web3, mặc dù khung tổng thể và logic có thể tương tự, chúng tôi nhận thấy tồn tại một số khác biệt đáng kể về kiến trúc công nghệ và mô hình kinh doanh.
-
Độ sâu và đổi mới công nghệ: Các nền tảng huấn luyện mô hình AI truyền thống thường sử dụng các rào cản kỹ thuật sâu hơn, ví dụ như kiến trúc LoRAX và framework Ludwig do tự phát triển. Các framework này cung cấp chức năng mạnh mẽ, cho phép nền tảng xử lý các nhiệm vụ huấn luyện mô hình AI phức tạp. Tuy nhiên, các dự án Web3 có thể chú trọng hơn vào tính phi tập trung và mở, mà chưa đi sâu về công nghệ.
-
Tính linh hoạt của mô hình kinh doanh: Trong lĩnh vực huấn luyện mô hình AI truyền thống, chúng tôi nhận thấy một điểm nghẽn phổ biến là thiếu tính linh hoạt trong mô hình kinh doanh. Nền tảng yêu cầu người dùng trả phí để huấn luyện mô hình, nguồn vốn hạn chế không gian phát triển bền vững của dự án, đặc biệt trong giai đoạn đầu cần sự tham gia rộng rãi của người dùng và thu thập dữ liệu. Ngược lại, các dự án Web3 có mô hình kinh doanh linh hoạt hơn, ví dụ như kinh tế token theo mô hình cộng đồng.
-
Thách thức bảo vệ quyền riêng tư: Bảo vệ quyền riêng tư là một vấn đề then chốt khác. Lấy ví dụ Predibase, dù cung cấp dịch vụ đám mây riêng ảo trên AWS, nhưng kiến trúc phụ thuộc bên thứ ba này luôn tiềm ẩn rủi ro rò rỉ dữ liệu.
Những điểm khác biệt này, không ngoại lệ, đều trở thành điểm nghẽn trong ngành AI truyền thống. Chính đặc tính Internet khiến những vấn đề này khó được giải quyết hiệu quả. Đồng thời, điều này cũng mang lại cơ hội và thử thách cho Web3 – các dự án nào giải quyết trước những vấn đề này có khả năng cao trở thành tiên phong trong ngành.
Các dự án Agent khác trong Web3
Sau khi thảo luận về các dự án AI Agent chuyên huấn luyện mô hình, chúng tôi mở rộng phạm vi sang các loại hình AI Agent khác trong ngành Web3. Những dự án này tuy không chỉ tập trung vào huấn luyện mô hình, nhưng lại thể hiện sự khác biệt trong dữ liệu gọi vốn, niêm yết sàn và vốn hóa token. Dưới đây là một số dự án AI Agent tiêu biểu và có ảnh hưởng trong lĩnh vực riêng:
Myshell
-
Giới thiệu sản phẩm: Cung cấp nền tảng AI Agent toàn diện, cho phép người dùng tạo, chia sẻ, cá nhân hóa AI Agent. Các Agent này vừa có thể đồng hành, vừa hỗ trợ công việc nâng cao hiệu quả. Nền tảng bao gồm nhiều phong cách Agent đa dạng, từ phong cách anime đến truyền thống, hình thức tương tác bao gồm âm thanh, video và văn bản. Điểm đặc biệt của MyShell là tích hợp nhiều mô hình hiện có như GPT4o, GPT4, Claude, mang lại trải nghiệm cao cấp tương đương các AI Agent trả phí truyền thống. Ngoài ra, nền tảng giới thiệu hệ thống giao dịch kiểu FT bonding curve, khuyến khích người sáng tạo phát triển mô hình AI giá trị cao, đồng thời cho người dùng cơ hội đầu tư và chia sẻ lợi nhuận.
-
Phân tích dữ liệu: MyShell đạt định giá khoảng 80 triệu USD trong vòng gọi vốn gần nhất, do Dragonfly dẫn vốn, với sự tham gia của các nhà đầu tư nổi tiếng như Binance, Hashkey, Folius. Dù không có dữ liệu truy cập cụ thể, MyShell có gần 180K người theo dõi Twitter, số người online Discord thường không vượt quá một phần mười tổng số người theo dõi, cho thấy dự án có một cộng đồng người dùng và nhà phát triển trung thành.
-
Phân tích công nghệ: MyShell không tự phát triển mô hình AI, mà đóng vai trò nền tảng tích hợp, tập hợp các mô hình tiên tiến như Claude, GPT-4, 4o, và tuyên bố hỗ trợ các mô hình đóng khác. Chiến lược này giúp MyShell tận dụng tài nguyên công nghệ hiện có, mang lại trải nghiệm AI thống nhất và tiên tiến cho người dùng.
-
Trải nghiệm chủ quan: MyShell cho phép người dùng tự do tạo và tùy chỉnh AI Agent theo nhu cầu, dù là người đồng hành cá nhân hay trợ lý chuyên nghiệp, đều thích nghi với nhiều bối cảnh như âm thanh, video. Người dùng ngay cả khi không dùng Agent của MyShell cũng có thể trải nghiệm các mô hình trả phí Web2 với chi phí thấp. Ngoài ra, nền tảng kết hợp khái niệm kinh tế FT, cho phép người dùng không chỉ sử dụng dịch vụ AI mà còn đầu tư vào các AI Agent họ tin tưởng, tăng hiệu ứng tài sản thông qua cơ chế bonding curve.
Delysium
-
Giới thiệu sản phẩm: Delysium cung cấp mạng lưới AI Agent lấy ý định (intent) làm trung tâm, giúp Agent phối hợp tốt hơn mang lại trải nghiệm Web3 thân thiện cho người dùng. Hiện tại, Delysium đã ra mắt hai AI Agent: Lucy và Jerry. Lucy là Agent kết nối Internet, tầm nhìn là cung cấp hỗ trợ dạng công cụ, ví dụ như truy vấn địa chỉ ví nắm giữ Top10, nhưng hiện chức năng thực hiện intent trên chuỗi chưa mở, chỉ thực hiện được một số lệnh cơ bản như stake AGI trong hệ sinh thái hoặc đổi sang USDT. Jerry thì giống như GPT trong hệ sinh thái Delysium, chủ yếu trả lời các câu hỏi liên quan hệ sinh thái, ví dụ như phân bổ token.
-
Phân tích dữ liệu: Vòng gây vốn đầu tiên năm 2022 là 4 triệu USD, cùng năm thông báo hoàn thành vòng gọi vốn chiến lược 10 triệu USD. Token AGI hiện có FDV khoảng 130 triệu USD. Chưa có dữ liệu người dùng mới nhất, theo thống kê chính thức Delysium,截至 tháng 6/2023 Lucy đã tích lũy hơn 1,4 triệu ví kết nối độc lập.
Sleepless AI
-
Giới thiệu sản phẩm: Nền tảng trò chơi đồng hành cảm xúc kết hợp công nghệ Web3 và AI Agent, cung cấp các trò chơi bạn đời ảo HIM và HER, sử dụng AIGC và LLM để người dùng đắm chìm trong tương tác với nhân vật ảo. Trong quá trình đối thoại liên tục, người dùng có thể thay đổi thuộc tính, trang phục nhân vật, mô hình LLM tương thích đảm bảo nhân vật tự lặp lại và hiểu người dùng hơn sau mỗi cuộc trò chuyện.
-
Phân tích dữ liệu: Dự án huy động tổng cộng 3,7 triệu USD, nhà đầu tư bao gồm Binance Labs, Foresight Ventures và Folius Ventures, vốn hóa token hiện đạt khoảng 400 triệu USD. Có 116K người theo dõi Twitter, theo thống kê chính thức số người đăng ký đặt trước đạt 190K, người dùng hoạt động đạt 43K. Có thể nói mức độ gắn bó người dùng khá cao.
-
Phân tích công nghệ: Mặc dù chính thức không công bố sản phẩm dựa trên mô hình ngôn ngữ lớn nào trên thị trường, nhưng Sleepless AI để đảm bảo người dùng cảm nhận được nhân vật ngày càng hiểu mình trong quá trình trò chuyện, đã huấn luyện riêng một mô hình cho từng nhân vật trong thiết kế huấn luyện LLM, đồng thời kết hợp cơ sở dữ liệu vector và hệ thống tham số tính cách để nhân vật có trí nhớ.
-
Trải nghiệm chủ quan: Sleepless AI tiếp cận với góc độ Free to Play thông qua AI Boyfriend, AI Girlfriend, chứ không đơn thuần là hộp chat robot hội thoại. Dự án tăng cường mạnh mẽ tính chân thực của nhân vật ảo thông qua đồ họa chất lượng cao, mô hình ngôn ngữ liên tục lặp lại, lồng tiếng đầy đủ chất lượng cao, cùng loạt chức năng như báo thức, hỗ trợ ngủ, ghi chép chu kỳ kinh nguyệt, đồng hành học tập... Giá trị cảm xúc này là điều các ứng dụng khác trên thị trường không cảm nhận được. Ngoài ra, Sleepless AI tạo ra cơ chế thanh toán nội dung dài hạn, cân bằng, người dùng có thể chọn bán NFT, tránh rơi vào bẫy P2E hoặc Ponzi, mô hình này đồng thời cân nhắc đến lợi ích người chơi và trải nghiệm trò chơi.
Phân tích triển vọng
Trong ngành Web3, các dự án AI Agent bao phủ nhiều hướng như blockchain công cộng, quản lý dữ liệu, bảo vệ quyền riêng tư, mạng xã hội, dịch vụ nền tảng và năng lực tính toán. Về vốn hóa token, tổng vốn hóa token của các dự án AI Agent đạt gần 3,8 tỷ USD, trong khi tổng vốn hóa toàn ngành AI gần 16,2 tỷ USD. Tỷ trọng vốn hóa của AI Agent trong ngành AI khoảng 23%.

Dù số lượng dự án AI Agent chỉ khoảng hơn chục cái, ít hơn nhiều so với toàn ngành AI, nhưng tỷ trọng định giá trên thị trường lại gần một phần tư. Tỷ trọng vốn hóa trong ngành AI một lần nữa xác nhận tiềm năng tăng trưởng lớn của phân khúc này.
Sau khi thống kê, chúng tôi đặt ra một câu hỏi cốt lõi: Những dự án Agent nào có đặc điểm gì để thu hút vốn tốt và niêm yết trên các sàn giao dịch hàng đầu? Để trả lời câu hỏi này, chúng tôi tìm hiểu các dự án đã đạt kết quả trong ngành Agent như Fetch.ai, Olas Network, SingularityNET và Myshell.
Không khó để nhận thấy các dự án này cùng thể hiện một số đặc điểm nổi bật: Tất cả đều thuộc hạng mục Nền tảng tích hợp trong Cơ sở hạ tầng, xây dựng một cây cầu, một đầu nối với người dùng có nhu cầu về Agent (B2C hoặc C2C), đầu kia phục vụ nhà phát triển và người xác minh – những người chịu trách nhiệm hiệu chỉnh và huấn luyện mô hình. Dù sản phẩm cung cấp liên quan đến on-chain hay off-chain dường như không phải yếu tố then chốt. Điều này dẫn chúng tôi đến kết luận ban đầu: Trong lĩnh vực Web3, logic coi trọng ứng dụng thực tế như Web2 có thể không hoàn toàn phù hợp. Đối với các sản phẩm AI Agent hàng đầu trong Web3, việc xây dựng hệ sinh thái hoàn chỉnh và cung cấp chức năng đa dạng có thể quan trọng hơn chất lượng và hiệu suất của một sản phẩm đơn lẻ. Nói cách khác, thành công của một dự án không chỉ phụ thuộc vào việc nó cung cấp gì, mà còn ở cách nó tích
Chào mừng tham gia cộng đồng chính thức TechFlow
Nhóm Telegram:https://t.me/TechFlowDaily
Tài khoản Twitter chính thức:https://x.com/TechFlowPost
Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News













