
Là nhu cầu thực sự hay chỉ đang theo đuổi trào lưu? Các quỹ đầu tư tiền mã hóa nhìn nhận như thế nào về sự kết hợp giữa AI và Web3?
Tuyển chọn TechFlowTuyển chọn TechFlow

Là nhu cầu thực sự hay chỉ đang theo đuổi trào lưu? Các quỹ đầu tư tiền mã hóa nhìn nhận như thế nào về sự kết hợp giữa AI và Web3?
AI+Web3 có thể trở thành một điểm đột phá lớn trong sự tích hợp và đổi mới ngành nghề trong tương lai
Tác giả: Wanxiang Blockchain
Nhìn nhận thế nào về sự kết hợp giữa AI và dữ liệu Web3? Có những hướng đáng chú ý nào?
Hashkey Capital - Harper: Tôi cho rằng việc kết hợp AI và dữ liệu web3 có thể được chia thành một số điểm sau: thứ nhất là sử dụng mô hình LLM để chuyển đổi ngôn ngữ tự nhiên thành SQL, ví dụ như Dune, hoặc một số dự án chuyên làm công cụ tìm kiếm nhằm cải thiện khả năng truy vấn SQL, từ đó trích xuất chính xác dữ liệu trong cơ sở dữ liệu. Ngoài ra còn có các dự án dùng ngôn ngữ tự nhiên để tự động sinh mã SQL, giúp lập trình viên sao chép và sử dụng ngay. Thứ hai là cách tiếp cận qua trò chuyện, phát triển các agent chat dựa trên ChatGPT, chủ yếu tập trung vào cung cấp cửa sổ chat, không quá nhấn mạnh vào tối ưu hóa SQL hay tìm kiếm, mà mang tính tự do hơn — ví dụ như hỏi "KOL nào vừa pump token này?" hay "Sự kiện an ninh này ảnh hưởng thế nào đến giá token?" (lúc này hệ thống có thể quét toàn mạng để đưa ra kết quả, chứ không cần truy vấn cơ sở dữ liệu bằng SQL). Thứ ba là sử dụng AI xây dựng mô hình phù hợp để tổ chức dữ liệu off-chain và on-chain, từ đó rút ra các thông tin sâu sắc (insight) tốt hơn.
So sánh thì, phương án thứ nhất đòi hỏi đội ngũ phát triển phải có năng lực xây dựng cơ sở dữ liệu mạnh, vì dữ liệu Web3 rất phức tạp khi xử lý; tuy nhiên để đạt độ chính xác và tốc độ cao thì vẫn rất khó. Phương án thứ hai lại đơn giản hơn,门槛 cũng không quá cao.
SevenX Ventures - Yuxing: Thực tế, dữ liệu là thức ăn nuôi dưỡng AI. Dữ liệu Web3 thì công khai và có thể kiểm chứng, còn AI lại có đặc điểm "hộp đen", khó kiểm chứng. Khi kết hợp hai yếu tố này, có thể tạo ra những phản ứng thú vị. Hiện tại tôi thiên về việc phân loại sự kết hợp AI và Web3 thành hai hướng, chứ không đơn thuần là "AI + dữ liệu Web3", mà nên xem xét: AI có thể giúp Web3 tốt lên thế nào, và ngược lại Web3 có thể giúp AI trở nên tốt hơn ra sao.
Trước hết, với dữ liệu Web3, AI có thể tận dụng triệt để đặc điểm công khai và kiểm chứng được của dữ liệu Web3. Bất kỳ mô hình AI nào cũng có thể sử dụng dữ liệu Web3 để khai thác và tạo giá trị, dù là tư vấn đầu tư hay cảnh báo rủi ro. AI có thể giúp tăng hiệu suất xử lý và phân tích dữ liệu Web3. Mặt khác, Web3 có thể gia tăng độ tin cậy cho AI, bởi bản thân Web3 là một cơ chế tin cậy mới. Nhờ tính minh bạch và khả năng kiểm chứng của dữ liệu Web3, ta có thể nâng cao tính minh bạch cho AI, thậm chí trong các lĩnh vực quan trọng như báo chí hay tài liệu, ta có thể lưu trữ thông tin then chốt theo cách Web3, từ đó tránh được một số vấn đề tồn tại trong AI.
Một trong những vấn đề phổ biến đó là hiện tượng làm giả của AI, và vấn đề hộp đen. Một số thuật toán AI có thể dễ hiểu, nhưng nhiều thuật toán khác thì rất khó giải thích — ví dụ như mạng nơ-ron phức tạp hay GPT, người dùng thường đặt câu hỏi: câu trả lời này được sinh ra như thế nào? Dữ liệu và thuật toán của nó không minh bạch, khiến nó trông như một dạng ảo thuật. Ví dụ, trước đây có thuật toán nhận diện khuôn mặt đã nhầm người da đen với loài tinh tinh, nguyên nhân là do hình ảnh người da đen trong bộ dữ liệu huấn luyện quá ít.
Nếu dữ liệu mà mô hình AI sử dụng đều có thể kiểm chứng, chúng ta sẽ dễ dàng hơn trong việc xác định liệu có sai lệch mẫu hay không. Khi dùng dữ liệu Web3 nhờ tính minh bạch, nguồn gốc huấn luyện và kết quả của toàn bộ mô hình AI sẽ rõ ràng hơn. Như vậy, chúng ta có thể đánh giá AI một cách công bằng hơn, hiểu được nguồn ra quyết định của nó, giảm thiểu thành kiến và sai sót.
Vấn đề hộp đen có thể chia sơ bộ thành hai phần. Một là hộp đen ở thuật toán mô hình — bao gồm cách huấn luyện mô hình, cách sinh nội dung, cả về quy trình huấn luyện lẫn cơ chế thuật toán đều thiếu minh bạch hoặc không thể giải thích. Hai là hộp đen về dữ liệu — dữ liệu không công khai, vấn đề bộ dữ liệu huấn luyện cũng dẫn đến kết quả sai lệch.
Nếu sai lệch này liên quan đến độ chính xác nội dung, ta vẫn có thể cải thiện dần. Nhưng nếu liên quan đến vấn đề ý thức hệ, đặc biệt là phân biệt chủng tộc hay chính trị, thì có thể rất khó điều chỉnh. Lúc này chỉ còn cách kiểm soát đầu ra — ví dụ như hiện nay nhiều hệ thống quốc gia hay doanh nghiệp nhà nước dùng mô hình AI, điểm quan trọng nhất là kiểm soát đầu ra: cái gì không được nói. Đây là việc khó nhất, và về bản chất cũng tương tự như sai lệch ý thức hệ đã nói ở trên.
Qiming Venture Partners - Đường Nghệ: Về việc kết hợp AI và dữ liệu Web3, cá nhân tôi cho rằng AI trong lĩnh vực này có phần bị thổi phồng, chiêu trò nhiều hơn giá trị thực tế. Bởi theo tôi thấy, sản phẩm dữ liệu Crypto vẫn ở giai đoạn khá sơ khai, nền tảng dữ liệu chưa đủ vững chắc. Trong tình trạng này, việc quá sớm đưa AI hay phân tích dữ liệu vào có thể còn vội vàng.
Hơn nữa, xét từ góc độ người dùng, phần lớn các trường hợp kết hợp dự án mã hóa với AI không thật sự hợp lý, hoặc không cần dùng đến AI. Bởi đợt AI nổi bật gần đây, đặc biệt là các mô hình sinh nội dung, đều dựa trên lượng lớn dữ liệu Internet — như xử lý ngôn ngữ hay sinh ảnh. Mặc dù có người dùng AI sinh nội dung để cải thiện trải nghiệm người dùng, tạo cảm giác tương tác và đối thoại tốt hơn, nhưng trong đa số trường hợp thì giá trị mang lại vẫn còn hạn chế. Tôi nghĩ nếu bàn về AI rộng hơn (khả năng phân tích dữ liệu hoặc các mô hình AI đơn giản hơn) thì có thể có vài trường hợp — ví dụ như dùng dữ liệu để định giá NFT, hoặc các đội giao dịch chuyên nghiệp dùng dữ liệu để thực hiện giao dịch. Tổng thể mà nói, với làn sóng AI hiện nay, tôi tạm thời chưa nhìn thấy cơ hội nào mang lại lợi ích ngắn hạn rõ rệt cho ngành tiền mã hóa.
Dĩ nhiên, tôi cũng thấy một số dự án sớm đang thử sử dụng AI để nâng cao năng lực xử lý hoặc phân tích dữ liệu. Ví dụ, tôi thấy các dự án sớm đang dùng khả năng AI để giải thích logic hợp đồng thông minh hoặc thực hiện phân loại, nhận diện. Những công việc này trong lĩnh vực hợp đồng thông minh và tiền mã hóa yêu cầu độ chính xác rất cao, vì liên quan đến các hành động then chốt như giao dịch. Do đó, tôi hình dung việc dùng AI để xử lý dữ liệu sơ bộ có thể có ý nghĩa, nhưng cuối cùng có lẽ vẫn cần con người can thiệp để đảm bảo độ chính xác. Nếu bạn muốn dùng AI trực tiếp kích hoạt giao dịch, ngoài các trader chuyên nghiệp ra, tôi cho rằng sản phẩm vẫn cần tiến bộ rất nhiều.
Matrix Partners - Tử Hy: Chúng tôi đã theo dõi nhiều dự án dữ liệu Web3, ví dụ như Footprint — ban đầu tôi là người dùng trung thành của nó, ngoài ra còn có Dune. Tôi thấy Footprint và Dune chủ yếu phục vụ VC, lập trình viên và một số doanh nghiệp nhỏ, còn người dùng phổ thông thì ít liên hệ trực tiếp với các dịch vụ này.
Chúng tôi cũng xem qua một số công ty phân tích dữ liệu liên quan trực tiếp đến giao dịch hoặc lợi nhuận trong tiền mã hóa, như Nansen, DefiLlama, Token Terminal, DappRadar, đương nhiên cả Dune và Footprint. Các công ty này rất hữu ích với VC và lập trình viên, nhưng khả năng sinh lời dường như hạn chế. Lý do là nhu cầu tổng thể của VC và lập trình viên đối với dữ liệu này chưa đủ lớn, và ý chí chi trả của họ cũng không mạnh — vì dù một số dịch vụ không miễn phí, thì luôn có công ty khác cung cấp dịch vụ tương tự miễn phí.
Chúng tôi cũng xem qua một số công ty kiểu kho dữ liệu đám mây. Chúng tôi còn cùng Tencent dẫn vốn cho Chainbase. Họ giống như một nền tảng dữ liệu, cung cấp dữ liệu an ninh, giao dịch, NFT, DeFi, game, xã hội và cả dữ liệu tổng hợp. Các lập trình viên có thể kết hợp các dữ liệu này trên nền tảng để tạo API theo nhu cầu.
Trong thị trường gấu, chúng tôi nhận thấy các công ty như Chainbase, Blocksec, Footprint có rất nhiều khách hàng là startup quy mô nhỏ và trung bình. Ví dụ như Chainbase, doanh thu từ các khách hàng lớn không giảm, nhưng doanh thu từ khách hàng nhỏ và trung bình sau hai ba tháng đã tụt về 0. Điều này cho thấy các dự án này vì thiếu vốn nên không thể duy trì.
Do đó, với nhà cung cấp dữ liệu, trong thị trường gấu nếu không có lập trình viên mới tham gia, họ rất khó kiếm tiền. Điều này cũng phản ánh thực tế hiện nay trong lĩnh vực Web3: nhà cung cấp dữ liệu chủ yếu phụ thuộc vào các lập trình viên và doanh nghiệp nhỏ coi trọng dữ liệu, họ tích hợp dữ liệu bên trong rồi mới biến thành doanh thu, cân bằng giữa chi phí và thu nhập.
Cốt lõi, chúng tôi vẫn cho rằng dù là ToC hay ToB, mô hình sinh lời của các công ty dữ liệu Web3 hiện nay đều chưa rõ ràng, dẫn đến việc nhà cung cấp dữ liệu không có dòng tiền ổn định và mạnh mẽ. Đặc biệt với các startup nhỏ và trung bình, đây là điểm yếu lớn nhất của ngành dữ liệu Web3 hiện nay.
Sau đó quay lại chủ đề kết hợp AI và dữ liệu Web. Gần đây chúng tôi cũng xem và đầu tư vào một số công ty dữ liệu liên quan AI. Tôi thấy các công ty dữ liệu AI thực tế cũng gặp vấn đề tương tự: bán dữ liệu. Bạn cần cân bằng giữa chi phí của khách hàng và hiệu quả họ nhận được. Xét về tổng thể, tôi khá lạc quan về triển vọng sinh lời của các công ty dữ liệu AI, nhưng chủ yếu giới hạn ở thị trường nước ngoài.
Nếu chỉ nhắm vào thị trường trong nước, tôi lo ngại kết quả cuối cùng có thể giống như đầu tư vào các công ty SaaS Web2 — có thể có doanh thu, quy mô kinh doanh không lớn, ý chí chi trả của khách hàng cũng không mạnh. Bạn có thể phải cung cấp dịch vụ tùy chỉnh, khiến biên lợi nhuận không cao. Vì vậy tôi khá bi quan khi làm việc này ở trong nước, nhưng lạc quan khi làm ở nước ngoài.
Theo bạn, AI có thể mang lại giá trị gì cho hạ tầng dữ liệu Web3 và các công ty dữ liệu Web3? Hiện tại các dự án dùng AI hỗ trợ dữ liệu Web3 hiệu quả ra sao? Về mô hình kinh doanh có thể có đột phá nào không?
SevenX Ventures: Theo tôi, lợi ích lớn nhất của AI đối với dữ liệu Web3 là ở hiệu suất. Ví dụ như Dune đã ra mắt công cụ mô hình AI để phát hiện lỗi mã và lập chỉ mục thông tin, người dùng có thể dùng ngôn ngữ tự nhiên để truy vấn dữ liệu, hệ thống sẽ tự sinh mã tương ứng, đồng thời tối ưu hóa mã — đây là một bước tiến về hiệu suất.
Ngoài ra còn có các dự án dùng AI để cảnh báo an ninh — tức là sau khi huấn luyện, AI có thể nhanh chóng nhận diện các vấn đề an ninh, giống như một robot AI. Ví dụ trong thuật toán AI có một thuật toán gọi là phát hiện bất thường (anomaly detection), hiệu quả tốt hơn so với việc chỉ dùng phương pháp thống kê toán học thuần túy để xem phân bố dữ liệu và phát hiện điểm ngoại lai. Vì vậy AI này có thể giám sát an ninh hiệu quả hơn.
Tôi cũng thấy một số dự án dùng các thuật toán AI, ví dụ mô hình ngôn ngữ lớn để truy xuất dữ liệu tin tức toàn bộ Web3 (không chỉ dữ liệu on-chain), tổng hợp thông tin và phân tích tâm lý dư luận, hình thành một Agent AI. Ví dụ người dùng có thể trực tiếp hỏi trong ô chat: "Tâm lý dư luận về một token này trong 30 ngày hoặc 90 ngày gần đây ra sao?", người dùng thiên về bullish hay bearish, hệ thống sẽ cho điểm thể hiện mức độ nhiệt; nó còn có đường cong, qua đó có thể nhận định token này đang ở đỉnh điểm thảo luận, đang đi xuống từ đỉnh hay đang đi lên. Những thông tin này có thể hỗ trợ người dùng đầu tư, tôi thấy đây là một ứng dụng khá thú vị.
Tuy nhiên cũng có một số dự án tuyên bố dữ liệu của họ là nguồn cho AI, thực chất là đang "dựa hơi" khái niệm AI, tôi thấy điều này hơi gượng ép, vì bất kỳ dữ liệu on-chain nào cũng có thể là nguồn dữ liệu cho AI, vì nó công khai, nên có phần "dựa hơi xu hướng".
Matrix Partners - Tử Hy: Mô hình kinh doanh hiện đang là vấn đề lớn trong lĩnh vực dữ liệu, rất khó tìm ra giải pháp. Có thể ở phía ToC, áp dụng một số khái niệm Web3 như token hay phân quyền, có thể giúp dữ liệu AI thử nghiệm các mô hình kinh doanh khác biệt. Nhưng nếu chỉ là công nghệ AI hỗ trợ dữ liệu, hiện tại chưa có nhiều điểm nổi bật.
AI có thể hỗ trợ trong xử lý và làm sạch dữ liệu, nhưng chủ yếu là hỗ trợ nội bộ — ví dụ nâng cao chức năng hoặc trải nghiệm người dùng trong quá trình phát triển sản phẩm. Nhưng về góc độ thương mại, chưa có nhiều thay đổi.
Bot AI thực sự có thể gia tăng chút cạnh tranh, hỗ trợ người dùng, nhưng hiện tại đây chưa phải điểm mạnh lớn, sức cạnh tranh cốt lõi vẫn phụ thuộc vào chất lượng nguồn dữ liệu. Nếu nguồn dữ liệu đầy đủ, tôi có thể lấy được thông tin cần thiết. Vấn đề là, nếu muốn thương mại hóa dữ liệu, thì sản phẩm kết hợp ra phải có thể biến thành doanh thu, tôi mới sẵn sàng trả tiền. Hiện tại thị trường không tốt, startup không biết cách biến dữ liệu thành tiền, cũng không có đủ startup mới tham gia.
Tôi thấy điều thú vị hiện nay lại là một số công ty Web2 đang sử dụng công nghệ Web3. Ví dụ một công ty tạo dữ liệu tổng hợp (synthetic data), họ dùng mô hình lớn để sinh dữ liệu tổng hợp, dữ liệu này chủ yếu dùng cho kiểm thử phần mềm, phân tích dữ liệu và huấn luyện mô hình AI lớn. Khi xử lý dữ liệu, họ gặp nhiều vấn đề riêng tư, nên đã dùng blockchain Oasis để hiệu quả tránh được các rủi ro về riêng tư dữ liệu. Sau này họ còn muốn xây sàn giao dịch dữ liệu, đóng gói dữ liệu tổng hợp thành NFT để mua bán, giải quyết bài toán sở hữu và riêng tư. Tôi cho rằng đây là một hướng đi rất hay, dùng công nghệ Web3 để hỗ trợ giải quyết vấn đề Web2, không nhất thiết giới hạn ở công ty Web3. Tuy nhiên, hiện tại thị trường dữ liệu tổng hợp chưa đủ lớn, đầu tư sớm vào công ty như vậy có rủi ro. Nếu thị trường đầu ra không phát triển, hoặc đối thủ quá nhiều, tình thế sẽ rất khó xử.
Trong lĩnh vực AI + dữ liệu Web3, có từng đầu tư vào dự án nào tốt không, thuộc hướng nào, yếu tố then chốt để quyết định đầu tư là gì? Bạn cho rằng sức cạnh tranh cốt lõi của các dự án này là gì? AI có làm tăng sức cạnh tranh này không?
Hashkey Capital - Harper: Chúng tôi đầu tư vào các dự án dữ liệu khá sớm, lúc đó hầu như chưa nhấn mạnh nhiều vào AI — ví dụ như Space and Time, 0xScope, Mind Network, Zettablock... Yếu tố then chốt khi đầu tư là định vị và chất lượng dữ liệu của họ. Hiện tại các dự án này đều có kế hoạch tích hợp AI, chủ yếu bắt đầu từ chat agent. Ví dụ Space and Time hợp tác với ChainML ra mắt hạ tầng tạo AI agent, trong đó có Defi Agent được dùng cho chính Space and Time — cũng là một cách kết hợp AI.
SevenX Ventures - Dư Hành: Nếu một dự án kết hợp AI hiệu quả, tôi có thể quan tâm hơn. Một trong những yếu tố then chốt để tôi quyết định đầu tư là dự án có rào cản thị trường hay không. Tôi thấy nhiều dự án tuyên bố kết hợp AI để nâng cao hiệu suất, ví dụ chức năng truy vấn dữ liệu nhanh. Một số dự án có thể dùng ngôn ngữ tự nhiên để nhanh chóng lấy dữ liệu NFT on-chain, như truy vấn "10 NFT giao dịch sôi động nhất gần đây". Những dự án này có thể có lợi thế tiên phong, nhưng rào cản thị trường có thể không vững chắc.
Rào cản thực sự nằm ở ứng dụng AI và cách kỹ sư áp dụng AI vào từng trường hợp cụ thể. Nếu kỹ sư có thể tinh chỉnh mô hình (fine-tune) thành thạo, thường đạt hiệu quả tốt. Với các dự án nâng cao hiệu suất, rào cản thị trường chủ yếu nằm ở nguồn dữ liệu — không chỉ dữ liệu on-chain, mà còn cách đội ngũ dự án xử lý và phân tích dữ liệu. Ví dụ như các dự án kể trên có thể dùng thuật toán AI để nhanh chóng truy xuất dữ liệu quan trọng. Tuy nhiên, hiệu quả fine-tune mô hình của kỹ sư là có giới hạn, lợi thế bền vững thực sự nằm ở chất lượng nguồn dữ liệu và khả năng tối ưu liên tục. Đây cũng là lý do một số công ty phân tích dữ liệu vượt trội trên thị trường — họ không chỉ cung cấp nguồn dữ liệu, mà còn có năng lực xử lý và phân tích dữ liệu, điểm khác biệt thường nằm ở năng lực kỹ thuật và nhân tài của đội ngũ. Những yếu tố này ảnh hưởng trực tiếp đến hiệu quả cuối cùng khi kết hợp AI.
Ngoài ra, tôi cũng quan tâm đến các dự án công nghệ Web3 giúp AI tốt hơn, vì thị trường AI rất lớn. Nếu công nghệ Web3 có thể tăng cường năng lực AI, thì phạm vi ứng dụng sẽ rất rộng. Đó cũng là lý do các dự án ZKML được ưa chuộng. Tuy nhiên, tôi nhận thấy các dự án Web3 thường dễ bị thổi phồng hoặc hạ thấp giá trị. Như ZKML, dù được chú ý nhiều nhưng lợi nhuận đầu tư không nhanh như mong đợi, cơ chế thoái vốn cũng không rõ ràng, vì việc phát hành token rất khó. Do đó, dù các dự án này sáng tạo và tiềm năng, nhưng liệu có đáng đầu tư ngay bây giờ và mang lại bao nhiêu lợi nhuận, là điều nhà đầu tư cần cân nhắc kỹ.
Matrix Partners - Tử Hy: Chúng tôi đã đầu tư vào một công ty kết hợp AI và Web3, là một công ty gắn nhãn dữ liệu tên Questlab. Họ dùng công nghệ blockchain để cung cấp dịch vụ gắn nhãn dữ liệu theo hình thức cộng tác (crowdsourcing). Ngành gắn nhãn dữ liệu truyền thống thường là vận hành trực tiếp hoặc thuê ngoài, rất khó phủ toàn bộ lĩnh vực kiến thức.
Về cơ bản, gắn nhãn dữ liệu truyền thống chia làm ba loại: vận hành trực tiếp, thuê ngoài và cộng tác. Nhưng thực tế số người làm cộng tác rất ít. Khi chọn dịch vụ gắn nhãn, các công ty cần cân nhắc: giá có rẻ không, chất lượng nhãn có cao không, hiệu suất ra sao, và có phủ được lĩnh vực họ cần không. Nếu chỉ gắn nhãn cho mô hình tổng quát như ngôn ngữ hay hình ảnh, thì rất đơn giản — chỉ cần nhận diện chữ tiếng Anh hoặc hình ảnh. Khó hơn một chút như phân biệt mèo, chó, mặt trăng, xe đẩy em bé... cũng không quá khó. Nhưng nếu cần gắn nhãn chuyên sâu hơn — ví dụ cộng đồng robot giọng nói — thì phức tạp hơn nhiều. Họ có thể cần gắn nhãn nhiều phương ngữ và ngôn ngữ, bao gồm tiếng Trung phương ngữ, tiếng Anh phương ngữ, và nhiều ngôn ngữ vùng miền nhỏ — rất ít studio truyền thống muốn làm việc này.
Một ví dụ phức tạp hơn là công ty luật kết hợp AI, cần gắn nhãn lượng lớn kiến thức pháp lý để huấn luyện mô hình — tìm người vừa am hiểu luật vừa có thể gắn nhãn chuyên môn rất khó, cần hiểu luật các nước, lại phải nắm vững các lĩnh vực pháp lý chuyên sâu như luật hợp đồng, luật thuê nhà, dân sự, hình sự... Trên thị trường gần như không có công ty gắn nhãn dữ liệu nào cung cấp dịch vụ chuyên môn như vậy. Luật là chuyên môn, tài chính, sinh học, y tế, giáo dục cũng vậy. Do đó, công việc gắn nhãn trong các lĩnh vực này thường chỉ có thể do đội ngũ nội bộ thực hiện, dùng phương pháp cộng tác để giải quyết bài toán phủ kiến thức chuyên môn.
Chúng tôi cho rằng, việc dùng blockchain để thực hiện cộng tác là một hướng đi rất tốt, giống như YGG đã làm trong lĩnh vực GameFi. Đây là một hướng có tiềm năng.
Ngoài ra, chúng tôi thấy trong cộng đồng mô hình mã nguồn mở cũng có những cơ hội tốt. Ví dụ một dự án do Polychain đầu tư, giống như một Hugging Face phiên bản Web3, nhằm giải quyết bài toán kinh tế cho người sáng tạo nội dung mô hình.
Các hình thức kết hợp AI và Web3 khác, tôi thấy nếu hướng ToC có thể kết hợp玩法 token, tăng độ gắn kết cộng đồng, lượng người dùng hàng ngày và cảm xúc, thì chúng tôi thấy điều này khả thi. Cũng thuận tiện cho nhà đầu tư thoái vốn, nhưng quy mô thị trường thì chưa chắc chắn. Đó là một số suy nghĩ của tôi về AI và Web3. Tôi cho rằng nếu chỉ làm nghiệp vụ thuần ToB, thì không cần dùng Web3, cứ làm theo cách Web2 là tốt rồi.
Qiming Venture Partners - Đường Nghệ: Hiện tại chúng tôi đầu tư vào một số dự án dữ liệu đang dùng dữ liệu on-chain để làm việc trong lĩnh vực an ninh. Tôi cho rằng một số công việc mô hình cơ bản của AI như nhận diện mẫu hoặc phát hiện đặc trưng đã được áp dụng, và hiệu quả tạm được. Tuy nhiên, các công việc cao cấp hơn như đưa lượng lớn dữ liệu hoạt động vào mô hình và nhận diện nhiều loại thông tin, hiện vẫn đang trong giai đoạn thử nghiệm, hiệu quả cần thêm kiểm chứng. Ngoài lĩnh vực an ninh, nhiều lĩnh vực khác cũng ở tình trạng tương tự.
Một ví dụ gần đây là chúng tôi đầu tư vào NFTGo, dùng phân tích dữ liệu lớn để định giá NFT, có độ chính xác nhất định, và có kế hoạch dùng cho Oracle giá. Dù hệ thống này nghe có vẻ thú vị, nhưng trong sản phẩm và mức độ chấp nhận của người dùng vẫn cần kiểm chứng. Bởi dù hiện tại có thể đạt độ chính xác 85-90 điểm, người dùng có thể yêu cầu cao hơn như 95-98 điểm, nên cần thêm kiểm chứng. Do đó, dù một số dự án đang áp dụng các khả năng AI đơn giản như phân tích dữ liệu, nhận diện mẫu vào sản phẩm, nhưng chưa chắc đã trở thành yếu tố then chốt.
Về ý chí đầu tư, cá nhân tôi sẽ không thiên về đầu tư chỉ vì dự án có chút "màu mè" AI, vì tôi cho rằng hiệu quả thực tế và việc dự án có thực hiện được mục tiêu, mang lại lợi ích mới quan trọng. Nếu một dự án chỉ nổi bật ở tên gọi hay marketing, dùng như một thủ thuật quảng bá để thu hút sự chú ý, tôi có thể hiểu. Nhưng trong quyết định đầu tư, tôi cho rằng hiệu quả thực tế mới là điều quan trọng hơn cả.
Như một số dự án làm ZKML,赛道 này dường như rất được chú ý, nhưng đồng thời cũng có vấn đề lớn: nó dùng cho trường hợp nào? Tôi thấy hiện tại tính bất định rất cao, phần lớn vẫn là những câu chuyện lớn.
Xét về toàn bộ ngành, trong lĩnh vực AI + dữ liệu Web3 có những cơ hội tiềm năng hay định hướng phát triển nào? Trong tương lai, AI có thể hoàn toàn nâng cấp sản phẩm dữ liệu, đưa ra khái niệm mới không? Có làm tăng ý chí chi trả của người dùng không?
Hashkey Capital - Harper: Chắc chắn có cơ hội tiềm năng. Về định hướng phát triển, thực tế vẫn chậm hơn so với AI ở Web2, nơi sáng tạo rõ ràng mạnh hơn. AI ở Web3 có lẽ lớn mạnh sẽ là bản sao của AI Web2.
Matrix Partners - Tử Hy: Tôi thấy chiếc máy ảnh Miaoya gần đây khiến mọi người nhận ra rằng thực ra người dùng vẫn có ý chí chi trả cho sản phẩm AI, không giống như sản phẩm SaaS truyền thống hay game, nơi người dùng kỳ vọng miễn phí mới dùng. Ý chí chi trả cho AI thực ra khá mạnh.
Về tương lai, tôi có thể chia sẻ một ý tưởng. Trong quy trình gắn nhãn dữ liệu, có một bước then chốt gọi là gắn nhãn sơ bộ (pre-labeling), chính là huấn luyện một mô hình để mô hình thực hiện gắn nhãn ban đầu. Bước này rất có giá trị, tiết kiệm nhiều chi phí nhân lực. Chúng ta đưa dữ liệu thô vào mô hình đã huấn luyện trước để gắn nhãn sơ bộ, sau đó xử lý dữ liệu bán tự động, cuối cùng mới gắn nhãn chính xác bằng tay. Gắn nhãn sơ bộ có thể nâng cao hiệu suất rõ rệt — việc trước kia cần 100 người, nay chỉ cần 50-70 người.
Ngoài ra, gắn nhãn sơ bộ còn liên quan đến sự phối hợp giữa AI và con người — qua phản hồi của bạn, khả năng gắn nhãn sơ bộ của mô hình có thể không ngừng cải thiện, từ đó giảm nhu cầu nhân sự gắn nhãn. Khi sự phối hợp giữa AI và con người càng tốt, đội ngũ 100 người ban đầu có thể chỉ cần 30 người. Tuy nhiên, quá trình này có giới hạn — dù phối hợp AI tốt đến đâu, vẫn cần một số lượng nhân công nhất định để thực hiện gắn nhãn và kiểm tra cuối cùng.
Ở các lĩnh vực khác, vì tôi không phải nhà khoa học dữ liệu, chưa từng tự tay làm sạch dữ liệu hay dùng SQL truy vấn, nên tôi không rõ AI có thể hỗ trợ được bao nhiêu.
Qiming Venture Partners - Đường Nghệ: Tôi nghĩ về dài hạn, Web3 và AI nên có một số điểm giao thoa. Ví dụ từ góc độ ý thức hệ, hệ giá trị của Web3 có thể kết hợp với AI, rất phù hợp làm hệ tài khoản hoặc hệ chuyển đổi giá trị cho bot. Hãy tưởng tượng, một robot sở hữu tài khoản riêng, có thể kiếm tiền nhờ trí tuệ của mình, và tự trả phí duy trì năng lực tính toán底层. Những khái niệm này hơi khoa học viễn tưởng, ứng dụng thực tế còn rất dài.
Hướng thứ hai có thể là xác minh đầu ra của mô hình AI có dựa trên loại mô hình, loại dữ liệu cụ thể nào không, và có đáng tin cậy hay không. Những lĩnh vực này có thể có ứng dụng trong mô hình AI đáng tin cậy. Về mặt kỹ thuật thì rất thú vị, nhưng chưa chắc đã có nhu cầu thị trường đủ lớn.
Một khía cạnh khác là sự xuất hiện của AI khiến nội dung dữ liệu sinh ra tràn lan và rẻ tiền. Với các tác phẩm số, rất khó xác định chất lượng và tác giả. Trong lĩnh vực này, xác lập quyền sở hữu nội dung dữ liệu có thể cần một hệ thống hoàn toàn mới, bao gồm vai trò của tác giả và tác nhân thông minh (agent). Nhưng tổng thể, những vấn đề này vẫn chưa được giải quyết, và các nội dung mang tính câu chuyện có thể cần thêm thời gian để phát triển. Ngắn hạn, chúng ta nên tiếp tục tập trung vào chất lượng dữ liệu nền tảng, và kỳ vọng mô hình sẽ mạnh hơn.
Ngoài ra về thương mại hóa, thực sự rất khó thương mại hóa sản phẩm dữ liệu. Nhưng tôi cho rằng về góc độ kinh doanh, AI có thể không phải là giải pháp ngắn hạn cho bài toán thương mại hóa dữ liệu. Thương mại hóa cần nhiều nỗ lực sản phẩm hóa hơn, chứ không chỉ là năng lực dữ liệu hóa. Do đó, các dự án này có thể cần phát triển thêm sản phẩm khác để thực hiện thương mại hóa.
Chào mừng tham gia cộng đồng chính thức TechFlow
Nhóm Telegram:https://t.me/TechFlowDaily
Tài khoản Twitter chính thức:https://x.com/TechFlowPost
Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News











