
YZi Labs tham gia đầu tư, bài viết giải thích về dự án «khai thác dữ liệu» AI Gata
Tuyển chọn TechFlowTuyển chọn TechFlow

YZi Labs tham gia đầu tư, bài viết giải thích về dự án «khai thác dữ liệu» AI Gata
GPT-to-Earn và DataAgent của Gata có thể hiện thực hóa việc "khai thác dữ liệu" mà ai cũng có thể tham gia?
Tác giả: Patti, ChainCatcher
Tháng 4 năm 2025, Gata thông báo đã hoàn tất vòng gây vốn hạt giống trị giá 4 triệu USD với sự tham gia của các nhà đầu tư như YZi Labs, IDG Blockchain, Maelstrom Fund. Vụ huy động vốn này một lần nữa thu hút sự chú ý của cộng đồng về kế hoạch airdrop của dự án và đưa nó lên danh sách các dự án nổi bật trong nhiều cộng đồng "lượm lông".
Theo thông tin chính thức, Gata – trước đây là Aggregata – là một nền tảng cơ sở hạ tầng dữ liệu AI phi tập trung, hướng tới việc tạo ra, phân phối và sử dụng dữ liệu huấn luyện chất lượng cao theo cách công bằng và hiệu quả hơn. Dự án từ giai đoạn đầu đã nhận được sự quan tâm của Binance Labs, từng được chọn vào chương trình MVB (Most Valuable Builder) và giành giải thưởng "Đổi mới xuất sắc" tại Catalyst Awards thuộc hệ sinh thái BNB Chain.
Chuỗi giá trị dữ liệu AI phi tập trung
Khác với các nền tảng dữ liệu truyền thống, Gata không xem dữ liệu chỉ đơn thuần là nguyên liệu huấn luyện mà mở rộng khái niệm thành một dạng “tài sản AI” — bao gồm các yếu tố như bộ dữ liệu, mô hình, trọng số trung gian, quy trình và môi trường vận hành. Mục tiêu cốt lõi là tái cấu trúc quá trình sản xuất, sử dụng và phân bổ giá trị dữ liệu huấn luyện AI thông qua các phương pháp phi tập trung, giúp nhiều người hơn có thể tham gia vào nền kinh tế AI một cách công bằng.
Để đạt được mục tiêu này, Gata đã xây dựng một hệ sinh thái sản phẩm tương đối toàn diện, từ cơ chế “GPT-to-Earn” dành cho người dùng, đến công cụ đại lý dữ liệu tự động “DataAgent”, rồi đến thị trường dữ liệu phi tập trung và đường ống huấn luyện mô hình, từng bước hình thành vòng khép kín: “người dùng tạo dữ liệu – nền tảng đánh giá lựa chọn – ứng dụng huấn luyện mô hình – người dùng nhận phần thưởng”.
Các mô-đun và chức năng cốt lõi của nền tảng
1. GPT-to-Earn
Sản phẩm đầu tiên được Gata ra mắt là tiện ích mở rộng Chrome mang tên GPT-to-Earn. Khi người dùng sử dụng các mô hình ngôn ngữ như ChatGPT, tiện ích sẽ tự động tải lên dữ liệu hội thoại ẩn danh để phục vụ cho việc huấn luyện sau này, và dữ liệu được tải lên sẽ nhận phần thưởng dưới dạng điểm tích lũy.
2. DataAgent
DataAgent là công cụ cốt lõi của nền tảng Gata, nhằm thay thế quy trình gắn nhãn dữ liệu truyền thống. Người dùng có thể chạy các kịch bản DataAgent nhất định để AI tự động tạo dữ liệu huấn luyện có cấu trúc và đánh giá chất lượng.
Ví dụ, DVA (Data Validation Agent) hiện tại đang được triển khai sẽ tự động chấm điểm các bộ dữ liệu ghép nối hình ảnh - văn bản, phân biệt dữ liệu hữu ích và vô ích, phục vụ cho việc huấn luyện các mô hình tiên tiến như Stable Diffusion, GPT-4o.
3. Lưu trữ dữ liệu phi tập trung và thị trường trên chuỗi
Gata được xây dựng trên mạng Greenfield của BNB Chain, tận dụng khả năng lưu trữ phi tập trung để đảm bảo quyền sở hữu dữ liệu rõ ràng và không thể thay đổi. Đồng thời, nền tảng phát triển thị trường dữ liệu trên chuỗi, cho phép người dùng niêm yết và giao dịch dữ liệu họ tạo ra, thậm chí tích hợp các công cụ tinh chỉnh nhỏ và client huấn luyện, giúp người dùng không am hiểu kỹ thuật cũng dễ dàng tham gia vào nền kinh tế dữ liệu AI.
Cách thức tham gia airdrop
Gata nhấn mạnh “dữ liệu là tài sản, tham gia là tạo giá trị”, và để khuyến khích cộng đồng, Gata đã thiết kế kế hoạch airdrop xoay quanh GPT-to-Earn và DataAgent. Người dùng có thể tham gia bằng các cách sau:
-
Cài đặt tiện ích mở rộng Chrome, cấp quyền tải lên hội thoại ChatGPT, kết nối ví EVM của bạn
-
Chạy DVA, hoàn thành nhiệm vụ thông qua tương tác với ChatGPT để nhận điểm tích lũy
-
Kết nối tài khoản mạng xã hội như Discord, X, hoàn thành nhiệm vụ, mời bạn bè để nhận điểm tích lũy;
Người dùng cần thanh toán một khoản phí gas BNB nhỏ khi tải dữ liệu lên, có thể sử dụng cầu nối chéo chính thức để chuyển BNB từ mạng chính sang mạng Greenfield.
Đào dữ liệu? Vẫn cần thời gian kiểm chứng
Trong Web3, “đào dữ liệu” đã vượt xa ý nghĩa phân tích dữ liệu truyền thống, trở thành một cơ chế mới để nắm bắt giá trị dữ liệu người dùng. Dù là việc lưu trữ hành vi xã hội của người dùng thành tài sản trên chuỗi trong các giao thức như Lens, CyberConnect, hay việc mã hóa dữ liệu thành NFT trên Ocean Protocol để người khác cấp phép sử dụng, thì “dữ liệu là tài sản” đang trở thành một khuôn mẫu mới.
Mô hình GPT-to-Earn và DataAgent của Gata cũng là sản phẩm của xu hướng này. Mặc dù Gata mong muốn xây dựng một cơ chế hoàn chỉnh để “ai cũng có thể đào dữ liệu”, nhưng để thực sự hình thành một vòng khép kín bền vững cho nền kinh tế dữ liệu vẫn còn đối mặt với nhiều thách thức.
Xét từ bố cục sản phẩm của Gata, từ cổng vào nhẹ cho người dùng đến cơ sở hạ tầng nền tảng đã sơ bộ hình thành; tuy nhiên ở những điểm then chốt như quản trị chất lượng dữ liệu, xây dựng vòng thưởng khép kín, và việc sử dụng thực tế dữ liệu, vẫn cần thêm hỗ trợ về công nghệ và hệ sinh thái.
Trong nền kinh tế AI tương lai, dữ liệu sẽ chuyển từ độc quyền của các nền tảng sang sự tham gia của toàn dân.
“Đào dữ liệu”, với tư cách là một khái niệm mới, vẫn đang ở giai đoạn kiểm chứng lý thuyết và hoàn thiện cơ chế. Việc Gata có thể trở thành một minh chứng thực tiễn cho hướng đi này hay không, vẫn là một câu hỏi dài hạn chưa có lời đáp.
Chào mừng tham gia cộng đồng chính thức TechFlow
Nhóm Telegram:https://t.me/TechFlowDaily
Tài khoản Twitter chính thức:https://x.com/TechFlowPost
Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News












