
Vana: Hãy để dữ liệu của bạn luân chuyển tự do như các token trong thời đại AI và tạo ra giá trị
Tuyển chọn TechFlowTuyển chọn TechFlow

Vana: Hãy để dữ liệu của bạn luân chuyển tự do như các token trong thời đại AI và tạo ra giá trị
Vana sẽ tái cấu trúc chuỗi giá trị dữ liệu trong thời đại AI như thế nào thông qua «DAO dữ liệu» và «bằng chứng đóng góp»?
Tác giả: Tư Duy Quái Quái
Bạn đã bao giờ tự hỏi vì sao các nền tảng mạng xã hội như Reddit, X (trước đây là Twitter) lại có thể sử dụng miễn phí? Câu trả lời thực ra nằm ngay trong những bài viết bạn đăng, những lượt thích bạn nhấn, thậm chí cả khoảng thời gian bạn dừng lại mỗi ngày.
Trước đây, những nền tảng này bán sự chú ý của bạn cho các nhà quảng cáo. Ngày nay, họ đã tìm thấy một khách hàng lớn hơn – các công ty AI. Theo báo cáo, riêng thỏa thuận cấp phép dữ liệu giữa Reddit và Google có thể mang về cho Reddit tới 60 triệu USD mỗi năm. Tuy nhiên, khoản lợi nhuận khổng lồ này lại không liên quan gì đến bạn và tôi – những người tạo ra dữ liệu.
Điều đáng lo ngại hơn nữa là, chính AI được huấn luyện từ dữ liệu của chúng ta có thể sẽ thay thế công việc của chúng ta trong tương lai. Dù AI cũng có thể tạo ra những cơ hội việc làm mới, nhưng hiệu ứng tập trung tài sản do độc quyền dữ liệu này rõ ràng đang gia tăng bất bình đẳng xã hội. Chúng ta dường như đang trượt dần vào một thế giới cyberpunk do một số ít tập đoàn công nghệ kiểm soát.
Vậy thì, với tư cách là người bình thường, chúng ta phải làm gì để bảo vệ lợi ích của mình trong thời đại AI? Sau khi AI trỗi dậy, nhiều người bắt đầu xem blockchain là tuyến phòng thủ cuối cùng của nhân loại chống lại AI. Chính từ suy nghĩ này, một số nhà đổi mới đã bắt đầu tìm kiếm giải pháp. Họ đề xuất: thứ nhất, chúng ta cần giành lại quyền sở hữu và kiểm soát dữ liệu cá nhân; thứ hai, chúng ta cần tận dụng dữ liệu đó để cùng nhau huấn luyện một mô hình AI thực sự phục vụ người bình thường.
Ý tưởng này nghe có vẻ lý tưởng, nhưng lịch sử cho thấy mỗi cuộc cách mạng công nghệ đều bắt nguồn từ một khái niệm "điên rồ". Ngày nay, một dự án chuỗi công khai mới mang tên "Vana" đang biến khái niệm này thành hiện thực. Với tư cách là mạng lưới tính thanh khoản dữ liệu phi tập trung đầu tiên, Vana cố gắng biến dữ liệu của bạn thành các token có thể lưu thông tự do, từ đó thúc đẩy việc xây dựng trí tuệ nhân tạo thực sự do người dùng kiểm soát.

Nhà sáng lập và nguồn gốc dự án Vana
Thực tế, sự ra đời của Vana bắt nguồn từ một lớp học tại Phòng thí nghiệm Truyền thông MIT (Massachusetts Institute of Technology). Tại đó, hai người trẻ tuổi ôm mộng thay đổi thế giới – Anna Kazlauskas và Art Abal – đã gặp nhau.

Trái: Anna Kazlauskas; Phải: Art Abal
Anna Kazlauskas theo học chuyên ngành Khoa học Máy tính và Kinh tế tại MIT. Sở thích về dữ liệu và tiền mã hóa của cô bắt đầu từ năm 2015, khi cô tham gia khai thác Ethereum ở giai đoạn đầu. Trải nghiệm này giúp cô nhận thức sâu sắc về tiềm năng của công nghệ phi tập trung. Sau đó, Anna thực hiện nghiên cứu dữ liệu tại các tổ chức tài chính quốc tế như Cục Dự trữ Liên bang Mỹ (Fed), Ngân hàng Trung ương châu Âu và Ngân hàng Thế giới, qua đó nhận ra rằng trong tương lai, dữ liệu sẽ trở thành một dạng tiền tệ mới.
Đồng thời, Art Abal đang theo đuổi bằng Thạc sĩ Chính sách Công tại Đại học Harvard và nghiên cứu sâu về đánh giá tác động dữ liệu tại Trung tâm Belfer về Khoa học và Các vấn đề Quốc tế. Trước khi gia nhập Vana, Art từng dẫn dắt việc phát triển phương pháp thu thập dữ liệu đổi mới tại Appen – nhà cung cấp dữ liệu huấn luyện AI, đóng góp quan trọng vào sự ra đời của nhiều công cụ AI tạo sinh hiện nay. Những hiểu biết của anh về đạo đức dữ liệu và trách nhiệm AI đã truyền cảm hứng mạnh mẽ về mặt trách nhiệm xã hội cho Vana.
Khi Anna và Art gặp nhau trong một khóa học tại Phòng thí nghiệm Truyền thông MIT, họ nhanh chóng nhận ra sự đồng điệu trong niềm đam mê về dân chủ hóa dữ liệu và quyền lợi dữ liệu người dùng. Họ nhận ra rằng, để giải quyết thực sự vấn đề sở hữu dữ liệu và công bằng AI, cần một khuôn mẫu hoàn toàn mới – một hệ thống cho phép người dùng thực sự kiểm soát dữ liệu của chính mình.
Chính tầm nhìn chung này đã thôi thúc họ cùng nhau sáng lập Vana. Mục tiêu của họ là xây dựng một nền tảng cách mạng, không chỉ giành lại chủ quyền dữ liệu cho người dùng mà còn đảm bảo người dùng có thể hưởng lợi kinh tế từ dữ liệu của chính họ. Thông qua cơ chế DLP (Data Liquidity Pool - Hồ chứa thanh khoản dữ liệu) sáng tạo và hệ thống Chứng minh đóng góp (Proof of Contribution), Vana cho phép người dùng đóng góp dữ liệu cá nhân một cách an toàn, cùng sở hữu và hưởng lợi từ các mô hình AI được huấn luyện từ dữ liệu đó, từ đó thúc đẩy sự phát triển của AI do người dùng dẫn dắt.
Tầm nhìn của Vana nhanh chóng nhận được sự công nhận từ giới chuyên môn. Tính đến nay, Vana tuyên bố đã huy động tổng cộng 25 triệu USD, bao gồm vòng gọi vốn chiến lược 5 triệu USD do Coinbase Ventures dẫn đầu, vòng Series A 18 triệu USD do Paradigm dẫn đầu, và vòng hạt giống 2 triệu USD do Polychain dẫn đầu. Các nhà đầu tư nổi bật khác bao gồm Casey Caruso, Packy McCormick, Manifold, GSR, DeFiance Capital, v.v.

Trong thế giới nơi dữ liệu là dầu mỏ của kỷ nguyên mới, sự xuất hiện của Vana rõ ràng mở ra một cơ hội quan trọng để giành lại chủ quyền dữ liệu. Vậy thì, dự án đầy tiềm năng này hoạt động như thế nào? Hãy cùng tìm hiểu sâu hơn về kiến trúc công nghệ và triết lý đổi mới của Vana.
Kiến trúc công nghệ và triết lý đổi mới của Vana
Kiến trúc công nghệ của Vana giống như một hệ sinh thái được thiết kế tỉ mỉ, nhằm mục đích dân chủ hóa dữ liệu và tối đa hóa giá trị. Các thành phần cốt lõi bao gồm Hồ chứa Thanh khoản Dữ liệu (DLP), Cơ chế Chứng minh Đóng góp, Đồng thuận Nagoya, Dữ liệu do Người dùng Tự quản lý và Lớp Ứng dụng Phi tập trung. Những yếu tố này cùng nhau tạo nên một nền tảng đổi mới vừa bảo vệ quyền riêng tư người dùng, vừa khai thác tối đa tiềm năng giá trị của dữ liệu.
1. Hồ chứa Thanh khoản Dữ liệu (DLP): Nền tảng định giá dữ liệu
Hồ chứa Thanh khoản Dữ liệu (DLP) là đơn vị cơ bản của mạng Vana, có thể hiểu như phiên bản dữ liệu của “khai thác thanh khoản”. Mỗi DLP về bản chất là một hợp đồng thông minh, chuyên dùng để tập hợp các tài sản dữ liệu cụ thể. Ví dụ, DAO dữ liệu Reddit (r/datadao) là một ví dụ DLP thành công, thu hút hơn 140.000 người dùng Reddit tham gia. Nó tập hợp các bài viết, bình luận và lịch sử bỏ phiếu của người dùng trên Reddit.

Sau khi người dùng gửi dữ liệu vào DLP, họ sẽ nhận được phần thưởng dưới dạng token riêng của DLP đó. Ví dụ, token dành riêng cho DAO dữ liệu Reddit (r/datadao) là RDAT. Những token này không chỉ đại diện cho đóng góp dữ liệu của người dùng vào hồ chứa, mà còn trao cho họ quyền quản trị DLP và quyền phân phối lợi nhuận trong tương lai. Đặc biệt, Vana cho phép mỗi DLP phát hành token riêng, tạo cơ chế thu giữ giá trị linh hoạt hơn cho các loại tài sản dữ liệu khác nhau.
Trong hệ sinh thái Vana, 16 DLP hàng đầu còn nhận thêm phần thưởng phát hành token VANA bổ sung, điều này tiếp tục kích thích sự hình thành và cạnh tranh giữa các hồ chứa dữ liệu chất lượng cao. Bằng cách này, Vana khéo léo biến những dữ liệu cá nhân rời rạc thành tài sản kỹ thuật số có tính thanh khoản, đặt nền móng cho việc định giá và lưu thông dữ liệu.
2. Chứng minh Đóng góp (Proof of Contribution): Đo lường chính xác giá trị dữ liệu
Chứng minh Đóng góp là cơ chế then chốt của Vana nhằm đảm bảo chất lượng dữ liệu. Mỗi DLP có thể tùy chỉnh hàm Chứng minh Đóng góp riêng biệt dựa trên đặc điểm của nó. Hàm này không chỉ xác minh tính xác thực và toàn vẹn của dữ liệu, mà còn đánh giá mức độ đóng góp của dữ liệu đối với hiệu suất mô hình AI.
Lấy ví dụ DAO dữ liệu ChatGPT, Chứng minh Đóng góp của nó bao gồm bốn chiều đo lường chính: tính xác thực, quyền sở hữu, chất lượng và tính độc đáo. Tính xác thực được đảm bảo bằng cách xác minh liên kết xuất dữ liệu từ OpenAI; quyền sở hữu được xác minh qua email người dùng; đánh giá chất lượng sử dụng mô hình LLM chấm điểm ngẫu nhiên các đoạn hội thoại; tính độc đáo được xác định bằng cách tính toán vector đặc trưng của dữ liệu và so sánh với dữ liệu hiện có.
Cách đánh giá đa chiều này đảm bảo chỉ những dữ liệu chất lượng cao, có giá trị mới được chấp nhận và nhận phần thưởng. Chứng minh Đóng góp không chỉ là cơ sở định giá dữ liệu mà còn là bảo đảm then chốt duy trì chất lượng dữ liệu trong toàn bộ hệ sinh thái.
3. Đồng thuận Nagoya: Bảo đảm chất lượng dữ liệu phi tập trung
Đồng thuận Nagoya là trái tim của mạng Vana, kế thừa và cải tiến Đồng thuận Yuma từ Bittensor. Ý tưởng cốt lõi của cơ chế này là nhờ một nhóm nút xác thực đánh giá tập thể chất lượng dữ liệu, sử dụng phương pháp trung bình trọng số để đưa ra điểm số cuối cùng.
Một bước đổi mới hơn nữa là các nút xác thực không chỉ đánh giá dữ liệu mà còn phải chấm điểm lẫn nhau về hành vi chấm điểm. Cơ chế "đánh giá hai tầng" này làm tăng đáng kể tính công bằng và độ chính xác của hệ thống. Ví dụ, nếu một nút xác thực chấm điểm cao cho dữ liệu rõ ràng kém chất lượng, các nút khác sẽ chấm điểm trừng phạt hành vi sai lệch đó.
Cứ sau 1800 khối (khoảng 3 giờ) là một chu kỳ, hệ thống sẽ phân bổ phần thưởng tương ứng cho các nút xác thực dựa trên điểm số tổng hợp trong giai đoạn đó. Cơ chế này không chỉ khuyến khích các nút xác thực trung thực mà còn nhanh chóng nhận diện và loại bỏ hành vi xấu, từ đó duy trì hoạt động lành mạnh của toàn bộ mạng.
4. Lưu trữ dữ liệu không qua bên thứ ba (Non-custodial): Hàng rào bảo vệ quyền riêng tư cuối cùng
Một điểm đổi mới lớn của Vana nằm ở cách quản lý dữ liệu độc đáo. Trong mạng Vana, dữ liệu gốc của người dùng chưa bao giờ thật sự "lên chuỗi", mà được người dùng tự chọn nơi lưu trữ, ví dụ như Google Drive, Dropbox, hoặc ngay cả máy chủ cá nhân chạy trên Macbook.
Khi người dùng gửi dữ liệu vào DLP, họ thực chất chỉ cung cấp URL trỏ đến dữ liệu đã mã hóa và một hash tùy chọn về tính toàn vẹn nội dung. Thông tin này được ghi nhận trong hợp đồng đăng ký dữ liệu của Vana. Khi cần truy cập dữ liệu, các bên xác thực sẽ yêu cầu khóa giải mã, sau đó tải xuống và giải mã dữ liệu để xác minh.
Cách thiết kế này khéo léo giải quyết vấn đề quyền riêng tư và quyền kiểm soát dữ liệu. Người dùng luôn giữ quyền kiểm soát hoàn toàn dữ liệu của mình, đồng thời vẫn có thể tham gia vào nền kinh tế dữ liệu. Điều này không chỉ đảm bảo an toàn dữ liệu mà còn mở ra khả năng cho những ứng dụng dữ liệu rộng rãi hơn trong tương lai.
5. Lớp Ứng dụng Phi tập trung: Hiện thực hóa giá trị dữ liệu theo nhiều cách
Tầng trên cùng của Vana là một hệ sinh thái ứng dụng mở. Tại đây, các nhà phát triển có thể tận dụng dòng dữ liệu tích lũy từ DLP để xây dựng nhiều ứng dụng đổi mới, trong khi những người đóng góp dữ liệu có thể nhận được giá trị kinh tế thực tế từ các ứng dụng đó.
Ví dụ, một nhóm phát triển có thể sử dụng dữ liệu từ DAO dữ liệu Reddit để huấn luyện một mô hình AI chuyên biệt. Những người dùng đóng góp dữ liệu không chỉ có thể sử dụng mô hình sau khi hoàn thiện mà còn nhận được lợi nhuận theo tỷ lệ đóng góp của họ. Thực tế, mô hình AI như vậy đã được phát triển, chi tiết xem tại bài viết: Phục hồi ngoạn mục, tại sao đồng cũ trên赛道 AI r/datadao hồi sinh?.
Mô hình này không chỉ khuyến khích việc đóng góp dữ liệu chất lượng cao hơn, mà còn tạo ra một hệ sinh thái phát triển AI thực sự do người dùng dẫn dắt. Người dùng chuyển từ vai trò cung cấp dữ liệu đơn thuần thành đồng sở hữu và đồng hưởng lợi từ sản phẩm AI.
Thông qua cách này, Vana đang tái cấu trúc lại格局 của nền kinh tế dữ liệu. Trong khuôn mẫu mới này, người dùng chuyển từ người cung cấp dữ liệu thụ động thành những người xây dựng hệ sinh thái tích cực tham gia và cùng hưởng lợi. Điều này không chỉ tạo ra kênh thu giá trị mới cho cá nhân mà còn thổi luồng sinh khí và động lực đổi mới mới vào toàn ngành AI.
Kiến trúc công nghệ của Vana không chỉ giải quyết các vấn đề cốt lõi hiện tại trong nền kinh tế dữ liệu như quyền sở hữu, bảo vệ quyền riêng tư và phân phối giá trị, mà còn mở đường cho các đổi mới dựa trên dữ liệu trong tương lai. Khi ngày càng nhiều DAO dữ liệu tham gia mạng và nhiều ứng dụng được xây dựng trên nền tảng, Vana có tiềm năng trở thành cơ sở hạ tầng cho thế hệ AI phi tập trung và nền kinh tế dữ liệu tiếp theo.
Mạng thử nghiệm Satori: Sân chơi thử nghiệm công khai của Vana
Cùng với việc ra mắt mạng thử nghiệm Satori vào ngày 11 tháng 6, Vana đã phác họa hình hài ban đầu của hệ sinh thái trước công chúng. Đây không chỉ là nền tảng kiểm chứng công nghệ mà còn là buổi diễn tập mô hình vận hành mạng chính thức trong tương lai. Hiện tại, hệ sinh thái Vana cung cấp ba con đường chính cho người tham gia: vận hành nút xác thực DLP, tạo DLP mới, hoặc gửi dữ liệu vào DLP hiện có để tham gia "khai thác dữ liệu".
Vận hành nút xác thực DLP
Các nút xác thực là cánh cổng bảo vệ mạng Vana, chịu trách nhiệm xác minh chất lượng dữ liệu gửi vào DLP. Việc vận hành nút xác thực không chỉ đòi hỏi năng lực kỹ thuật mà còn cần đủ tài nguyên tính toán. Theo tài liệu kỹ thuật của Vana, yêu cầu phần cứng tối thiểu cho nút xác thực là 1 nhân CPU, 8GB RAM và 10GB ổ SSD tốc độ cao.
Người dùng muốn trở thành xác thực cần chọn một DLP trước, sau đó đăng ký trở thành xác thực thông qua hợp đồng thông minh của DLP đó. Một khi được phê duyệt, xác thực có thể vận hành nút xác thực dành riêng cho DLP đó. Lưu ý rằng, một xác thực có thể vận hành nút cho nhiều DLP cùng lúc, nhưng mỗi DLP đều có yêu cầu đặt cược tối thiểu riêng biệt.
Tạo DLP mới
Đối với những người dùng có nguồn dữ liệu độc đáo hoặc ý tưởng sáng tạo, việc tạo DLP mới là lựa chọn hấp dẫn. Việc tạo DLP đòi hỏi hiểu biết sâu về kiến trúc công nghệ Vana, đặc biệt là cơ chế Chứng minh Đóng góp và Đồng thuận Nagoya.
Người sáng lập DLP mới cần thiết kế mục tiêu đóng góp dữ liệu cụ thể, phương pháp xác minh và tham số phần thưởng. Đồng thời, họ cũng phải lập trình một hàm Chứng minh Đóng góp có thể đánh giá chính xác giá trị dữ liệu. Dù quy trình này khá phức tạp, Vana cung cấp mẫu và tài liệu hỗ trợ chi tiết.
Tham gia khai thác dữ liệu
Đối với đa số người dùng, cách tham gia trực tiếp nhất là gửi dữ liệu vào DLP hiện có để tham gia "khai thác dữ liệu". Hiện tại, đã có 13 DLP được Vana đề xuất chính thức, bao phủ nhiều lĩnh vực từ dữ liệu mạng xã hội đến dữ liệu dự báo tài chính.

-
Finquarium: Tập hợp dữ liệu dự báo tài chính.
-
GPT Data DAO: Chuyên về dữ liệu chat từ ChatGPT.
-
Reddit Data DAO: Tập trung vào dữ liệu người dùng Reddit, đã khởi động chính thức.
-
Volara: Chuyên thu thập và sử dụng dữ liệu Twitter.
-
Flirtual: Thu thập dữ liệu hẹn hò.
-
ResumeDataDAO: Chuyên xuất dữ liệu LinkedIn.
-
SixGPT: Thu thập và quản lý dữ liệu chat LLM.
-
YKYR: Thu thập dữ liệu Google Analytics.
-
Sydintel: Tiết lộ góc khuất internet thông qua trí tuệ đám đông.
-
MindDAO: Thu thập dữ liệu chuỗi thời gian liên quan đến hạnh phúc người dùng.
-
Kleo: Xây dựng bộ dữ liệu lịch sử duyệt web toàn diện nhất thế giới.
-
DataPIG: Tập trung vào dữ liệu sở thích đầu tư token.
-
ScrollDAO: Thu thập và sử dụng dữ liệu Instagram.
Một số DLP trong danh sách này vẫn đang phát triển, một số đã lên sóng, nhưng tất cả đều đang ở giai đoạn tiền khai thác. Bởi vì chỉ khi mạng chính thức ra mắt, người dùng mới có thể chính thức gửi dữ liệu để khai thác. Tuy nhiên, người dùng hiện có thể khóa quyền tham gia trước bằng nhiều cách. Ví dụ, tham gia các thử thách liên quan trên Ứng dụng Telegram của Vana, hoặc đăng ký trước trên website chính thức của từng DLP.
Tổng kết
Sự xuất hiện của Vana đánh dấu một bước ngoặt trong nền kinh tế dữ liệu. Trong làn sóng AI hiện nay, dữ liệu đã trở thành "dầu mỏ" của thời đại mới, và Vana đang cố gắng tái cấu trúc mô hình khai thác, tinh chế và phân phối nguồn tài nguyên này.
Về bản chất, Vana đang xây dựng một giải pháp cho "vấn đề đồng cỏ" (tragedy of the commons) trong lĩnh vực dữ liệu. Thông qua thiết kế động lực khéo léo và đổi mới công nghệ, nó biến dữ liệu cá nhân – một nguồn tưởng chừng vô hạn nhưng khó định giá – thành tài sản kỹ thuật số có thể quản lý, định giá và lưu thông. Điều này không chỉ mở ra con đường mới để người dùng bình thường tham gia chia sẻ lợi nhuận từ AI, mà còn cung cấp một bản đồ khả thi cho sự phát triển của AI phi tập trung.
Tuy nhiên, thành công của Vana vẫn đối mặt với nhiều bất định. Về mặt kỹ thuật, nó cần cân bằng giữa tính mở và bảo mật; về kinh tế, nó cần chứng minh mô hình có thể tạo ra giá trị bền vững; về mặt xã hội, nó còn phải đối mặt với các thách thức đạo đức dữ liệu và quản lý tiềm tàng.
Xét sâu hơn, Vana đại diện cho một sự phản tư và thách thức đối với mô hình độc quyền dữ liệu và phát triển AI hiện tại. Nó đặt ra một câu hỏi quan trọng: Trong thời đại AI, chúng ta sẽ chọn tiếp tục củng cố các tập đoàn dữ liệu hiện tại, hay thử xây dựng một hệ sinh thái dữ liệu mở, công bằng và đa dạng hơn?
Dù Vana cuối cùng có thành công hay không, sự xuất hiện của nó đã mở ra một cửa sổ để chúng ta suy ngẫm lại về giá trị dữ liệu, đạo đức AI và đổi mới công nghệ. Trong tương lai, những dự án như Vana có thể trở thành cây cầu quan trọng nối liền lý tưởng Web3 với thực tế AI, chỉ ra hướng đi cho giai đoạn phát triển tiếp theo của nền kinh tế số.
Chào mừng tham gia cộng đồng chính thức TechFlow
Nhóm Telegram:https://t.me/TechFlowDaily
Tài khoản Twitter chính thức:https://x.com/TechFlowPost
Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News












