
DataFi: Dịch vụ dữ liệu phi tập trung sẽ cách mạng hóa nền kinh tế dữ liệu như thế nào?
Tuyển chọn TechFlowTuyển chọn TechFlow

DataFi: Dịch vụ dữ liệu phi tập trung sẽ cách mạng hóa nền kinh tế dữ liệu như thế nào?
Trên thế giới có lượng dữ liệu khổng lồ và đang tăng trưởng với tốc độ đáng kinh ngạc.
Tác giả: Risk Taker88
Biên dịch: TechFlow
Trên thế giới có một lượng dữ liệu khổng lồ và nó đang tăng trưởng với tốc độ đáng kinh ngạc. Công ty thông tin thị trường toàn cầu IDC ước tính rằng đến năm 2025, con số này sẽ tăng từ 33 ZB lên 175 ZB.
Mặc dù khối lượng dữ liệu lớn như vậy, nhưng chúng chưa được khai thác hiệu quả giữa các công ty, ngành công nghiệp và nền kinh tế. Vấn đề chính nằm ở các "hòn đảo dữ liệu". "Hòn đảo dữ liệu" là thuật ngữ chỉ hiện tượng dữ liệu do một bộ phận hoặc đơn vị thu thập không thể chia sẻ được với các bộ phận khác trong cùng tổ chức. Ở cấp độ cao hơn cũng tương tự — dữ liệu mà một công ty thu thập thường không thể dùng chung cho các công ty khác.
Kinh tế dữ liệu sẽ thay đổi tất cả điều này.
Kinh tế dữ liệu là hệ sinh thái kỹ thuật số toàn cầu, nơi các nhà sản xuất và người tiêu dùng thu thập, tổ chức và chia sẻ dữ liệu để tạo ra các hiểu biết và biến chúng thành nguồn thu nhập. Quan trọng hơn, họ cũng có thể kiếm lợi nhuận từ dữ liệu đó. Trong nền kinh tế này, dữ liệu thường rất đa dạng và đến từ nhiều nguồn khác nhau. Các công cụ tìm kiếm, nền tảng mạng xã hội, nhà cung cấp dữ liệu trực tuyến, các công ty sử dụng thiết bị kết nối Internet vạn vật (IoT) — bất kỳ ai cũng có thể tham gia.
Việc tham gia vào nền kinh tế dữ liệu mang lại nhiều lợi ích. Bằng cách trao đổi dữ liệu của mình với các bên tham gia khác, các công ty có thể phát triển các dòng kinh doanh mới. Ví dụ, nhà sản xuất thiết bị y tế sở hữu lượng lớn thông tin về sức khỏe người dùng như nhịp tim hay mức insulin. Ngoài doanh thu từ bán thiết bị y tế, họ còn có thể hợp tác với các cơ sở y tế bằng cách cung cấp dữ liệu theo dõi bệnh nhân một cách đạo đức và an toàn. Tất cả các bên tham gia đều hưởng lợi từ việc trao đổi dữ liệu này, đồng thời nhà sản xuất thiết bị y tế cũng tạo ra một nguồn thu mới.
Streamr
Theo dự báo, gần 30% dữ liệu toàn cầu sẽ được tạo ra theo thời gian thực, trong đó 95% đến từ các thiết bị IoT. Nếu điều này trở thành sự thật, ta có thể nói rằng Streamr đang xây dựng tương lai. Streamr là một nền tảng phi tập trung, nơi người dùng có thể trao đổi và thương mại hóa các luồng dữ liệu thời gian thực, bao gồm cả dữ liệu do thiết bị IoT tạo ra. Cốt lõi của Streamr là mạng lưới Streamr, có nhiệm vụ truyền tải dữ liệu thời gian thực từ người sản xuất đến người tiêu dùng.
Tất cả dữ liệu trên mạng Streamr đều tồn tại dưới dạng luồng dữ liệu (data stream). Luồng dữ liệu là chuỗi các điểm dữ liệu, có thể thuộc bất kỳ loại nào và đến từ bất kỳ nguồn nào. Các nguồn bao gồm cảm biến trong nhà thông minh, nhà cung cấp dữ liệu thương mại hoặc hệ thống cơ sở dữ liệu. Để minh họa rõ hơn về luồng dữ liệu, hãy xem ví dụ dưới đây.

Các con số này đến từ một động cơ hiệu suất cao, khi nhiệt độ tăng lên theo vòng tua máy (RPM). Rõ ràng, dữ liệu này rất hữu ích đối với các kỹ sư cơ khí, những người giờ đây có thể sử dụng dữ liệu thực tế để tái thiết kế động cơ của mình.
Trong hệ sinh thái Streamr, người dùng thu thập luồng dữ liệu và đóng gói chúng thành liên minh dữ liệu (data union). Với sự đồng thuận, dữ liệu thời gian thực từ nhiều người dùng khác nhau có thể được nhóm lại thành một liên minh dữ liệu. Liên minh dữ liệu là sản phẩm được bày bán trên thị trường Streamr. Đây là cách người dùng thương mại hóa dữ liệu thời gian thực của mình. Khi người mua mua (hoặc theo thuật ngữ của Streamr là “đăng ký”) một liên minh dữ liệu, các token DATA sẽ được phân bổ cho tất cả các nhà sản xuất luồng dữ liệu. Không phải mọi liên minh dữ liệu đều giống nhau. Chúng có thể khác biệt về mô hình thành viên, mục đích sử dụng, cấu trúc doanh thu hoặc các đặc điểm khác.
Tôi tin rằng nền tảng Streamr cùng các liên minh dữ liệu sẽ đóng vai trò quan trọng trong nền kinh tế dữ liệu. Đây là một sản phẩm phi tập trung, ngang hàng, không cần được cấp phép, đồng thời cho phép các nhà sản xuất dữ liệu cá nhân thương mại hóa dữ liệu thời gian thực của họ.
Ocean Protocol
Trong lĩnh vực DataFi, một trong những dự án tiên phong là Ocean Protocol. Có thể định nghĩa DataFi là một nhánh của tài chính phi tập trung (DeFi), nơi dữ liệu và các dịch vụ dữ liệu được coi là một loại tài sản mới nổi. Ocean Protocol dẫn đầu lĩnh vực này — một giao thức chia sẻ dữ liệu phi tập trung cho phép các nhà sản xuất dữ liệu bán trực tiếp sản phẩm của họ cho người tiêu dùng.

Giao thức này cho phép các nhà cung cấp dữ liệu thương mại hóa dữ liệu của họ một cách an toàn mà không cần chuyển toàn bộ quyền sở hữu cho người mua. Người tiêu dùng dữ liệu — chẳng hạn như các nhà hoạch định chính sách, kỹ sư trí tuệ nhân tạo hoặc học máy — sẽ được hưởng lợi vì họ có thể truy cập vào các bộ dữ liệu riêng tư vốn trước đây khó hoặc không thể tiếp cận.
Một trong những khái niệm quan trọng nhất trong Ocean Protocol là token dữ liệu (datatokens), cho phép truy cập vào một bộ dữ liệu hoặc dịch vụ dữ liệu cụ thể. Mọi bộ dữ liệu hoặc dịch vụ dữ liệu trên giao thức đều có token dữ liệu riêng. Để truy cập vào một bộ dữ liệu, bạn cần gửi 1.0 token dữ liệu cho nhà sản xuất. Bạn thậm chí có thể chuyển quyền truy cập của mình cho người khác bằng cách gửi 1.0 token dữ liệu đó cho họ. Lưu ý rằng bạn không mua dữ liệu gốc, mà chỉ mua quyền truy cập vào dữ liệu đó.
Tính toán tại nơi lưu trữ dữ liệu (Compute-to-Data - CtD) là một giải pháp kỹ thuật thông minh, cho phép doanh nghiệp hoặc cá nhân chia sẻ dữ liệu trong khi vẫn bảo vệ quyền riêng tư. Giả sử bạn có một bộ dữ liệu muốn "cho thuê", nhưng lo ngại về vấn đề bảo mật. Một nhà khoa học dữ liệu muốn sử dụng dữ liệu của bạn. CtD chính là công cụ giải quyết vấn đề này. Bất kỳ người tiêu dùng dữ liệu nào cũng có thể chạy mô hình của họ trên dữ liệu của bạn, trong khi dữ liệu không bao giờ rời khỏi vị trí gốc (có thể là phần cứng của bạn, file Google Sheets hoặc bất cứ đâu). Hãy coi CtD như một lớp bảo vệ giữa chủ sở hữu dữ liệu và người tiêu dùng dữ liệu.

Cơ chế hoạt động là khi một thuật toán được chạy trên dữ liệu, chỉ kết quả được gửi tới người tiêu dùng, chứ không phải bản thân bộ dữ liệu. Điều này cho phép chủ sở hữu dữ liệu thương mại hóa dữ liệu của họ mà vẫn đảm bảo quyền riêng tư. Bạn có thể bán dữ liệu trực tiếp cho người tiêu dùng hoặc trên thị trường. Người tiêu dùng dữ liệu sẽ có thêm dữ liệu để huấn luyện mô hình. Một lợi thế khác là họ không cần cơ sở hạ tầng tính toán, vì mọi xử lý đều diễn ra trên phần cứng của chủ sở hữu dữ liệu.
Trong Ocean Protocol, không chỉ dữ liệu mà cả các thuật toán cũng được coi là tài sản. Các nhà nghiên cứu có thể thương mại hóa thuật toán của mình. Tương tự như các tài sản dữ liệu khác, người cung cấp có thể bán chính thuật toán hoặc chỉ bán quyền truy cập vào nó. Nhà phát triển thuật toán có thể chọn chỉ bán quyền truy cập, nghĩa là thuật toán là công khai. Nếu chỉ bán dịch vụ tính toán chứ không bán thuật toán, thì thuật toán đó là riêng tư.
Chainlink
Cuối cùng, hãy cùng xem xét một dự án lâu đời — Chainlink.
Nhiều ứng dụng DeFi cần dữ liệu từ bên ngoài. Ví dụ, thị trường cá cược trên chuỗi cần tỷ lệ cược thời gian thực từ nhiều nhà cái; hoặc một ứng dụng giao dịch phi tập trung cho phép bạn giao dịch các chứng khoán liên quan đến giá tương lai ETH, cần lấy được giá ETH từ các sàn giao dịch bên ngoài như Chicago Mercantile Exchange. Do đó, trong hầu hết các trường hợp, cần kết nối thông tin từ thế giới bên ngoài vào hợp đồng thông minh.
Đây chính là vai trò của oracles blockchain. Đây là dịch vụ bên thứ ba đưa dữ liệu thế giới thực vào các hợp đồng thông minh hỗ trợ DeFi. Oracle phi tập trung tiến xa hơn nữa bằng cách kết hợp nhiều oracle thành một hệ thống. Chúng truy vấn nhiều nguồn dữ liệu khác nhau và trả dữ liệu về blockchain. Mục đích là giảm thiểu rủi ro lỗi ở bất kỳ điểm nào.
Chainlink là một mạng lưới oracle phi tập trung hàng đầu. Kiến trúc của nó gồm ba phần: mô hình yêu cầu cơ bản, mô hình dữ liệu phi tập trung và báo cáo ngoại tuyến. Mô hình yêu cầu cơ bản đúng như tên gọi. Nếu một hợp đồng thông minh cần biết giá giao dịch SOL trên Binance, mô hình này sẽ thực hiện nhiệm vụ đó. Phần này của kiến trúc Chainlink chịu trách nhiệm truy vấn dữ liệu từ một nguồn duy nhất.
Mô hình dữ liệu phi tập trung giới thiệu khái niệm tổng hợp trên chuỗi. Dữ liệu được tổng hợp từ nhiều nút oracle độc lập, làm tăng độ tin cậy và khả năng xác thực. Chức năng cung cấp dữ liệu của Chainlink dựa trên mô hình này. Dữ liệu cung cấp đến từ các nguồn ngoài chuỗi như sự kiện thời tiết, tài chính doanh nghiệp, kết quả thể thao hoặc giá tài sản. Dữ liệu được tổng hợp trên chuỗi để người tiêu dùng luôn có thể truy xuất câu trả lời.
Cuối cùng, báo cáo ngoại tuyến khiến Chainlink thực sự khác biệt trong bối cảnh phi tập trung. Việc xử lý chủ yếu diễn ra ngoài chuỗi. Các nhà vận hành oracle (nút) giao tiếp với nhau qua mạng ngang hàng, mỗi nút định kỳ báo cáo dữ liệu của mình và xác nhận bằng chữ ký. Tất cả các báo cáo được tổng hợp thành một giao dịch — đây là câu trả lời cuối cùng của vòng đó, sau đó được truyền đi. Lợi thế chính khi tập hợp các báo cáo thành một giao dịch là phí mà các nút oracle phải trả thấp hơn rất nhiều. Việc gửi một giao dịch thay vì nhiều giao dịch giúp giảm tắc nghẽn trên blockchain của Chainlink.
Tổng kết
Không quá lời khi nói rằng dữ liệu hiện đã trở thành một loại tài sản độc lập. Dữ liệu và các dịch vụ dữ liệu ngày càng trở nên quan trọng đối với toàn bộ nền kinh tế. Kinh tế dữ liệu là một hệ sinh thái kỹ thuật số toàn cầu, nơi dữ liệu được thu thập, phân tích và chia sẻ để tạo ra giá trị từ thông tin, sẽ ảnh hưởng đến mọi lĩnh vực và ngành công nghiệp, từ chăm sóc sức khỏe đến thương mại điện tử.
Tuy nhiên, trong nền kinh tế toàn cầu, việc "lưu thông dữ liệu" đang đối mặt với một số vấn đề. Một trong những vấn đề nghiêm trọng nhất hiện nay là dữ liệu được tạo ra và lưu trữ trong các "hòn đảo dữ liệu". Việc dữ liệu không thể đến tay các bên tham gia khác làm giảm giá trị của nó. Vấn đề thứ hai là thiếu quyền sở hữu. Mặc dù dữ liệu của chúng ta đang được các gã khổng lồ như nền tảng mạng xã hội hay nhà sản xuất thiết bị y tế ghi nhận rộng rãi và ngày càng tăng tốc, nhưng chúng ta thường không phải là chủ sở hữu dữ liệu đó. Những dữ liệu này được sử dụng hoặc bán mà không có sự đồng ý của chúng ta.
DataFi sẽ thay đổi cách thức thu thập và chia sẻ dữ liệu. Ngay cả hiện tại, khi DataFi vẫn ở giai đoạn sơ khai, đã xuất hiện một số dự án nhằm phi tập trung hóa các dịch vụ dữ liệu. Bao gồm các dịch vụ như Ocean Protocol và Streamr, cho phép các nhà sản xuất dữ liệu thương mại hóa sản phẩm và dịch vụ của họ trên thị trường. Ngoài việc tạo ra dòng doanh thu cho người dùng, các nền tảng này còn hoàn trả quyền sở hữu dữ liệu về tay các nhà sản xuất. Đối với người tiêu dùng dữ liệu, lợi ích của DataFi là họ có thể truy cập vào các bộ dữ liệu vốn khó hoặc không thể tiếp cận, theo cách an toàn và đạo đức.
Chào mừng tham gia cộng đồng chính thức TechFlow
Nhóm Telegram:https://t.me/TechFlowDaily
Tài khoản Twitter chính thức:https://x.com/TechFlowPost
Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News














