
Tình hình và tương lai của lưu trữ cơ sở dữ liệu phi tập trung Web3
Tuyển chọn TechFlowTuyển chọn TechFlow

Tình hình và tương lai của lưu trữ cơ sở dữ liệu phi tập trung Web3
Tại sao cần cơ sở dữ liệu tập trung? Làm thế nào để đánh giá chất lượng của một cơ sở dữ liệu phi tập trung?
Tác giả: Maggie
Tại sao cần cơ sở dữ liệu phi tập trung?
Dữ liệu ứng dụng Web2 có hai cách lưu trữ cơ bản: hệ thống tệp (File System) và cơ sở dữ liệu (Database). Do thiếu sản phẩm cơ sở dữ liệu trong Web3, phần lớn các DApp ngoài việc lưu một lượng nhỏ dữ liệu quan trọng trên hợp đồng thông minh đắt đỏ, vẫn sử dụng cơ sở dữ liệu tập trung để lưu trữ dữ liệu cấu trúc. Cùng với sự xuất hiện của các hệ thống tệp phi tập trung như IPFS dùng để lưu trữ dữ liệu NFT cho ứng dụng Web3, hệ thống tệp phi tập trung dần được cộng đồng Web3 công nhận và chấp nhận; đồng thời công nghệ cơ sở dữ liệu phi tập trung cũng trải qua một chu kỳ đổi mới, xuất hiện nhiều sản phẩm mới.
So với cơ sở dữ liệu truyền thống tập trung, cơ sở dữ liệu phi tập trung có những lợi thế độc đáo, giúp giảm rủi ro thất bại tại một điểm duy nhất (single point of failure) cho dự án Web3 và làm cho DApp hoàn toàn phi tập trung.
Cơ sở dữ liệu phi tập trung phù hợp để lưu trữ dữ liệu nóng có tần suất truy cập cao, lưu dữ liệu phi tài chính của Dapp, ví dụ như:
-
Metadata NFT
-
Dữ liệu bỏ phiếu DAO
-
Sổ lệnh DEX
-
Dữ liệu xã hội phi tập trung, dữ liệu blog, email.
-
Dữ liệu cơ sở dữ liệu quan hệ phức tạp mà Dapp cần.

Có những loại hệ thống lưu trữ cơ sở dữ liệu phi tập trung nào?
Trong hai năm gần đây, đã xuất hiện nhiều dự án cơ sở dữ liệu phi tập trung, trong đó một số dự án sáng tạo đã thu hút sự chú ý rộng rãi.
-
Ceramic: Ceramic là một dự án bắt đầu từ năm 2019. Dữ liệu được lưu trữ và quản lý dưới dạng luồng (stream), đồng thời thêm nhật ký sự kiện định dạng vào luồng này. Nhật ký sẽ được đóng gói thành tệp và tải lên IPFS. Hỗ trợ truy vấn API GraphQL. Ceramic không có mô hình khuyến khích giống như IPFS, nhưng hỗ trợ các thao tác tạo, đọc và cập nhật dữ liệu (CRU).
-
OrbitDB: OrbitDB là dự án ra đời sớm hơn so với Ceramic, cũng sử dụng hệ thống tệp IPFS để lưu trữ tệp. Hỗ trợ lưu trữ cơ sở dữ liệu NoSQL và tệp.
-
Tableland: Dự án này khởi động vào năm 2022, hiện đang ở giai đoạn thử nghiệm công khai. Phiên bản sản xuất của Tableland sẽ ra mắt vào năm 2023. Việc lưu trữ dữ liệu yêu cầu sử dụng hợp đồng thông minh, các hợp đồng này định nghĩa câu lệnh SQL và thiết lập quyền sử dụng. Đọc dữ liệu được thực hiện bên ngoài chuỗi, không cần thanh toán. Hiện tại, hợp đồng đã được triển khai trên ETH và các L2 như OP.
-
Polybase: Dự án hiện đã hoạt động trên mạng thử nghiệm. Đây là một cơ sở dữ liệu NoSQL hỗ trợ thao tác CRUD, mỗi thao tác đều yêu cầu phí. Ngoài ra, Polybase còn hỗ trợ nhiều hệ thống tệp khác nhau để lưu trữ tệp cơ sở dữ liệu, bao gồm ổ đĩa cục bộ, IPFS, Filecoin, Polystore, thậm chí cả AWS S3. Polybase còn sử dụng kênh thanh toán để chi trả cho truy vấn dữ liệu, giảm tần suất giao dịch trên chuỗi và tránh độ trễ truy vấn do thanh toán gây ra.
-
Web3Q: Dự án khởi động vào năm 2022, mạng thử nghiệm đã ra mắt. Đề xuất một mô hình URL mới Web//access protocol để truy cập dữ liệu. Mô hình thu phí của nó rất đặc biệt: xóa dữ liệu có thể được hoàn lại phí.
-
Kwill: Kwill là hệ thống cơ sở dữ liệu SQL dựa trên Arweave, sử dụng hợp đồng thông minh để thanh toán.
-
KYVE: KYVE là một hệ thống cơ sở dữ liệu dựa trên Arweave.

Về mặt kỹ thuật
-
Cả SQL và NoSQL đều có thể dùng làm cơ sở dữ liệu. SQL trưởng thành và hiệu quả hơn, NoSQL phong phú và linh hoạt hơn. Cấu trúc dữ liệu SQL đòi hỏi mức độ nhất quán cao, khả năng truy vấn kết hợp mạnh mẽ hơn, ổn định và hiệu quả; dạng KV của NoSQL phù hợp hơn với mô hình thiết kế của Ethereum, hỗ trợ nhiều kiểu dữ liệu phong phú, linh hoạt và dễ mở rộng.
-
Về chức năng, hỗ trợ CRUD là tốt nhất, nhưng việc hỗ trợ UD sẽ làm tăng độ phức tạp cho hệ thống. Nếu hệ thống dùng lưu trữ cục bộ thì có thể không hỗ trợ truy vấn giá trị lịch sử. Nếu dùng IPFS và Arweave thì cơ sở dữ liệu phải là append-only, nếu không một dữ liệu sẽ có nhiều phiên bản, chi phí lưu trữ tăng gấp đôi.
-
Việc lựa chọn hệ thống tệp底层 có 2 phương án.
-
Lưu trữ tệp cục bộ linh hoạt hơn, có thể tùy chỉnh logic truy xuất, hiệu quả cao hơn, đồng thời tránh được tính không đáng tin cậy và độ phức tạp khi sử dụng các hệ thống tệp phi tập trung như Arweave. Ví dụ: người dùng dùng TokenA trả phí cho thợ đào cơ sở dữ liệu, thợ đào lại phải trả phí Arweave coin để lưu dữ liệu, việc chồng chéo hai lớp mạng làm tăng độ phức tạp.
-
Lưu trữ tệp cơ sở dữ liệu trong các hệ thống tệp phi tập trung như IPFS và Arweave;
-
Lưu trữ trên máy nút cục bộ hoặc đám mây S3.
-
-
Tương tự như lưu trữ phi tập trung, tốc độ truy xuất dữ liệu, mô hình khuyến khích và kinh tế học token, cùng với các thuật toán đảm bảo tính sẵn sàng dữ liệu là những yếu tố then chốt quyết định liệu một giao thức có được sử dụng rộng rãi hay không.
-
Mô hình khuyến khích và mô hình token tốt không chỉ có thể thúc đẩy sự tích cực tham gia của các nút, mà còn khuyến khích các nút hành xử đúng đắn. Ví dụ: cung cấp chức năng truy xuất hiệu quả, chứ không chỉ đơn thuần lưu trữ dữ liệu để nhận phần thưởng.
-
Thuật toán đảm bảo tính sẵn sàng dữ liệu sẽ kiểm tra định kỳ việc lưu trữ dữ liệu của các nút, yêu cầu các nút cung cấp bằng chứng về tính sẵn sàng dữ liệu, bằng chứng này kết hợp với phần thưởng để ngăn ngừa mất dữ liệu.
-
Tốc độ truy xuất dữ liệu ảnh hưởng trực tiếp đến trải nghiệm người dùng, vô cùng quan trọng đối với sự tiện lợi và mượt mà khi sử dụng Dapp.
-
Tổng kết
-
Lĩnh vực cơ sở dữ liệu phi tập trung có giá trị quan sát cao và nhu cầu cấp bách, nhưng hiện tại vẫn chưa có sản phẩm nào được chấp nhận và sử dụng rộng rãi.
-
Độ trưởng thành của công nghệ cơ sở dữ liệu phi tập trung thấp hơn so với hệ thống lưu trữ tệp phi tập trung, bởi vì công nghệ cơ sở dữ liệu phi tập trung được xây dựng dựa trên hệ thống tệp phân tán. Nhiều dự án được khởi động vào năm 2022.
-
Tốc độ truy xuất dữ liệu, mô hình khuyến khích, kinh tế học token và các thuật toán đảm bảo tính sẵn sàng dữ liệu là những yếu tố then chốt quyết định liệu một giao thức có được sử dụng rộng rãi hay không. Trọng tâm của giao thức sẽ là giảm thời gian truy xuất, điều này cực kỳ quan trọng đối với sự tiện lợi và mượt mà khi sử dụng Dapp.

Chào mừng tham gia cộng đồng chính thức TechFlow
Nhóm Telegram:https://t.me/TechFlowDaily
Tài khoản Twitter chính thức:https://x.com/TechFlowPost
Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News














