
Filecoin và Arweave: Từ lưu trữ đến tính toán, sự phục hưng của lưu trữ phi tập trung
Tuyển chọn TechFlowTuyển chọn TechFlow

Filecoin và Arweave: Từ lưu trữ đến tính toán, sự phục hưng của lưu trữ phi tập trung
Có rất nhiều giao thức lưu trữ dữ liệu phi tập trung, nhưng nổi bật nhất phải kể đến Filecoin và Arweave.
Tác giả: Leo, IOSG Ventures
Bài viết này là nội dung gốc của IOSG, chỉ dành cho mục đích trao đổi học thuật trong ngành, không cấu thành bất kỳ tham khảo đầu tư nào. Nếu cần trích dẫn, vui lòng ghi rõ nguồn. Vui lòng liên hệ đội ngũ IOSG để được cấp phép và hướng dẫn chuyển phát lại.
Tóm tắt:
Thiết kế giao thức Arweave về mặt kỹ thuật đảm bảo việc lưu trữ vĩnh viễn, phù hợp hơn với các tài sản số có giá trị cao như lưu trữ metadata NFT.
Trên nền tảng lưu trữ dữ liệu, tính toán còn quan trọng hơn. Cùng với sự ra đời của hợp đồng thông minh và khả năng lập trình, mạng lưu trữ dữ liệu phi tập trung đã bước vào giai đoạn mới "không chỉ đơn thuần là lưu trữ".
Để đạt được độ dư thừa dữ liệu, Filecoin sử dụng biện pháp khuyến khích kinh tế, trong khi Arweave dựa vào thiết kế giao thức.
FVM mang lại tài chính hóa lưu trữ cho Filecoin, thương mại hóa không gian và thời gian lưu trữ, người dùng có thể khóa chi phí trước, nhà cung cấp lưu trữ cũng có thể thu hồi vốn trước và lên kế hoạch quản lý hàng tồn kho, phần cứng, vận hành theo nhu cầu dài hạn.
Phát triển mạng máy tính chủ yếu xoay quanh ba hướng: tính toán, truyền tải và lưu trữ dữ liệu. Đến nay, sự phát triển của Web3 khiến tiến trình phát triển các giao thức lưu trữ dữ liệu phi tập trung trở nên rõ ràng.
Vào ngày 14 tháng 3 năm 2023, tại chiều cao khối 2.683.348 (Epoch), Filecoin chính thức phát hành Filecoin Virtual Machine (FVM) tương thích EVM trên mainnet, đưa hợp đồng thông minh và khả năng lập trình vào mạng Filecoin, đánh dấu bước tiến mới “không chỉ đơn thuần là lưu trữ” của các giao thức lưu trữ dữ liệu phi tập trung.
Có rất nhiều giao thức lưu trữ dữ liệu phi tập trung, nhưng nổi bật nhất phải kể đến Filecoin và Arweave. Trong bài viết này, chúng tôi sẽ lần lượt phân tích các đặc điểm mới mà FVM mang lại cho Filecoin.
Lưu trữ vĩnh viễn – Perpetual Storage
Lưu trữ vĩnh viễn có ý nghĩa và nhu cầu đặc biệt trong Web3, các tài sản số có giá trị cao như metadata NFT cần được lưu giữ vĩnh viễn.
Filecoin
Sau khi FVM ra mắt, Filecoin nhấn mạnh đặc tính lưu trữ vĩnh viễn (Permanent Storage). Theo hiểu biết của chúng tôi, Filecoin thực hiện lưu trữ lâu dài bằng phương tiện kinh tế, nhưng về bản chất thiết kế giao thức thì không có nhiều thay đổi.
Trong thiết kế hiện tại của Filecoin, các đơn đặt hàng lưu trữ được khớp lệnh ngoài chuỗi giữa nhà cung cấp và người dùng lưu trữ, sau đó ghi nhận trên chuỗi. Thông tin trong đơn bao gồm kích thước dữ liệu, thời gian lưu trữ, giá đơn hàng và tài sản thế chấp. Nếu muốn dữ liệu tiếp tục được lưu trữ sau khi hết thời hạn đơn hàng, người dùng phải tự động gửi đơn hàng cập nhật.
Tuy nhiên, sau khi FVM ra mắt, đơn hàng có thể tự động gia hạn trên chuỗi.
Lighthouse
Lighthouse là một dự án nhằm hiện thực hóa lưu trữ vĩnh viễn trên Filecoin, người dùng chỉ cần trả phí một lần, tệp tin có thể được "lưu trữ vĩnh viễn". Lighthouse sử dụng hồ trợ cấp (endowment pool) dựa trên hợp đồng thông minh để thanh toán phí lưu trữ liên tục cho tệp tin. Khi người dùng tạo đơn hàng và thanh toán, một phần tiền được chuyển cho nhà cung cấp lưu trữ, phần còn lại được chuyển vào hồ trợ cấp. Hợp đồng thông minh của hồ trợ cấp sẽ tự động gia hạn đơn hàng khi hết hạn và sử dụng tiền trong hồ để thanh toán, từ đó đạt được "lưu trữ vĩnh viễn". Tính khả thi của thiết kế này nằm ở chỗ hồ trợ cấp sẽ tăng giá trị tài sản thông qua việc staking, farming,... theo thời gian, phần tăng thêm đủ để bù đắp chi phí lưu trữ.
Thiết kế này tương tự giả định về chi phí lưu trữ trong White Paper của Arweave, tức là tỷ lệ chi phí lưu trữ sẽ liên tục giảm, khoản tiền mà người dùng trả sẽ tăng giá trị đủ để bao phủ chi phí lưu trữ vĩnh viễn.
Arweave
“Trong 50 năm qua, chi phí lưu trữ đã giảm trung bình 30,57% mỗi năm”.

White Paper Arweave: Chi phí lưu trữ 1GB dữ liệu trong 1 giờ kể từ năm 1980 (thang log)
Arweave giới thiệu thiết kế Blockweave trên cấu trúc dữ liệu blockchain phổ biến, nhằm hiện thực hóa việc dữ liệu được lưu trữ vĩnh viễn ngay từ thiết kế giao thức.
Trong Blockweave, mỗi khối trên chuỗi (trừ khối xác nhận mới nhất và khối ứng cử đang được đào) sẽ kết nối với ba khối khác: khối trước, khối sau và khối gọi lại (recall block).
Đối với một khối ở độ cao nhất định, khối gọi lại có thể là bất kỳ khối lịch sử nào trước đó trong Blockweave. Khi thợ đào tạo khối mới, việc chọn khối gọi lại được quyết định ngẫu nhiên bởi độ cao và hàm băm của khối trước.
Khối gọi lại đóng vai trò quan trọng trong cơ chế đồng thuận mà Arweave áp dụng – Bằng chứng truy cập ngắn gọn ngẫu nhiên (Succinct Proof of Random Access – SPoRA).
Trong Arweave, thợ đào không bắt buộc phải lưu trữ tất cả các khối lịch sử (tức là việc lưu trữ toàn bộ khối lịch sử không phải điều kiện bắt buộc để tham gia đào mỏ), nhưng thợ đào phải lưu trữ cục bộ khối gọi lại được chọn ngẫu nhiên mới có thể tham gia đào khối mới. Khối gọi lại về chức năng giống như kiểm tra ngẫu nhiên xem thợ đào có lưu trữ nội dung của một khối lịch sử nhất định hay không, từ đó đảm bảo dữ liệu lịch sử được lưu trữ vĩnh viễn.
Lưu trữ vĩnh viễn của Arweave được đảm bảo về mặt kỹ thuật nhờ thiết kế giao thức, so với giải pháp lưu trữ vĩnh viễn của Filecoin thì ổn định hơn, cũng là lý do chính khiến các gã khổng lồ Web2 như Meta, Instagram và ứng dụng Web3 Mirror chọn Arweave làm giải pháp lưu trữ cho NFT và nội dung của họ.
Tính toán phi tập trung – Decentralized Computation
Dữ liệu được lưu trữ rồi, điều quan trọng hơn là sử dụng. Tầm nhìn của Filecoin và Arweave không chỉ dừng lại ở “ổ đĩa mạng phi tập trung” (dù phần lớn người dùng hiện nay chỉ dùng nó như vậy), mà còn hướng tới trở thành giao thức blockchain vừa có chi phí lưu trữ thấp, vừa có khả năng xử lý tính toán tốc độ cao.
Trên nền tảng lưu trữ dữ liệu, các Dapp Web3 vẫn cần tính toán.
Filecoin
Filecoin và IPFS phân phối các bộ dữ liệu định tuyến nội dung (content-addressed) giữa các nhà cung cấp lưu trữ khắp nơi trên thế giới, nhằm tăng tính dư thừa và độ bền của dữ liệu. Việc phân phối dữ liệu phi tập trung này mang lại lợi thế về chi phí, khả dụng và độ tin cậy, nhưng vấn đề đặt ra là các phần của một bộ dữ liệu bị lưu trữ ở các nhà cung cấp cách xa nhau về mặt địa lý. Dữ liệu phân tán rộng rãi như vậy không thuận lợi cho việc thực hiện tính toán hoặc truy vấn lập chỉ mục trên dữ liệu. Tuy nhiên, việc tập trung lại dữ liệu phân tán cao để tính toán là tốn kém, lãng phí, hiệu suất thấp và đi ngược lại nguyên tắc lưu trữ phi tập trung.
FVM tương thích EVM trên Filecoin đề xuất giải pháp kết hợp tính toán biên (edge computation) với việc phối hợp thực hiện tính toán trên chuỗi.
Hợp đồng trong FVM có thể đại diện môi giới tài nguyên tính toán, khuyến khích thực hiện tính toán, phân bổ khối lượng công việc giữa các nhà cung cấp lưu trữ sẵn có, và chứng minh tính hợp lệ của kết quả tính toán để nhận thưởng.
Nhà cung cấp lưu trữ có thể đăng ký tham gia mạng lưới tính toán phi tập trung thông qua hợp đồng FVM. Khách hàng tính toán sẽ đăng nhiệm vụ tính toán lên hợp đồng. Cơ chế được định nghĩa trong hợp đồng sẽ phân bổ nhiệm vụ cho các nhà cung cấp đã đăng ký tham gia mạng lưới. Sau khi hoàn thành, nhà cung cấp sẽ đăng tải bằng chứng để nhận thù lao.
Arweave
Tính toán phi tập trung trên Arweave được thực hiện thông qua giao thức hợp đồng thông minh SmartWeave, có khả năng xử lý trực tiếp dữ liệu phong phú. Điểm khác biệt chính giữa SmartWeave và các giao thức hợp đồng thông minh blockchain khác là “Đánh giá lười biếng” (Lazy Evaluation), chuyển gánh nặng thực hiện tính toán từ các nút mạng sang người dùng hợp đồng thông minh. Lợi ích của việc tính toán lười biếng là rõ ràng: bằng cách tách rời lưu trữ và tính toán, các nút không cần lưu trạng thái toàn cục đang tăng dần.
Hợp đồng thông minh chỉ được người dùng tính toán và xác minh trạng thái mới nhất khi sử dụng, chứ không yêu cầu mọi nút tham gia đồng thuận trên chuỗi đều phải tính toán, xác minh. Việc chuyển giao tính toán xuống người dùng giúp cải thiện khả năng mở rộng của blockchain.
Warp
Warp phát triển một bộ SDK Warp dựa trên phiên bản ban đầu của SmartWeave, nâng cao hiệu suất và mức độ mô-đun so với phiên bản gốc, đồng thời cho phép các môi trường thực thi khác nhau.
Gần đây Warp công bố lộ trình năm 2023, các mục tiêu phát triển bao gồm:
1) Bộ đồng bộ Layer1: Đạt được đồng bộ hiệu quả giữa hợp đồng Warp và lớp Arweave cơ sở;
2) Bộ sắp xếp thứ tự Layer2: Thay vì gửi dữ liệu trực tiếp lên mainnet Arweave (có thể chờ 2~3 phút thời gian khối cho đến khi dữ liệu được đóng gói vào khối mới), giao dịch dữ liệu được chuyển đến bộ sắp xếp thứ tự Warp, sau đó thông qua mạng Bunder, giao dịch có thể được thanh toán ngay lập tức, cung cấp quyền truy cập dữ liệu tức thì và khả năng xác định gần như tức thì cho người dùng;
3) Cải tiến nâng cao hợp đồng: Hợp đồng Warp nhằm cung cấp một ngăn xếp kỹ thuật đầy đủ chức năng cho các Dapp Web3 để cạnh tranh với các dịch vụ Web2;
4) Phát triển Môi trường Phân giải Ủy quyền (Delegated Resolution Environment) và nút tổng hợp: Môi trường phân giải ủy quyền cho phép ủy thác tính toán đối với các hợp đồng tương tác cao và/hoặc không an toàn, trong khi nút tổng hợp cung cấp giám sát và thông tin chi tiết về trạng thái hợp đồng.
Độ dư thừa lưu trữ – Storage Redundancy
Mạng lưu trữ dữ liệu phi tập trung tránh được điểm lỗi đơn lẻ, nhưng làm sao đảm bảo các nút/nhà cung cấp lưu trữ thực sự lưu trữ dữ liệu mà người dùng tải lên một cách hiệu quả? Và làm sao để nhiều nút/nhà cung cấp lưu trữ riêng biệt dữ liệu được tải lên nhằm đạt được độ dư thừa và độ tin cậy?
Filecoin và Arweave áp dụng các giải pháp khác nhau, Filecoin dựa vào động lực kinh tế, Arweave dựa vào thiết kế giao thức.
Filecoin
Một trong những điểm nổi bật khi ra mắt FVM là giới thiệu Replication Worker (nhân viên sao chép dữ liệu) và Repair Worker (nhân viên sửa chữa dữ liệu).
Trước khi FVM ra mắt, nếu người dùng muốn sao lưu dữ liệu của họ trên các nút mạng để tối đa hóa khả năng dữ liệu được lưu giữ khi nhà cung cấp gặp sự cố, họ phải mất công thực hiện N đơn hàng với nhà cung cấp ngoài chuỗi, thực hiện N giao dịch trên chuỗi và tốn nhiều tài nguyên để truyền dữ liệu N lần.
Sau khi FVM ra mắt, nhân viên sao chép dữ liệu sẽ đóng vai trò trung gian, chỉ thu một khoản phí nhỏ để đạt được độ dư thừa dữ liệu, giúp người dùng tiết kiệm thời gian và chi phí. Nhân viên sao chép sẽ tự động khớp và tạo đơn hàng lưu trữ trên mạng Filecoin theo số lượng sao lưu, khu vực địa lý lưu trữ, yêu cầu độ trễ, phạm vi giá mà người dùng chọn.Nhân viên sửa chữa dữ liệu có thể đóng vai trò đại diện người dùng, giám sát xem dữ liệu lưu trữ có bị mất hay hết hạn hay không, và tự động sao chép dữ liệu dưới ngưỡng dư thừa đến thêm nhiều nhà cung cấp theo thiết lập của người dùng, đồng thời có thể đại diện người dùng gia hạn các đơn hàng lưu trữ đã hết hạn hoặc ngừng hoạt động.
Arweave
Độ dư thừa lưu trữ của Arweave được thực hiện tự nhiên thông qua thiết kế giao thức. Arweave sử dụng khối gọi lại làm một phần đầu vào của thuật toán Proof-of-Work SPoRA (Bằng chứng truy cập ngắn gọn ngẫu nhiên), đảm bảo rằng thợ đào tạo được khối mới thực sự lưu trữ toàn bộ dữ liệu của khối gọi lại. Cơ chế đồng thuận SPoRA khuyến khích thợ đào lưu trữ càng nhiều khối lịch sử và dữ liệu Blockweave càng tốt trong giới hạn dung lượng lưu trữ của họ. Nhưng nếu dung lượng lưu trữ của thợ đào không đủ để lưu trữ tất cả khối lịch sử và toàn bộ dữ liệu Blockweave, thợ đào sẽ ưu tiên lưu trữ các khối ít được lưu trữ bởi các thợ đào khác, bởi vì khi một khối gọi lại được nhiều thợ đào lưu trữ được chọn, sẽ có nhiều thợ đào cùng cạnh tranh đào khối mới; còn khi một khối gọi lại ít được lưu trữ được chọn, mức độ cạnh tranh sẽ thấp hơn. Hơn nữa, việc chọn khối gọi lại là hoàn toàn ngẫu nhiên, xác suất chọn bất kỳ khối gọi lại nào là phân bố đều rời rạc. Do đó, trong điều kiện giới hạn dung lượng lưu trữ, thợ đào hợp lý nên ưu tiên lưu trữ các khối ít được lưu trữ để tăng xác suất đào được khối mới và nhận thưởng. Giao thức Arweave thông qua thiết kế tinh tế và động lực kinh tế, khiến cho dữ liệu Blockweave và mọi khối lịch sử có thể được sao lưu tối đa trên toàn bộ mạng lưới thợ đào trong giới hạn dung lượng lưu trữ, đảm bảo độ tin cậy và độ dư thừa dữ liệu của mạng lưu trữ phi tập trung Arweave.
Truy xuất dữ liệu – Data Retrieval
Dữ liệu đã được lưu trữ, làm sao lấy lại dữ liệu một cách hiệu quả, chính xác và nhanh chóng là vấn đề khác.
Dịch vụ truy xuất dữ liệu trong Filecoin là một hệ thống khuyến khích kinh tế riêng biệt. Nhà cung cấp truy xuất (Retrieval Provider) chịu trách nhiệm cung cấp quyền truy cập nhanh dữ liệu cho người dùng lưu trữ. Nhà cung cấp truy xuất tập trung vào truy cập dữ liệu nhanh, chứ không phải lưu trữ dài hạn. Phần lớn nhà cung cấp lưu trữ cũng đồng thời là nhà cung cấp truy xuất. Người dùng trả phí cho nhà cung cấp truy xuất để lấy dữ liệu. Trong hệ sinh thái Filecoin đã có các dự án như retrieval.market và Saturn Network thực hiện truy xuất dữ liệu nhanh và phân phối nội dung.
Cơ chế đồng thuận SPoRA của Arweave ngoài những lợi thế về lưu trữ vĩnh viễn và độ dư thừa dữ liệu, còn nâng cao tốc độ truy xuất và truy cập dữ liệu. Trước khi nâng cấp SPoRA, cơ chế cũ Proof-of-Access (PoA) của Arweave giải quyết vấn đề khuyến khích thợ đào lưu trữ càng nhiều dữ liệu càng tốt, nhưng không khuyến khích thợ đào truy xuất dữ liệu nhanh. Trên thực tế, trong thời kỳ PoA, các thợ đào tập trung tài nguyên lưu trữ thành các "bể lưu trữ", lưu trữ các khối lịch sử bên trong. Khi một khối gọi lại được chọn, "bể lưu trữ" sẽ gửi nội dung khối đó cho thợ đào khi được yêu cầu. Điều này không có lợi cho tính phi tập trung của mạng. Thống kê mạng Arweave từng ghi nhận tình trạng toàn bộ sức mạnh băm tăng nhưng số lượng nút lại giảm, gián tiếp chứng minh sự tồn tại của các "bể lưu trữ". Để giải quyết vấn đề này và khuyến khích từng thợ đào lưu trữ dữ liệu cục bộ, Arweave nâng cấp PoA thành SPoRA. Sau khi nâng cấp, thợ đào không lưu trữ cục bộ dữ liệu khối lịch sử phải yêu cầu và truyền dữ liệu từ "bể lưu trữ" (với số lần rất lớn), chi phí và thời gian truyền dữ liệu tăng đáng kể, trong khi thợ đào lưu trữ cục bộ dữ liệu khối lịch sử có xác suất cao hơn để đào được khối mới. Thiết kế cơ chế này loại bỏ hoàn toàn sự tồn tại của "bể lưu trữ". Đồng thời, các nút thợ đào trên khắp thế giới lưu trữ dữ liệu khối lịch sử cục bộ cũng giúp nâng cao tốc độ truy xuất và truy cập dữ liệu cho người dùng.
Tài chính hóa lưu trữ – Financialization
Cùng với việc ra mắt FVM, Filecoin có thể tích hợp nhiều ứng dụng Web3 như DeFi, ví dụ: giao thức staking, giao thức bảo hiểm, sản phẩm phái sinh lưu trữ, v.v.
Nhà cung cấp lưu trữ trong Filecoin cần thế chấp một lượng FIL nhất định để cung cấp dịch vụ lưu trữ. Trước đây, nhà cung cấp phải huy động tiền mua FIL hoặc dựa vào hợp đồng vay ngoài chuỗi để vay FIL. Nhưng nhờ vào giao thức staking xây dựng trên FVM, người nắm giữ token FIL có thể gửi FIL nhàn rỗi vào giao thức và đặt ra các quy tắc, điều khoản; các nhà cung cấp lưu trữ với quy mô bất kỳ có thể nhận FIL trên chuỗi theo các quy tắc này để huy động đủ lượng FIL thế chấp cần thiết, từ đó triển khai dịch vụ lưu trữ.
Sản phẩm phái sinh lưu trữ là một kịch bản ứng dụng thú vị khác. Chi phí lưu trữ biến động gây khó khăn trong việc lập ngân sách cho cả người dùng và nhà cung cấp lưu trữ. Việc thương mại hóa không gian và thời gian lưu trữ (commoditize) cho phép người dùng khóa chi phí lưu trữ trước, nhà cung cấp cũng có thể thu hồi vốn trước và lên kế hoạch quản lý hàng tồn kho, phần cứng, vận hành, tài chính theo nhu cầu dài hạn.
Định vị và thực trạng dự án
Hiện tại, Filecoin có tổng cộng 3.678 nút trên toàn mạng cung cấp khoảng 19,544 EiB dung lượng lưu trữ, trong khi Arweave có 112 nút thực tế lưu trữ 125,62 TiB dữ liệu.
Xét về quy mô, mạng Filecoin lớn hơn, tuy nhiên dù cùng là giao thức lưu trữ dữ liệu phi tập trung, Filecoin và Arweave có định vị khác nhau, không thể đơn giản so sánh bằng số lượng nút mạng hay quy mô.
Protocol Labs định vị Filecoin là Thị trường Lưu trữ (Storage Marketplace) và Lớp Thúc đẩy (Incentive layer), xây dựng một thị trường lưu trữ, thị trường truy xuất, sản phẩm tài chính hoàn chỉnh xung quanh Filecoin, thông qua thiết kế khuyến khích kinh tế để đạt được nhiều chức năng sản phẩm phong phú (như lưu trữ vĩnh viễn, sao chép và sửa chữa lưu trữ...), nỗ lực trở thành giao thức lưu trữ, phân phối, tính toán phi tập trung lớn nhất và quan trọng nhất.
Định vị quan trọng nhất của Arweave là lưu trữ vĩnh viễn dữ liệu, đồng thời phát triển giao thức hợp đồng thông minh dựa trên lớp底层 Arweave để thực hiện tính toán trên dữ liệu. Mọi thiết kế cơ chế đều phục vụ mục tiêu quan trọng này, qua phần giới thiệu các đặc điểm trước đó, ta dễ dàng cảm nhận được thiết kế của Arweave là tinh tế và thống nhất.
Triển vọng
So với sự phát triển vượt bậc của hệ sinh thái Ethereum và Máy ảo Ethereum, sự phát triển của mạng lưu trữ dữ liệu phi tập trung trong vài năm qua có phần trầm lắng.
Trong hệ sinh thái Filecoin và Arweave có rất nhiều dự án và doanh nhân xuất sắc, nhưng hiện tại các giải pháp lưu trữ của Dapp Web3 chưa áp dụng rộng rãi Filecoin và/hoặc Arweave, nhiều Dapp vẫn phụ thuộc vào giải pháp lưu trữ Web2. Việc thực hiện tính toán trên blockchain chuyên về lưu trữ là một hướng đi mới lạ, dù là FVM hay SmartWeave, đều có tiềm năng giúp nhà phát triển mở khóa các ứng dụng phi tập trung chưa từng có.
Là nhà phát triển hay người dùng, việc chọn giao thức lưu trữ phi tập trung nào không phải là lựa chọn nhị phân, mà nên dựa trên nhu cầu lưu trữ cụ thể của ứng dụng và nội dung.
Mặc dù Filecoin và Arweave có phần định vị trùng lặp, nhưng mỗi bên đều có thể phát triển sâu sắc ở lĩnh vực độc đáo của mình, đáp ứng nhu cầu lưu trữ mạng phi tập trung đang liên tục phát triển, hiện thực hóa tầm nhìn từ “ổ đĩa mạng phi tập trung” đến “máy chủ phi tập trung”.
Chào mừng tham gia cộng đồng chính thức TechFlow
Nhóm Telegram:https://t.me/TechFlowDaily
Tài khoản Twitter chính thức:https://x.com/TechFlowPost
Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News














