Cố vấn viên hợp tác Dragonfly: Ứng dụng của "Đừng tin, hãy tự kiểm chứng" trong suy luận phi tập trung

2024.03.28

Chia sẻ đến

Tuyển chọn TechFlowTuyển chọn TechFlow

Cố vấn viên hợp tác Dragonfly: Ứng dụng của "Đừng tin, hãy tự kiểm chứng" trong suy luận phi tập trung

Blockchain và học máy rõ ràng có nhiều điểm chung.

2024.03.28 - 09:28:29

Chuyên sâu báo cáo Web3

Blockchain và học máy rõ ràng có nhiều điểm chung.

Tác giả: Haseeb Qureshi

Biên dịch: TechFlow

Bạn muốn chạy một mô hình ngôn ngữ lớn như Llama2–70B. Mô hình khổng lồ như vậy cần hơn 140GB bộ nhớ, điều đó có nghĩa là bạn không thể chạy mô hình gốc trên máy tính cá nhân. Vậy bạn có những lựa chọn nào? Bạn có thể chuyển sang các nhà cung cấp dịch vụ điện toán đám mây, nhưng bạn có thể không sẵn lòng tin tưởng một công ty tập trung duy nhất để xử lý khối lượng công việc này và thu thập toàn bộ dữ liệu sử dụng của bạn. Điều bạn cần lúc này chính là suy luận phi tập trung – cho phép bạn chạy các mô hình học máy mà không phụ thuộc vào bất kỳ nhà cung cấp đơn lẻ nào.

Vấn đề về niềm tin

Trong mạng lưới phi tập trung, chỉ cần chạy mô hình và tin tưởng vào đầu ra là chưa đủ. Giả sử tôi yêu cầu mạng lưới dùng Llama2–70B phân tích một tình huống quản trị, làm sao tôi biết chắc rằng nó thực sự không dùng Llama2-13B, đưa ra phân tích kém hơn và giữ lại khoản chênh lệch lợi nhuận?

Trong thế giới tập trung, bạn có thể tin rằng các công ty như OpenAI là trung thực vì danh tiếng của họ bị đe dọa (và ở mức độ nào đó, chất lượng của mô hình LLM là tự hiển nhiên). Nhưng trong thế giới phi tập trung, sự trung thực không phải là mặc định – nó cần được kiểm chứng.

Đây chính là nơi mà suy luận có thể xác minh phát huy tác dụng. Ngoài việc trả lời truy vấn, bạn còn phải chứng minh rằng nó đã đúng đắn chạy mô hình theo yêu cầu của bạn. Nhưng làm thế nào để thực hiện?

Cách đơn giản nhất là chạy mô hình như một hợp đồng thông minh trên chuỗi. Điều này chắc chắn đảm bảo đầu ra được xác minh, nhưng hoàn toàn không thực tế. GPT-3 biểu diễn từ bằng cách nhúng với kích thước 12.288 chiều. Nếu bạn thực hiện một phép nhân ma trận đơn lẻ với kích thước này trên chuỗi, theo giá gas hiện tại, chi phí sẽ khoảng 10 tỷ USD, và phép tính này sẽ chiếm đầy mọi khối khoảng một tháng trời.

Do đó, chúng ta cần một cách tiếp cận khác.

Sau khi quan sát lĩnh vực này, tôi thấy rõ có ba phương pháp chính giải quyết bài toán suy luận có thể xác minh: bằng chứng không kiến thức (zero-knowledge), bằng chứng gian lận kiểu lạc quan (optimistic fraud proofs) và kinh tế mật mã. Mỗi phương pháp đều có những hệ quả riêng về an toàn và chi phí.

1. Bằng chứng không kiến thức (ZK ML)

Hãy tưởng tượng bạn có thể chứng minh mình đã chạy một mô hình lớn, nhưng kích thước bằng chứng lại cố định, bất kể mô hình lớn đến đâu. Đây chính là điều ZK ML (machine learning) hứa hẹn, thông qua ZK-SNARK.

Mặc dù nghe rất thanh lịch về mặt nguyên tắc, nhưng biên dịch một mạng nơ-ron sâu thành mạch zero-knowledge rồi tạo bằng chứng là cực kỳ khó khăn. Chi phí cũng vô cùng cao – ít nhất, bạn có thể thấy chi phí suy luận tăng gấp 1000 lần, độ trễ cũng tăng gấp 1000 lần (thời gian tạo bằng chứng), chưa kể đến việc phải biên dịch chính mô hình thành mạch trước khi bất cứ điều gì xảy ra. Cuối cùng, chi phí này sẽ được chuyển sang người dùng, khiến trải nghiệm cuối cùng trở nên cực kỳ đắt đỏ.

Mặt khác, đây là phương pháp duy nhất đảm bảo tính đúng đắn bằng mật mã. Với ZK, dù nhà cung cấp mô hình có cố gắng đến đâu cũng không thể gian lận. Tuy nhiên, chi phí đi kèm khiến phương pháp này không thực tế đối với các mô hình lớn trong tương lai gần.

Ví dụ: EZKL, Modulus Labs, Giza

2. Bằng chứng gian lận kiểu lạc quan (Optimistic ML)

Phương pháp lạc quan là: tin tưởng, nhưng xác minh. Chúng ta giả định suy luận là đúng trừ khi có bằng chứng ngược lại. Nếu một nút cố gắng gian lận, các “người quan sát” trong mạng lưới có thể chỉ ra kẻ gian lận và thách thức nó bằng bằng chứng gian lận. Những người quan sát này phải luôn theo dõi chuỗi và tự chạy lại mô hình của riêng họ để đảm bảo đầu ra chính xác.

Những bằng chứng gian lận này mang phong cách Truebit – trò chơi phản hồi tương tác, trong đó bạn liên tục chia nhỏ hành trình thực thi mô hình trên chuỗi cho đến khi tìm ra lỗi.

Nếu điều này thực sự xảy ra, chi phí sẽ cực kỳ cao, bởi các chương trình này khổng lồ và có trạng thái nội bộ đồ sộ – một lần suy luận GPT-3 tốn khoảng 1 petaflop (10⁵ phép tính dấu phẩy động). Nhưng lý thuyết trò chơi cho thấy điều này hầu như không thể xảy ra (việc viết đúng mã cho bằng chứng gian lận cũng rất khó do đoạn mã này gần như không bao giờ được thực thi trong môi trường sản xuất).

Lợi ích của phương pháp lạc quan là chỉ cần có một người quan sát trung thực đang theo dõi, thì ML là an toàn. Chi phí thấp hơn ZK ML, nhưng hãy nhớ rằng mỗi người quan sát trong mạng đều đang chạy lại từng truy vấn. Trong trạng thái cân bằng, điều này có nghĩa nếu có 10 người quan sát, chi phí an ninh phải được chuyển sang người dùng – họ sẽ phải trả phí vượt quá 10 lần chi phí suy luận (hoặc bằng số lượng người quan sát).

Nhược điểm là, giống như các kỹ thuật tổng hợp kiểu lạc quan, bạn phải chờ hết thời gian thách thức mới đảm bảo phản hồi đã được xác minh. Tuy nhiên, tùy theo thiết lập tham số mạng, bạn có thể chỉ cần chờ vài phút thay vì vài ngày.

Ví dụ: Ora, Gensyn

3. Kinh tế mật mã (Cryptoeconomic ML)

Ở đây, chúng ta bỏ qua tất cả các kỹ thuật cầu kỳ và làm điều đơn giản: bỏ phiếu theo cổ phần. Người dùng quyết định bao nhiêu nút sẽ chạy truy vấn của họ, mỗi nút tiết lộ phản hồi, nếu có sự khác biệt giữa các phản hồi, nút bất thường sẽ bị phạt cắt cổ phần. Đây là cơ chế oracles tiêu chuẩn – một phương pháp trực tiếp hơn, cho phép người dùng đặt mức độ an toàn họ muốn, cân bằng giữa chi phí và niềm tin. Nếu Chainlink làm ML, đây sẽ là cách họ thực hiện.

Độ trễ ở đây rất nhanh, bạn chỉ cần mỗi nút gửi cam kết và tiết lộ. Nếu được ghi vào blockchain, về mặt kỹ thuật, điều này có thể xảy ra trong hai khối.

Tuy nhiên, mức độ an toàn yếu nhất. Nếu đa số các nút sẵn sàng hợp tác, họ có thể hợp lý lựa chọn cấu kết với nhau. Là người dùng, bạn phải cân nhắc xem các nút đã đặt cược bao nhiêu và việc gian lận sẽ tốn kém thế nào đối với họ. Nói cách khác, bằng cách sử dụng tái đặt cược (re-staking) và tính bảo mật có thể quy trách nhiệm như Eigenlayer, mạng lưới có thể cung cấp bảo hiểm hiệu quả khi an toàn bị vi phạm.

Nhưng lợi ích của hệ thống này là người dùng có thể chỉ định mức độ an toàn họ muốn. Họ có thể chọn 3 hoặc 5 nút trong nhóm đạt đa số, hoặc mọi nút trong mạng. Hoặc, nếu họ muốn mạo hiểm, thậm chí có thể chọn n=1. Hàm chi phí ở đây rất đơn giản: người dùng trả phí theo số lượng nút họ muốn trong nhóm bỏ phiếu. Nếu bạn chọn 3, bạn trả gấp 3 lần chi phí suy luận.

Vấn đề nan giải ở đây là: bạn có thể làm cho n=1 an toàn được không? Trong một triển khai đơn giản, một nút đơn lẻ nên gian lận mọi lúc nếu không ai giám sát. Nhưng tôi nghi ngờ rằng, nếu bạn mã hóa truy vấn và thanh toán theo ý định, bạn có thể che giấu với nút rằng họ thực sự là nút duy nhất phản hồi nhiệm vụ này. Trong trường hợp đó, bạn có thể tính phí cho người dùng phổ thông ít hơn 2 lần chi phí suy luận.

Cuối cùng, phương pháp kinh tế mật mã là đơn giản nhất, dễ dàng nhất và có thể là rẻ nhất, nhưng về nguyên tắc, nó kém hấp dẫn và kém an toàn nhất. Nhưng như thường lệ, chi tiết quyết định thành bại.

Ví dụ: Ritual, Atoma Network

Tại sao ML có thể xác minh lại khó

Bạn có thể nghĩ, tại sao chúng ta chưa có tất cả những thứ này? Dù sao đi nữa, xét cho cùng, các mô hình ML chỉ là các chương trình máy tính rất lớn. Chứng minh việc thực thi chương trình đúng đắn luôn là nền tảng của blockchain.

Đó là lý do tại sao ba phương pháp xác minh này phản ánh cách blockchain bảo vệ không gian khối của mình: ZK rollup dùng bằng chứng ZK, optimistic rollup dùng bằng chứng gian lận, và hầu hết các blockchain L1 dùng kinh tế mật mã. Không có gì ngạc nhiên khi chúng ta cuối cùng cũng đưa ra các giải pháp cơ bản giống nhau. Vậy điều gì khiến việc áp dụng vào ML trở nên khó khăn?

ML đặc biệt vì các phép tính ML thường được biểu diễn dưới dạng đồ thị tính toán dày đặc, được thiết kế để chạy hiệu quả trên GPU. Chúng không được tạo ra để phục vụ cho mục đích chứng minh. Do đó, nếu bạn muốn chứng minh tính toán ML trong môi trường ZK hay lạc quan, chúng phải được biên dịch lại thành định dạng khả thi – điều này cực kỳ phức tạp và tốn kém.

Khó khăn cơ bản thứ hai của máy học là tính phi xác định. Xác minh chương trình giả định đầu ra của chương trình là xác định. Nhưng nếu bạn chạy cùng mô hình trên các kiến trúc GPU hoặc phiên bản CUDA khác nhau, bạn sẽ nhận được đầu ra khác nhau. Ngay cả khi bạn buộc mọi nút dùng cùng kiến trúc, bạn vẫn gặp vấn đề về tính ngẫu nhiên trong thuật toán (nhiễu trong mô hình khuếch tán, hoặc lấy mẫu token trong LLM). Bạn có thể sửa tính ngẫu nhiên này bằng cách kiểm soát hạt giống ngẫu nhiên (random seed). Nhưng ngay cả vậy, bạn vẫn đối mặt với vấn đề cuối cùng đáng lo ngại: tính phi xác định vốn có trong phép toán dấu phẩy động.

Hầu hết các thao tác GPU đều dựa trên số dấu phẩy động. Số dấu phẩy động rất khó xử lý vì chúng không có tính kết hợp – tức là với số dấu phẩy động, (a + b) + c không luôn bằng a + (b + c). Vì GPU cực kỳ song song, thứ tự thực hiện phép cộng hoặc nhân có thể khác nhau mỗi lần chạy, dẫn đến những sai lệch nhỏ trong đầu ra. Điều này ít ảnh hưởng đến đầu ra của LLM do tính rời rạc của từ, nhưng với mô hình hình ảnh, có thể gây ra sự khác biệt tinh vi ở giá trị pixel, khiến hai hình ảnh không khớp hoàn toàn.

Điều đó có nghĩa là bạn phải tránh dùng số dấu phẩy động – điều này gây tổn hại nghiêm trọng đến hiệu suất – hoặc bạn phải cho phép một chút linh hoạt khi so sánh đầu ra. Dù là cách nào, các chi tiết đều rắc rối và bạn không thể hoàn toàn bỏ qua. (Đây cũng là lý do tại sao Máy ảo Ethereum không hỗ trợ số dấu phẩy động, mặc dù một số blockchain như NEAR lại hỗ trợ.)

Tóm lại, mạng lưới suy luận phi tập trung rất khó vì mọi chi tiết đều quan trọng, trong khi các chi tiết ngoài đời thực lại nhiều hơn mong đợi.

Tổng kết

Hiện tại, blockchain và machine learning rõ ràng có nhiều điểm chung. Một bên là công nghệ tạo dựng niềm tin, bên kia là lĩnh vực đang khao khát niềm tin. Mặc dù mỗi phương pháp suy luận phi tập trung đều có những điểm đánh đổi riêng, tôi rất háo hức muốn xem các doanh nhân sẽ tận dụng những công cụ này như thế nào để xây dựng nên mạng lưới tốt nhất.

Chào mừng tham gia cộng đồng chính thức TechFlow

Nhóm Telegram:https://t.me/TechFlowDaily

Tài khoản Twitter chính thức:https://x.com/TechFlowPost

Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News

Liên kết gốc

Thêm vào mục ưa thích

Chia sẻ lên mạng xã hội

Tác giả

Dragonfly

@dragonfly_xyz

Cố vấn viên hợp tác Dragonfly: Ứng dụng của "Đừng tin, hãy tự kiểm chứng" trong suy luận phi tập trung

Tuyển chọn TechFlowTuyển chọn TechFlow

Cố vấn viên hợp tác Dragonfly: Ứng dụng của "Đừng tin, hãy tự kiểm chứng" trong suy luận phi tập trung

Vấn đề về niềm tin

1. Bằng chứng không kiến thức (ZK ML)

2. Bằng chứng gian lận kiểu lạc quan (Optimistic ML)

3. Kinh tế mật mã (Cryptoeconomic ML)

Tại sao ML có thể xác minh lại khó

Tổng kết

Bài viết liên quan

Nội dung bài viết

Zhipu AI trong mắt một người nước ngoài: Mô hình miễn phí, thua lỗ khổng lồ, vì sao vốn hóa thị trường từng vượt qua Meituan?

Ondo Perps Trải nghiệm thực tế: Dùng cổ phiếu Mỹ làm ký quỹ, 20x Long/Short cổ phiếu Mỹ, vàng và dầu thô

Chiến thắng thầm lặng của ADI: Bản thiết kế cơ sở hạ tầng của hệ sinh thái tài chính truyền thống

Cổ phiếu A đang nóng lên với chủ đề chip nhớ, trong khi Phố Wall lại bàn luận về lưu trữ phi tập trung

OpenRouter: Làm thế nào để trở thành công ty trị giá 1 tỷ đô la chỉ bằng “trạm trung chuyển mô hình”?

Trưởng bộ phận nghiên cứu gia đình đầu tư của Arthur Hayes: Dự báo giá $CARDS tăng mạnh, đạt mức 4 USD vào mùa hè; xu hướng kinh doanh thẻ trên blockchain có khả năng vượt mặt eBay.

Tại sao SpaceX lại có trần định giá cao đến vậy? Câu trả lời nằm trong bản đồ kinh doanh của Elon Musk.

Cuộc chạy đua vũ trang AI của các sàn giao dịch tập trung (CEX): Cổng vào hay hạ tầng – giải pháp nào phù hợp hơn với bạn?

a16z: Mặt Trời làm chứng, giá trị của SpaceX đạt 7,5 nghìn tỷ USD

Ba khoảnh khắc của Anthropic: Rò rỉ mã nguồn, đối đầu với chính phủ và việc vũ khí hóa

Tuyển chọn TechFlow
Xem thêm>

Cố vấn viên hợp tác Dragonfly: Ứng dụng của "Đừng tin, hãy tự kiểm chứng" trong suy luận phi tập trung

Tuyển chọn TechFlowTuyển chọn TechFlow

Cố vấn viên hợp tác Dragonfly: Ứng dụng của "Đừng tin, hãy tự kiểm chứng" trong suy luận phi tập trung

Vấn đề về niềm tin

1. Bằng chứng không kiến thức (ZK ML)

2. Bằng chứng gian lận kiểu lạc quan (Optimistic ML)

3. Kinh tế mật mã (Cryptoeconomic ML)

Tại sao ML có thể xác minh lại khó

Tổng kết

Bài viết liên quan

Nội dung bài viết

Zhipu AI trong mắt một người nước ngoài: Mô hình miễn phí, thua lỗ khổng lồ, vì sao vốn hóa thị trường từng vượt qua Meituan?

Ondo Perps Trải nghiệm thực tế: Dùng cổ phiếu Mỹ làm ký quỹ, 20x Long/Short cổ phiếu Mỹ, vàng và dầu thô

Chiến thắng thầm lặng của ADI: Bản thiết kế cơ sở hạ tầng của hệ sinh thái tài chính truyền thống

Cổ phiếu A đang nóng lên với chủ đề chip nhớ, trong khi Phố Wall lại bàn luận về lưu trữ phi tập trung

OpenRouter: Làm thế nào để trở thành công ty trị giá 1 tỷ đô la chỉ bằng “trạm trung chuyển mô hình”?

Trưởng bộ phận nghiên cứu gia đình đầu tư của Arthur Hayes: Dự báo giá $CARDS tăng mạnh, đạt mức 4 USD vào mùa hè; xu hướng kinh doanh thẻ trên blockchain có khả năng vượt mặt eBay.

Tại sao SpaceX lại có trần định giá cao đến vậy? Câu trả lời nằm trong bản đồ kinh doanh của Elon Musk.

Cuộc chạy đua vũ trang AI của các sàn giao dịch tập trung (CEX): Cổng vào hay hạ tầng – giải pháp nào phù hợp hơn với bạn?

a16z: Mặt Trời làm chứng, giá trị của SpaceX đạt 7,5 nghìn tỷ USD

Ba khoảnh khắc của Anthropic: Rò rỉ mã nguồn, đối đầu với chính phủ và việc vũ khí hóa

Tuyển chọn TechFlowXem thêm>

Tuyển chọn TechFlow
Xem thêm>