
Học máy kiến thức không (ZKML): ZK và AI sẽ tạo nên tia lửa như thế nào?
Tuyển chọn TechFlowTuyển chọn TechFlow

Học máy kiến thức không (ZKML): ZK và AI sẽ tạo nên tia lửa như thế nào?
Bài viết này sẽ giới thiệu động lực xây dựng ZKML, các nỗ lực hiện tại và không gian ứng dụng tiềm năng.
Tác giả: dcbuilder.eth, Worldcoin
Biên dịch: TechFlow
Học máy bằng chứng thức kiến thức không (ZKML) là một lĩnh vực nghiên cứu và phát triển gần đây đang gây tiếng vang lớn trong cộng đồng mật mã học. Nhưng nó là gì và có công dụng ra sao? Trước tiên, hãy chia nhỏ thuật ngữ này thành hai phần cấu thành và giải thích từng phần.
ZK là gì?
Bằng chứng thức kiến thức không (zero-knowledge proof - ZKP) là một giao thức mật mã, trong đó một bên (người chứng minh) có thể chứng minh cho bên kia (người xác minh) rằng một mệnh đề nhất định là đúng mà không tiết lộ bất kỳ thông tin bổ sung nào ngoài việc mệnh đề đó là đúng. Đây là một lĩnh vực nghiên cứu đang đạt được những tiến bộ lớn trên nhiều phương diện, từ lý thuyết đến triển khai giao thức và ứng dụng thực tiễn.
Hai "thành tố cơ bản" chính (primitive) mà ZK cung cấp là khả năng tạo ra bằng chứng về tính toàn vẹn tính toán cho một tập hợp các phép toán nhất định, trong đó việc kiểm tra bằng chứng dễ dàng hơn rất nhiều so với việc thực hiện lại phép tính. (Chúng ta gọi thuộc tính này là "tính súc tích"). ZK cũng cung cấp tùy chọn ẩn đi một số phần của quá trình tính toán trong khi vẫn đảm bảo tính đúng đắn của phép tính. (Thuộc tính này gọi là "tính kiến thức không").
Việc tạo ra bằng chứng thức kiến thức không đòi hỏi lượng tính toán rất lớn, thường tốn kém gấp khoảng 100 lần so với phép tính gốc. Điều này có nghĩa là, trong một số trường hợp, do thời gian cần thiết để tạo chúng ngay cả trên phần cứng tốt nhất, nên việc tính toán bằng chứng thức kiến thức không trở nên không thực tế.
Tuy nhiên, trong những năm gần đây, sự tiến bộ trong lĩnh vực mật mã học, phần cứng và hệ thống phân tán đã khiến bằng chứng thức kiến thức không ngày càng trở thành lựa chọn khả thi cho các tính toán quy mô lớn. Những bước tiến này đã mở đường cho việc tạo ra các giao thức sử dụng các bằng chứng đòi hỏi nguồn lực cao, từ đó mở rộng không gian thiết kế cho các ứng dụng mới.
Ứng dụng của ZK
Mật mã học kiến thức không là một trong những công nghệ phổ biến nhất trong không gian Web3 vì nó cho phép các nhà phát triển xây dựng các ứng dụng có thể mở rộng và/hoặc riêng tư. Dưới đây là một số ví dụ về cách thức ứng dụng thực tế (mặc dù lưu ý rằng nhiều dự án trong số này vẫn đang trong quá trình phát triển):
1. Mở rộng Ethereum thông qua ZK rollup
-
Starknet
-
Scroll
-
Polygon Zero, Polygon Miden, Polygon zkEVM
-
zkSync
2. Xây dựng các ứng dụng bảo vệ quyền riêng tư
-
Semaphore
-
MACI
-
Penumbra
-
Aztec Network
3. Các thành tố nhận dạng và nguồn dữ liệu
-
WorldID
-
Sismo
-
Clique
-
Axiom
4. Giao thức lớp một
-
Zcash
-
Mina
Khi công nghệ ZK ngày càng trưởng thành, chúng tôi tin rằng sẽ xuất hiện làn sóng các ứng dụng mới, bởi vì các công cụ dùng để xây dựng chúng sẽ yêu cầu ít chuyên môn sâu hơn và trở nên dễ sử dụng hơn đối với các nhà phát triển.
Học máy
Học máy là một hướng nghiên cứu trong lĩnh vực trí tuệ nhân tạo (AI), cho phép máy tính tự động học hỏi và cải thiện từ kinh nghiệm mà không cần được lập trình rõ ràng. Nó sử dụng các thuật toán và mô hình thống kê để phân tích và nhận diện các mẫu trong dữ liệu, sau đó đưa ra dự đoán hoặc quyết định dựa trên các mẫu đó. Mục tiêu cuối cùng của học máy là phát triển các hệ thống thông minh có khả năng tự điều chỉnh, không cần sự can thiệp của con người và giải quyết các vấn đề phức tạp trong nhiều lĩnh vực như chăm sóc sức khỏe, tài chính và giao thông vận tải.
Gần đây, bạn có thể đã thấy những tiến bộ đáng kể về các mô hình ngôn ngữ lớn (như chatGPT và Bard) và các mô hình chuyển đổi văn bản thành hình ảnh (như DALL-E 2, Midjourney hoặc Stable Diffusion). Khi các mô hình này ngày càng trở nên mạnh mẽ hơn và có thể thực hiện nhiều nhiệm vụ khác nhau, việc xác định xem một thao tác cụ thể được thực hiện bởi mô hình hay bởi con người trở nên vô cùng quan trọng. Trong phần tiếp theo, chúng ta sẽ khám phá ý tưởng này.
Động lực và nỗ lực hiện tại của ZKML
Chúng ta đang sống trong một thế giới nơi nội dung do AI/ML tạo ra ngày càng khó phân biệt với nội dung do con người tạo ra. Mật mã học kiến thức không sẽ cho phép chúng ta đưa ra tuyên bố kiểu như: "Cho trước một nội dung C, nó được tạo ra bằng cách áp dụng mô hình M lên một đầu vào X nào đó". Chúng ta sẽ có thể xác minh xem một đầu ra cụ thể có thực sự được tạo ra bởi một mô hình ngôn ngữ lớn (như chatGPT) hoặc một mô hình chuyển đổi văn bản thành hình ảnh (như DALL-E 2) hay bất kỳ mô hình nào khác mà chúng ta đã tạo biểu diễn mạch ZK—hay không. Thuộc tính "kiến thức không" của các bằng chứng này sẽ cho phép chúng ta ẩn đi một phần đầu vào hoặc mô hình nếu cần thiết. Một ví dụ điển hình là việc áp dụng mô hình học máy lên dữ liệu nhạy cảm: người dùng có thể biết kết quả suy luận của mô hình mà không phải tiết lộ dữ liệu đầu vào cho bên thứ ba (ví dụ, trong ngành y tế).
Lưu ý: Khi nói về ZKML, chúng tôi ám chỉ việc tạo bằng chứng thức kiến thức không cho các bước suy luận (inference) của mô hình ML, chứ không phải việc huấn luyện mô hình ML (bản thân việc huấn luyện đã cực kỳ tốn tài nguyên tính toán). Hiện tại, công nghệ ZK hiện đại kết hợp với phần cứng hiệu suất cao vẫn còn thiếu hụt vài bậc độ lớn về mặt hiệu năng để có thể tạo bằng chứng cho các mô hình lớn như các mô hình ngôn ngữ lớn (LLMs), tuy nhiên đã có những bước tiến nhất định trong việc tạo bằng chứng cho các mô hình nhỏ hơn.
Chúng tôi đã thực hiện một số nghiên cứu về trạng thái nghệ thuật hiện tại của mật mã học ZK trong bối cảnh tạo bằng chứng cho mô hình ML, và đã tổng hợp các nghiên cứu, bài viết, ứng dụng và kho mã liên quan vào một bộ tài liệu. Các tài nguyên về ZKML có thể tìm thấy tại kho awesome-zkml của cộng đồng ZKML trên GitHub.
Nhóm Modulus Labs gần đây đã công bố một bài báo có tên “Chi phí của trí tuệ”, trong đó đánh giá hiệu năng của các hệ thống bằng chứng ZK hiện có và liệt kê nhiều mô hình ở các kích thước khác nhau. Hiện tại, sử dụng hệ thống bằng chứng như plonky2, trên một máy AWS mạnh, có thể tạo bằng chứng cho mô hình khoảng 18 triệu tham số trong khoảng 50 giây. Dưới đây là một biểu đồ từ bài báo:
Một sáng kiến khác nhằm cải thiện trình độ công nghệ hệ thống ZKML là thư viện ezkl của Zkonduit, cho phép bạn tạo bằng chứng ZK cho các mô hình ML được xuất dưới định dạng ONNX. Điều này giúp mọi kỹ sư ML đều có thể tạo bằng chứng ZK cho bước suy luận của mô hình mình và chứng minh đầu ra với bất kỳ bộ xác minh nào được triển khai đúng cách.
Có một số nhóm đang cải tiến công nghệ ZK, tạo phần cứng tối ưu hóa cho các thao tác diễn ra bên trong bằng chứng ZK, và xây dựng các triển khai tối ưu hóa cho các giao thức này theo từng trường hợp sử dụng cụ thể. Khi công nghệ trưởng thành, các mô hình lớn hơn sẽ có thể được tạo bằng chứng ZK trong thời gian ngắn hơn trên các máy yếu hơn. Chúng tôi hy vọng rằng những tiến bộ này sẽ thúc đẩy sự xuất hiện của các ứng dụng và trường hợp sử dụng ZKML mới.

Các trường hợp sử dụng tiềm năng
Để xác định ZKML có phù hợp với một ứng dụng cụ thể hay không, chúng ta có thể cân nhắc xem các đặc tính của mật mã học ZK sẽ giải quyết các vấn đề liên quan đến học máy ra sao. Điều này có thể minh họa bằng một sơ đồ Venn:
Giải thích:
1. Tối ưu hóa theo phương pháp heuristics — Một phương pháp giải quyết vấn đề sử dụng các quy tắc kinh nghiệm hoặc "heuristics" để tìm ra lời giải tốt cho các bài toán khó, thay vì dùng các phương pháp tối ưu truyền thống. Các phương pháp tối ưu hóa heuristic nhằm mục đích tìm ra lời giải tốt hoặc "đủ tốt" trong thời gian hợp lý, thay vì cố gắng tìm lời giải tối ưu tuyệt đối.
2. FHE ML — Học máy với mã hóa đồng dạng toàn phần (Fully Homomorphic Encryption) cho phép các nhà phát triển huấn luyện và đánh giá mô hình một cách bảo mật quyền riêng tư; tuy nhiên, khác với bằng chứng ZK, không có cách nào để chứng minh bằng mật mã rằng phép tính đã được thực hiện đúng.
-
Các nhóm như Zama.ai đang làm việc trong lĩnh vực này.
3. ZK so với Validity — Trong ngành, các thuật ngữ này thường được dùng thay thế lẫn nhau, vì bằng chứng tính hợp lệ (validity proof) là loại bằng chứng ZK mà không che giấu bất kỳ phần nào của phép tính hay kết quả. Trong bối cảnh ZKML, hầu hết các ứng dụng hiện tại tận dụng khía cạnh bằng chứng hợp lệ của bằng chứng ZK.
4. Validity ML — Bằng chứng ZK cho mô hình ML, trong đó không có phần tính toán hay kết quả nào bị giữ bí mật. Chúng chứng minh tính đúng đắn của phép tính.
Dưới đây là một số ví dụ về các trường hợp sử dụng ZKML tiềm năng:
1. Tính toàn vẹn tính toán (Validity ML)
-
Modulus Labs
-
Robot giao dịch ML có thể xác minh trên chuỗi — RockyBot
Blockchain thị giác tự cải thiện (ví dụ):
-
Nâng cao tính năng thông minh của AMM trong giao thức Lyra về quyền chọn tài chính
-
Tạo hệ thống danh tiếng minh bạch dựa trên AI cho Astraly (oracle ZK)
-
Phát triển công nghệ đột phá cho Aztec Protocol (zk-rollup có chức năng riêng tư) nhằm phục vụ các công cụ tuân thủ ở cấp độ hợp đồng.
2. Minh bạch dịch vụ học máy (MLaaS);
3. Phát hiện bất thường/gian lận bằng ZK:
-
Ứng dụng này cho phép tạo bằng chứng ZK về khả năng bị khai thác hoặc gian lận. Mô hình phát hiện bất thường có thể được huấn luyện trên dữ liệu hợp đồng thông minh và được DAO chấp thuận làm chỉ số thú vị, từ đó tự động hóa các chương trình an ninh như tạm dừng chủ động và phòng ngừa các hợp đồng. Đã có các startup đang nghiên cứu cách sử dụng mô hình ML cho mục đích bảo mật trong môi trường hợp đồng thông minh, do đó bằng chứng phát hiện bất thường ZK dường như là bước tiến tự nhiên tiếp theo.
4. Bằng chứng tính hợp lệ tổng quát cho suy luận ML: Có khả năng dễ dàng chứng minh và xác minh rằng đầu ra là kết quả của một cặp mô hình và đầu vào nhất định.
5. Quyền riêng tư (ZKML).
6. Kaggle phi tập trung: Chứng minh rằng mô hình đạt độ chính xác lớn hơn x% trên một tập dữ liệu kiểm thử nhất định mà không tiết lộ trọng số.
7. Suy luận bảo vệ quyền riêng tư: Đầu vào là dữ liệu y tế cá nhân của bệnh nhân, và kết quả suy luận nhạy cảm (ví dụ: kết quả xét nghiệm ung thư) được gửi đến bệnh nhân.
8. Worldcoin:
-
Khả năng nâng cấp IrisCode: Người dùng World ID sẽ có thể tự lưu trữ đặc trưng sinh trắc học của mình trong bộ nhớ mã hóa trên thiết bị di động, tải xuống mô hình ML dùng để tạo IrisCode và tự tạo bằng chứng thức kiến thức không ngay trên thiết bị, nhằm chứng minh rằng IrisCode đã được tạo thành công. IrisCode này có thể được đưa vào một trong các tài khoản Worldcoin đã đăng ký một cách không cần được cấp phép, vì hợp đồng thông minh nhận có thể xác minh bằng chứng ZK, từ đó xác minh việc tạo IrisCode. Điều này có nghĩa là, nếu trong tương lai Worldcoin nâng cấp mô hình học máy theo cách làm mất tính tương thích với phiên bản trước đó, người dùng sẽ không cần phải quay lại Orb mà có thể tự tạo bằng chứng ZK ngay trên thiết bị.
-
Bảo mật Orb: Hiện tại, Orb thực hiện nhiều cơ chế phát hiện gian lận và giả mạo trong môi trường đáng tin cậy của nó. Tuy nhiên, chúng ta có thể tạo một bằng chứng ZK để chứng minh rằng các cơ chế này đang hoạt động khi chụp ảnh và tạo IrisCode, nhằm cung cấp bằng chứng sống động tốt hơn cho giao thức Worldcoin, vì chúng ta hoàn toàn có thể chắc chắn rằng các cơ chế này luôn chạy xuyên suốt quá trình tạo IrisCode.
Tóm lại, công nghệ ZKML có tiềm năng ứng dụng rộng rãi và đang phát triển nhanh chóng. Khi ngày càng có nhiều nhóm và cá nhân tham gia lĩnh vực này, chúng tôi tin rằng các trường hợp sử dụng ZKML sẽ ngày càng đa dạng và phổ biến hơn.
Chào mừng tham gia cộng đồng chính thức TechFlow
Nhóm Telegram:https://t.me/TechFlowDaily
Tài khoản Twitter chính thức:https://x.com/TechFlowPost
Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News














