
ZKML:AIとブロックチェーンを融合させ、プライバシー保護されたモデル展開を実現する技術
TechFlow厳選深潮セレクト

ZKML:AIとブロックチェーンを融合させ、プライバシー保護されたモデル展開を実現する技術
過熱のZKMLとは一体何なのか?
執筆:Maggie、Foresight Research

ZKML(Zero Knowledge Machine Learning)はゼロ知識証明を機械学習に応用する技術であり、ZKMLはAIとブロックチェーンの橋渡し役となる。ZKMLはAIモデル/入力のプライバシー保護および推論プロセスの検証可能性という課題を解決することで、小規模なモデルや推論のZKPをブロックチェーン上に載せることを可能にする。モデル/推論の証明をブロックチェーン上に載せる意義は以下の通りである。
-
ブロックチェーンが物理世界を感知できるようにする。例えば、ブロックチェーン上で動作する顔認識モデルがあれば、ブロックチェーンは顔を認識でき、その人物が女性かどうか、およそ何歳くらいかなどを理解できるようになる。
-
スマートコントラクトが意思決定を行えるようにする。例えば、ブロックチェーン上のWETH価格予測モデルがあれば、スマートコントラクトの取引判断を支援できる。
-
プライバシーを守りながらAIモデルを実行する。例えば、企業が大量の計算リソースをかけて訓練したモデルを、プライバシーを保護した形で外部に推論サービスとして提供したい場合や、ユーザーの入力を秘密にしたい場合がある。ZKMLを使えば、モデル・入力の両方のプライバシーを保ちつつ、推論が正しく行われたことを利用者に証明でき、信頼不要な推論(trustless inference)を実現できる。
ZKMLの応用分野
-
オンチェーンAI:AIモデルまたはその推論証明をブロックチェーン上に載せ、スマートコントラクトがAIを使って意思決定を行う。例えば、オンチェーン取引システムによる投資判断。
-
自己改善型ブロックチェーン:ブロックチェーンがAIの能力を活用し、過去のデータに基づいて戦略を継続的に向上・修正していく。例えば、AIベースのオンチェーン評判システム。
-
AIGCのオンチェーン化:AIGCによって生成されたコンテンツ/アート作品をブロックチェーン上にMintしてNFT化する。ZKにより生成プロセスの正当性を証明でき、使用されたデータセットに著作権保護された画像が含まれていないことも示せる。
-
ウォレットのバイオ認証(KYC):顔認識の証明をオンチェーンに記録し、ウォレットでのKYCを完了させる。
-
AIセキュリティ:AIを用いた不正検出、シビル攻撃防止など。
-
オンチェーンZKMLゲーム:オンチェーンAIチェスプレイヤー、ニューラルネットワーク駆動のNFTキャラクターなど。
ZKMLの技術的側面
-
目標:ニューラルネットワークをZK回路に変換すること。難点は① ZK回路が浮動小数点数をサポートしていないこと、② 大規模なニューラルネットワークは変換が困難であること。
-
現状の進展:最初のZKMLライブラリは2年前に登場しており、技術自体の歴史は非常に短い。現在、最新のZKMLライブラリではシンプルなニューラルネットワークのZK化が可能になり、ブロックチェーン上での応用も始まっている。基本的な線形回帰モデルのオンチェーン化が可能で、それ以外の小型ニューラルネットワークモデルについても証明のオンチェーン化がサポートされている。しかしデモは極めて少なく、手書き数字認識のもの一つだけが確認されている。一部のツールでは1億パラメータのモデルに対応すると称しており、GPT2をZK回路に変換しZK証明を生成できると主張しているものもある。
-
今後の方向性:Network Quantization(ネットワーク量子化)により、ニューラルネットワーク内の浮動小数点数を固定小数点数に変換し、ニューラルネットワークを軽量化(ZKフレンドリー化)する。大規模パラメータのニューラルネットワークをZK回路に変換する試みとともに、証明効率の向上(ZK能力の拡張)も進められている。
まとめ
ZKMLはAIとブロックチェーンをつなぐ技術であり、ブロックチェーンが物理世界を認識し、スマートコントラクトが意思決定を行い、AIモデルをプライバシーを守って実行できるという意義を持ち、非常に有望な技術である。
この技術は歴史が浅いものの発展が著しく、すでにいくつかのシンプルなニューラルネットワークモデルをZK回路に変換し、モデルまたは推論証明をオンチェーンに載せられるまでになっている。自然言語処理モデルについてはまだ難しいが、Ddkang/zkmlはGPT2、BERT、DiffusionモデルのZK化を宣言している。実際に動作するかはともかく、オンチェーンへの搭載は未確認である。ネットワーク量子化技術、ZK技術、ブロックチェーンのスケーラビリティ技術の進展により、やがて言語モデルのZKMLも実用可能になると期待される。
1. 背景
(ZKやMLについて既に理解がある場合は、この章をスキップできます)。
ゼロ知識証明(ZK):証明者が検証者に対して有用な情報を一切与えずに、ある命題が真であることを証明できる手法。ZKは主に計算プロセスの正しさの証明とプライバシー保護に用いられる。
計算プロセスの正しさの証明:ZK-rollupを例にすると、複数のトランザクションをまとめてL1に投稿すると同時に、「これらのトランザクションが有効である」ことを証明するZK証明も提出する。L1上で証明が検証されれば、zk-rollupのステータスが更新される。
プライバシー保護:Aztecプロトコルを例にすると、zk.money上の資産はチケット形式(UTXOに類似)で存在し、金額は暗号化されている。送金時にはチケットを破棄し、受取人および自分宛に新しいチケットを作成する。ゼロ知識証明は、破棄したチケットと新規チケットの金額が一致し、かつユーザーがチケットを所有していることをプライバシーを守って証明するために使われる。
機械学習(ML):人工知能の一分野。機械学習の理論は、コンピュータが自動的に「学習」できるアルゴリズムを設計・分析することを目的とする。機械学習アルゴリズムは、データから自動的にパターンを抽出し、未知のデータを予測するために利用される。コンピュータビジョン、自然言語処理、生体認証、検索エンジン、医療診断、クレジットカード詐欺検出、証券市場分析、DNA配列解析、音声・手書き認識、ゲーム、ロボットなど幅広い分野で応用されている。
2. ZKMLは何の問題を解決するのか?
ZKMLは、ここ2年ほど暗号学界で注目を集める研究・開発分野となっている。機械学習にゼロ知識証明を適用するこの技術の主な目的は、機械学習におけるプライバシー保護と検証可能性の問題を解決することにある。これにより、小規模モデルや推論のZKPをブロックチェーンに載せることができ、AIとブロックチェーンの橋渡しとなる。
-
モデルのオンチェーン化:MLモデルをZK回路に変換し、小さなZKMLモデルをブロックチェーン上のスマートコントラクト内に保存する。ユーザーはスマートコントラクトのメソッドを呼び出してモデルを利用できる。例えば、Modulus LabsのRockyBotは、WETH価格を予測するオンチェーンAIモデルを構築し、取引判断に利用している。
-
モデル推論の証明をオンチェーン化:MLモデルをZK回路に変換し、オフチェーンで推論を実行してZK証明を生成する。この証明は推論プロセスが正しく実行されたことを保証する。推論結果とZK証明をオンチェーンに提出すれば、利用者が参照したり、スマートコントラクトが証明を検証したりできる。
モデル/推論証明のオンチェーン化にはどのような意味があるのか?
-
ブロックチェーンが物理世界を感知できるようにする。例えば、ブロックチェーン上で動作する顔認識モデルがあれば、ブロックチェーンは顔を認識でき、その人物が女性かどうか、およそ何歳くらいかなどを理解できるようになる。
-
スマートコントラクトが意思決定を行えるようにする。例えば、ブロックチェーン上のWETH価格予測モデルがあれば、スマートコントラクトの取引判断を支援できる。
-
プライバシーを守りながらAIモデルを実行する。例えば、企業が大量の計算リソースをかけて訓練したモデルを、プライバシーを保護した形で外部に推論サービスとして提供したい場合や、ユーザーの入力を秘密にしたい場合がある。ZKMLを使えば、モデル・入力の両方のプライバシーを保ちつつ、推論が正しく行われたことを利用者に証明でき、信頼不要な推論(trustless inference)を実現できる。
ZKMLにおけるゼロ知識証明の役割:
1. プライバシー保護:MLモデルまたは推論中の入力データのプライバシーを守る。
-
データのプライバシー(公開モデル+非公開データ):医療データ、顔画像などセンシティブなデータを持っている場合、ZKMLを使って入力データのプライバシーを保護しつつ、公開されたニューラルネットワークモデル上で処理を行い結果を得ることができる。顔認識モデルの例など。
-
モデルのプライバシー(非公開モデル+公開データ):高コストをかけて訓練したモデルを外部に漏らしたくない場合、モデルのプライバシーを保護する必要がある。ZKMLを使えば、非公開のニューラルネットワークモデルをプライバシーを守って実行し、公開された入力データに対して推論を行い出力結果を得ることができる。
2. 検証可能性:ZKPを使ってML推論プロセスの正しさを証明し、機械学習プロセスに検証可能性を与える。
-
モデルの実行が自分のサーバー上ではないが、推論が正しく行われていることを保証したい場合。ZKMLを使えば、特定の入力とモデルに対して推論を実行し出力を得た後、ZKPによってそのプロセスが正しく実行されたことを証明できる。実行環境が自分のPC上になくても、ZKPの検証を通じて推論が正しく行われたことを確認でき、結果を信頼できる。
3. ZKMLのユースケース
-
計算完全性
-
オンチェーンAI(On-chain AI):AIモデルをブロックチェーン上にデプロイし、スマートコントラクトがAIモデルを使って意思決定を行う能力を持つようにする。
-
Modulus Labs:RockyBot On-chain verifiable ML trading bot(ブロックチェーン上での検証可能な機械学習取引ロボット)
-
-
自己改善型ブロックチェーン:ブロックチェーンがAIの能力を活用し、過去のデータに基づいて戦略を継続的に向上・修正していく。
-
AIを用いてLyra FinanceのAMMを強化する。
-
Astraly向けにAIベースの評判システムを構築する。
-
Aztecプロトコル向けに、スマートコントラクトレベルのAIベースコンプライアンス機能を提供する。
-
Modulus Labs: Blockchains that self-improve (link)
-
-
AIGCのオンチェーン化:AIGCによって生成されたコンテンツ/アート作品をブロックチェーン上にMintしてNFT化する。ZKにより生成プロセスの正当性を証明でき、使用されたデータセットに著作権保護された画像が含まれていないことも示せる。
-
ML as a Service (MLaaS) transparency (link)
-
AIセキュリティ:AIを用いた不正検出、シビル攻撃防止など。スマートコントラクトのデータをもとにAI異常検出モデルを訓練し、異常が検出されたらコントラクトを一時停止し、異常検出の証明をZKでオンチェーンに提出する。
-
オンチェーンZKMLゲーム:オンチェーンAIチェスプレイヤー、ニューラルネットワーク駆動のNFTキャラクターなど。
-
検証可能なAIモデルベンチマーク:ZKを用いてモデルのベンチマークテストの証明を提供し、モデルのパフォーマンスや効果に関するテスト結果に検証可能性を与える。
-
モデル訓練の正しさの証明:モデル訓練は非常にリソースを消費するため、ZKで訓練の正しさを証明することは現時点では実用的ではない。しかし、多くの人が技術的に可能だと考えており、特定のデータを使った/使っていないことをZKで証明することで、AIGCの著作権問題を解決しようとしている。
-
-
プライバシー保護
-
ウォレットのバイオ認証/デジタルアイデンティティ
-
WordCoinは生体認証デバイスOrbで虹彩をスキャンし、ユーザーに一意で検証可能なデジタルIDを提供している。WorldCoinはzkmlの研究を進めており、World IDのアップグレードを計画している。アップグレード後、ユーザーは自身の署名付き生体特徴量をモバイル端末の暗号化ストレージに自己管理でき、虹彩コード生成用のMLモデルをダウンロードし、ローカルでゼロ知識証明を生成して、虹彩コードが正しいモデルを使って署名済み画像から生成されたことを証明できるようになる。
-
-
ブロックチェーンベースの機械学習賞金プラットフォーム
-
企業が賞金を提供し、公開データと非公開データを提示する。公開データはモデル訓練に使い、非公開データは予測に使う。AIサービス提供者はモデルを訓練し、それをZK回路に変換する。モデルを暗号化してコントラクトに提出し検証する。非公開データに対して予測を行い結果を得てZK証明を生成し、証明をコントラクトに提出して検証する。一連の操作を完了したAIサービス提供者が賞金を得る。zkML: Demo for circomlib-ml on Goerli testnet
-
-
プライバシー保護された推論:例えば、個人患者のデータを医学診断に使い、感受性の高い推論結果(がん検出結果など)を患者に送信する。(vCNN paper, page 2/16)
-
4. ZKMLのエコシステム
SevenX Venturesが整理したZKMLのエコシステム図によると、以下のような分野がある。
-
ハードウェアアクセラレーション:複数の機関がZKPのハードウェアアクセラレーションを積極的に開発中であり、これはZKMLの発展にも寄与する。通常、FPGA、GPU、ASICチップを用いてZKP生成を高速化する。例えば、AccsealはZKPハードウェアアクセラレーション用のASICチップを開発中。IngonyamaはCUDA対応GPU向けのZKアクセラレーションライブラリICICLEを構築中。SupranationalはGPUアクセラレーションに注力。CysicとUlvetannaはFPGAアクセラレーションに注力。
-
入力:オンチェーンデータを入力として使うために、Axiom、Herodotus、Hyper Oracle、Lagrangeなどがブロックチェーンデータへのアクセスを改善し、より複雑なオンチェーンデータビューを提供する。そこから抽出した履歴データをMLの入力データとして利用できる。
-
推論:ModulusLabsはZKML専用の新しいzkSNARKシステムを開発中。これはZKMLツールセットと統合できる部分であり、主にモデルのZK化およびその過程で必要なツールの開発を行う。GizaはStarkNet上に基づく機械学習プラットフォームで、完全オンチェーンモデルのデプロイ拡張に注力している。
-
計算:分散型コンピューティングネットワークを構築し、誰でもアクセス可能なAIモデルの訓練を可能にする。エッジコンピューティングリソースを低コストで利用してAIモデルを訓練できるようにする。
-
分散型訓練/計算リソース:分散型コンピューティングネットワークを構築し、誰でもアクセス可能なAIモデルの訓練を可能にする。エッジコンピューティングリソースを低コストで利用してAIモデルを訓練できるようにする。
-
ZKMLツールセット:第5章の技術発展史を参照。図中のZAMAは主に完全準同型暗号(FHE)を用いて機械学習のプライバシー保護を行う。FHEMLはZKMLと比べてプライバシーのみを扱い、信頼不要な検証は行わない。
-
ユースケース:WorldcoinはZKMLを用いてデジタルIDの本人認証を行う。ユーザー端末内で署名済み生体特徴量を暗号化保管し、虹彩認識用の機械学習モデルをZK化して、本人認証時にモデルを実行し生体特徴量の一致を検証する。ZKPで実行プロセスの正しさを証明する。Modulars LabsはオンチェーンAI取引ロボットを開発。CathieのEIP7007はzkML AIGC-NFT標準。オンチェーンAIチェスプレイヤー、ニューラルネットワーク駆動のNFTキャラクターなど。

5. ZKMLの技術発展史
ニューラルネットワークをZK回路に変換する主な課題は以下の通り。
-
回路は固定小数点演算を必要とするが、ニューラルネットワークでは多数の浮動小数点数が使われる。
-
モデルサイズの問題。大規模モデルは変換が難しく、回路も巨大になる。
ZKMLライブラリの発展経緯は以下の通り。
- 2021年、zk-ml/linear-regression-demo、Peiyuan Liao
線形回帰回路を実装。線形回帰は非常に基本的な予測アルゴリズムで、出力変数と入力変数の線形関係を仮定し、数値型変数の予測や複数変数間の関係分析に適している。例:住宅面積などの特徴から住宅価格を予測、過去の販売データから将来の販売量を予測など。
- 2022年、0xZKML/zk-mnist、0xZKML
MNISTデータセットを用いてニューラルネットワークのZK回路を構築し、手書き数字を識別できるようにした。例:手書きの「2」を入力し、それが「2」と認識され、推論プロセスの証明が生成される。この証明はオンチェーンに載せられ、ethers + snarkjsでオンチェーン証明を検証できる。
実際には、zk-mnistライブラリは最終層のみを回路化しており、完全なニューラルネットワーク全体を回路化しているわけではない。
- 2022年、socathie/zkML、Cathie
zk-mnistと比べ、ZKMLは完全なニューラルネットワークを回路に変換している。CathieのzkMachineLearningは、MLエンジニアがモデルを回路に変換できるように、複数のZKMLツールキット(cirocmlib-ml、keras2circomなど)を提供している。
-
2022年11月、zk-ml/uchikoma、Peiyuan Liao
ニューラルネットワーク内の浮動小数点演算を固定小数点演算に変換。ほぼすべての機械学習アルゴリズムをブロックチェーンと容易に統合可能なゼロ知識証明回路に変換できる汎用ツールとフレームワークを創出し、オープンソース化した。
-
視覚モデル → AIGC
-
言語モデル → チャットボット、文章作成アシスタント
-
線形モデル・決定木 → 不正検出、シビル攻撃防止
-
マルチモーダルモデル → 推奨システム
ブロックチェーンに親和性のあるコンテンツ生成機械学習モデル(AIGC)を訓練し、ZK回路に変換。これを使ってアート作品を生成し、簡潔なZK証明を生成した後、アート作品をNFTとしてMintできる。
-
2022年7月、2023年3月アップデート、zkonduit/ezkl
ezklは、ディープラーニングモデルやその他の計算グラフのzk-SNARK(ZKML)における推論を行うためのライブラリおよびコマンドラインツール。証明システムとしてHalo2を使用。
ニューラルネットワークなどの計算グラフを定義し、ezklでZK-SNARK回路を生成できる。推論に対して生成されたZKPはスマートコントラクトで検証可能。
1億パラメータのモデルをサポートできるとされるが、非常にリソースを消費する可能性がある。
-
2023年5月、Ddkang/zkml (Link)
zkmlはGPT2、BERT、DiffusionモデルのZK化を宣言している。ただし非常に大きなメモリを要する可能性があり、証明をスマートコントラクトに格納できるかは不明。
zkmlはImageNet上で92.4%の精度を達成できることを検証可能であり、またMNISTモデルの証明を4秒以内に99%の精度で生成できる。
-
2023年5月、zkp-gravity/0g
ニューラルネットワークの軽量化を実現。非公開データ+公開モデルのサポート。
まとめると、ZKML技術の現在の探求方向は以下の通り。
-
Network Quantization(ネットワーク量子化):ニューラルネットワーク内の浮動小数点数を固定小数点数に変換し、ニューラルネットワークを軽量化(ZKフレンドリー化)。
-
大規模パラメータのニューラルネットワークをZK回路に変換し、証明効率を向上(ZK能力の拡張)。
6. まとめ
ZKMLはAIとブロックチェーンをつなぐ技術であり、ブロックチェーンが物理世界を認識し、スマートコントラクトが意思決定を行い、AIモデルをプライバシーを守って実行できるという意義を持ち、非常に有望な技術である。
ZKMLは歴史が浅く、発展が非常に速い。現在すでにいくつかのシンプルなニューラルネットワークモデルをZK回路に変換し、モデルまたは推論証明をオンチェーンに載せられるまでになっている。言語モデルについてはまだ難しいが、Ddkang/zkmlはGPT2、BERT、DiffusionモデルのZK版生成を宣言している。ネットワーク量子化技術、ZK技術、ブロックチェーンのスケーラビリティ技術の進展により、言語モデルのZKMLもやがて実用可能になると信じている。
TechFlow公式コミュニティへようこそ
Telegram購読グループ:https://t.me/TechFlowDaily
Twitter公式アカウント:https://x.com/TechFlowPost
Twitter英語アカウント:https://x.com/BlockFlow_News












