
ゼロ知識機械学習(ZKML):ZKとAIはどのような火花を散らすのか?
TechFlow厳選深潮セレクト

ゼロ知識機械学習(ZKML):ZKとAIはどのような火花を散らすのか?
本稿では、ZKML構築の動機、現在の取り組みおよび潜在的な応用分野について紹介する。
執筆:dcbuilder.eth, Worldcoin
翻訳:TechFlow
ゼロ知識機械学習(ZKML)は、暗号分野で最近大きな注目を集めている研究・開発分野です。しかし、それは一体何なのか、どのような利点があるのでしょうか?まず、この用語を2つの構成要素に分解し、それぞれの意味を説明しましょう。
ZKとは何か?
ゼロ知識証明とは、一方(証明者)が他方(検証者)に対して、ある命題が真であることを、その命題が真であること以外の追加情報を一切漏らさずに証明できる暗号プロトコルです。これは研究からプロトコルの実装、応用まで幅広く、急速な進展を見せている分野です。
ZKが提供する主な「プリミティブ」(つまり基本構成要素)は二つあります。一つは、特定の計算について、計算自体を実行するよりもはるかに簡単に生成できる「計算完全性の証明」を作成できる能力です(この性質を「簡潔性」と呼びます)。もう一つは、計算の一部を隠しつつも計算の正しさを保証できるという性質です(これを「ゼロ知識性」と呼びます)。
ゼロ知識証明の生成には非常に大きな計算量が必要であり、元の計算に比べて約100倍のコストがかかります。つまり、最適なハードウェアでも生成に時間がかかりすぎるため、実用上不可能な場合があります。
しかし近年、暗号学、ハードウェア、分散システム分野での進歩により、ゼロ知識証明はますます現実的な計算手段となっています。これらの進展により、計算量の多い証明を利用できるプロトコルの設計が可能になり、新しいアプリケーションの設計空間が広がっています。
ZKのユースケース
ゼロ知識暗号は、スケーラブルかつ/またはプライバシー保護型のアプリケーションを構築できるため、Web3分野で最も人気のある技術の一つです。以下は、実際にどのように使われているかの例です(ただし、これらプロジェクトの多くはまだ進行中であることに注意してください):
1. ZK rollupによるイーサリアムのスケーリング
-
Starknet
-
Scroll
-
Polygon Zero、Polygon Miden、Polygon zkEVM
-
zkSync
2. プライバシー保護型アプリケーションの構築
-
Semaphore
-
MACI
-
Penumbra
-
Aztec Network
3. アイデンティティのプリミティブとデータソース
-
WorldID
-
Sismo
-
Clique
-
Axiom
4. レイヤー1プロトコル
-
Zcash
-
Mina
ZK技術が成熟するにつれ、専門知識がそれほど必要なくなり、開発者が使いやすくなることで、新たなアプリケーションが爆発的に登場すると私たちは信じています。
機械学習
機械学習(ML)は人工知能(AI)の一分野であり、コンピュータが明示的なプログラミングなしに経験から自動的に学習・改善することを可能にします。アルゴリズムや統計モデルを用いてデータ内のパターンを分析・識別し、そのパターンに基づいて予測や意思決定を行います。機械学習の最終目標は、人間の介入なしに適応的に学習でき、医療、金融、交通などさまざまな分野で複雑な問題を解決できるインテリジェントなシステムを開発することです。
最近では、chatGPTやBardのような大規模言語モデル(LLM)、あるいはDALL-E 2、Midjourney、Stable Diffusionなどのテキストから画像を生成するモデルの進展を目にしてきたことでしょう。こうしたモデルがますます高度化し、より多様なタスクをこなせるようになる中で、ある出力が人間によるものか、それともモデルによるものかを区別することが極めて重要になっています。次章では、この点について考察します。
ZKMLの動機と現在の取り組み
我々は今、AI/MLが生成するコンテンツと人間が生成するコンテンツの区別がますます困難になっている世界に生きています。ゼロ知識暗号技術を使えば、「あるコンテンツCは、入力XにモデルMを適用して生成されたものである」という主張を証明できます。大規模言語モデル(chatGPTなど)やテキスト→画像モデル(DALL-E 2など)のように、ゼロ知識回路表現を作成した任意のモデルについて、その出力が本当にそのモデルによって生成されたかどうかを検証できるようになります。そしてZKの「ゼロ知識性」により、必要に応じて入力やモデルの一部を秘匿したまま証明可能です。例えば、医療分野において、患者の機微なデータを第三者に開示せずに、モデル推論後の結果だけをユーザーが確認できるのです。
注:ここでいうZKMLとは、MLモデルの「学習」ではなく、「推論ステップ」のゼロ知識証明を作成することを指しています(学習プロセス自体はすでに非常に計算集約的です)。現時点では、最先端のZKシステムと高性能ハードウェアを組み合わせても、現存するような大規模言語モデル(LLM)の証明を行うには、まだ数桁の性能差があります。しかし、小規模なモデルについては、すでにいくつかの進展が見られています。
我々は、MLモデルの証明におけるゼロ知識暗号の現状について調査を行い、関連する研究、記事、アプリケーション、コードベースをまとめた資料を作成しました。ZKMLに関するリソースは、GitHub上のZKMLコミュニティのawesome-zkmlリポジトリで公開されています。
Modulus Labsチームは最近、「スマートネスのコスト(The Cost of Intelligence)」という論文を発表し、既存のZK証明システムをベンチマークし、さまざまなサイズのモデルについて評価しています。現時点で、plonky2のような証明システムを使い、強力なAWSマシン上で約50秒間実行することで、約1800万パラメータのモデルの証明を生成できます。以下は、同論文に掲載されている図です:
ZKML技術の水準向上を目指す別の取り組みとして、Zkonduitのezklライブラリがあります。これはONNX形式でエクスポートされたMLモデルに対してZK証明を作成できるようにするものです。これにより、MLエンジニアであれば誰でも自分のモデルの推論ステップについてZK証明を作成し、適切に実装された検証器に対して出力を証明できるようになります。
ZK技術の改良、ZK証明内での演算向けの最適化ハードウェアの開発、特定ユースケース向けのプロトコル最適化などを目指すチームが複数存在します。技術が成熟すれば、より強力でないマシンでも短時間で大規模モデルのZK証明が可能になります。こうした進展により、新たなZKMLアプリケーションやユースケースが生まれることを期待しています。

潜在的なユースケース
ZKMLが特定のアプリケーションに適しているかを判断するには、ZK暗号の特性が機械学習に関連する課題をどう解決できるかを考えるとよいでしょう。以下のベン図で説明できます:
定義:
1. ヒューリスティック最適化――従来の最適化手法ではなく、経験則や「ヒューリスティック」を用いて難しい問題に対する良い解を見つけるアプローチ。ヒューリスティック最適化は、最適解を求めず、一定の時間内に「十分良い」解を見つけることを目的としています。
2. FHE ML ―― 完全準同型暗号(FHE)を用いたMLにより、開発者はプライバシーを守りながらモデルの訓練や推論が可能になります。しかし、ZK証明とは異なり、実行された計算の正しさを暗号的に証明する手段はありません。
-
Zama.aiなどのチームがこの分野で活動しています。
3. ZK vs Validity ―― 業界ではこれらの用語がしばしば混同されます。有効性証明(validity proof)は、計算やその結果の一部を隠さないZK証明のことです。ZKMLの文脈では、多くの現行アプリケーションがZK証明の「有効性証明」側面を利用しています。
4. Validity ML ―― 計算や結果を秘匿せず、MLモデルの計算の正しさを証明するZK証明。
以下に、ZKMLの潜在的なユースケースの例を示します:
1. 計算完全性(Validity ML)
-
Modulus Labs
-
チェーン上で検証可能なML取引BOT ― RockyBot
自己進化型ビジュアルブロックチェーン(例):
-
Lyra金融オプションプロトコルAMMのスマート機能の強化
-
Astraly向けに透明なAIベースの評判システムを構築(ZKオラクル)
-
Aztec Protocol(プライバシー機能付きzk-rollup)において、契約レベルのコンプライアンスツールに必要な技術的飛躍を達成するためにMLを活用
2. 機械学習即サービス(MLaaS)の透明性
3. ZKによる異常/不正検出
-
このユースケースでは、悪用/不正行為に対するZK証明の作成が可能になります。異常検出モデルをスマートコントラクトのデータで学習させ、DAOが重要な指標として合意すれば、より積極的かつ予防的にコントラクトを一時停止するなどの自動化されたセキュリティ処理が可能になります。すでに複数のスタートアップが、スマートコントラクト環境におけるMLモデルのセキュリティ用途について研究しており、ZK異常検出証明は自然な次のステップと言えます。
4. ML推論の汎用有効性証明:与えられたモデルと入力から得られた出力であることを容易に証明・検証できるようにする。
5. プライバシー(ZKML)
6. 分散型Kaggle:テストデータに対するモデルの精度がx%以上であることを、重みを公開せずに証明可能。
7. プライバシー保護型推論:個人の患者データを医療診断モデルに入力し、機微な推論結果(がん検査の結果など)を患者に送信。
8. Worldcoin:
-
IrisCodeのアップグレード性:World IDユーザーは、モバイル端末の暗号化ストレージに生体情報を自己保管し、IrisCode生成用のMLモデルをダウンロードして、ローカルでゼロ知識証明を作成することで、IrisCodeが正常に生成されたことを証明できます。このIrisCodeは、受信側のスマートコントラクトがゼロ知識証明を検証できるため、登録済みのWorldcoinユーザーに無許可で挿入可能です。つまり、Worldcoinが将来、以前のバージョンとの互換性を失う形でMLモデルをアップグレードしても、ユーザーはOrb(眼球スキャナー)に行き直すことなく、端末上でゼロ知識証明をローカルに生成できるようになります。
-
Orbのセキュリティ:現在、Orbは信頼された環境内で複数の不正・改ざん検出メカニズムを実行しています。しかし、画像撮影およびIrisCode生成時にこれらのメカニズムが稼働していたことを示すゼロ知識証明を作成することで、IrisCode生成プロセス全体を通じてこれらのメカニズムが確実に動作していたと証明でき、Worldcoinプロトコルの真正性保証をさらに高めることができます。
まとめると、ZKML技術には広範な応用可能性があり、急速に進化しています。ますます多くのチームや個人がこの分野に参入する中で、ZKMLのユースケースはさらに多様化・拡大していくことでしょう。
TechFlow公式コミュニティへようこそ
Telegram購読グループ:https://t.me/TechFlowDaily
Twitter公式アカウント:https://x.com/TechFlowPost
Twitter英語アカウント:https://x.com/BlockFlow_News














