
ZKML: AI와 블록체인을 융합하여 프라이버시 보호가 가능한 모델 배포 기술
작성자: Maggie, Foresight Research

ZKML(제로 낯선 머신러닝)은 제로 낯선 증명을 머신러닝에 적용하는 기술이며, ZKML은 AI와 블록체인의 다리입니다. ZKML은 AI 모델/입력의 프라이버시 보호 문제와 추론 과정의 검증 가능성 문제를 해결하여 소형 모델 또는 추론의 ZKP를 블록체인에 올릴 수 있게 합니다. 모델/추론 증명을 블록체인에 올리는 의미는 다음과 같습니다.
-
블록체인이 물리 세계를 인식할 수 있게 함. 예를 들어: 블록체인 상에서 실행되는 얼굴 인식 모델은 블록체인에게 사람의 얼굴을 인식하게 하며, 이를 통해 블록체인은 그 얼굴이 여성일 가능성이 있고, 대략 몇 살 정도인지 등을 이해할 수 있습니다.
-
스마트 계약이 의사결정을 할 수 있게 함. 예: 체인 상의 WETH 가격 예측 모델은 스마트 계약이 거래 결정을 내리는 데 도움을 줄 수 있습니다.
-
AI 모델을 프라이버시를 보호하면서 실행. 예: 기업이 많은 컴퓨팅 파워를 들여 훈련한 모델을 외부에 프라이버시를 보장하는 방식으로 추론 서비스를 제공하고 싶거나, 사용자의 입력 정보를 비공개로 유지하고 싶을 경우. ZKML을 사용하면 모델/입력 정보의 프라이버시를 보장하면서도, 사용자에게 추론이 정확히 수행되었음을 증명함으로써 비신뢰적 추론을 실현할 수 있습니다.
ZKML의 활용 사례
-
체인 상 AI: AI 모델/AI 추론 증명을 블록체인에 올려 스마트 계약이 AI를 이용해 의사결정을 할 수 있도록 함. 예: 체인 상 거래 시스템, 체인 상 투자 결정 등.
-
자기 개선 블록체인: 블록체인이 AI 기능을 활용해 역사 데이터를 바탕으로 전략을 지속적으로 향상시키고 수정할 수 있게 함. 예: AI 기반 체인 상 평판 시스템.
-
AIGC를 체인에 연결: AIGC가 생성한 콘텐츠/예술 작품을 블록체인에 민팅하여 NFT로 만듦. ZK는 생성 과정의 정확성을 증명하며, 저작권 보호된 이미지가 데이터셋에 포함되지 않았음을 입증할 수 있음.
-
지갑의 생체 인증(KYC): 얼굴 인식 증명을 블록체인에 올려 지갑이 KYC를 완료함.
-
AI 보안: AI를 이용한 사기 탐지, 시브일 공격(Sybil Attack) 방지 등.
-
체인 상 ZKML 게임: 체인 상 인공지능 체스 플레이어, 신경망 기반 NFT 캐릭터 등.
ZKML 기술 현황
-
목표: 신경망을 ZK 회로로 변환. 어려운 점: 1. ZK 회로는 부동소수점 연산을 지원하지 않음, 2. 규모가 큰 신경망은 변환이 어렵고 회로 크기가 너무 큼.
-
현재 진행 상황: 최초의 ZKML 라이브러리는 2년 전에 나왔으며, 전체 기술 발전 역사는 매우 짧습니다. 현재 최신 ZKML 라이브러리는 일부 간단한 신경망을 ZK화하여 블록체인에 적용할 수 있습니다. 기본적인 선형 회귀 모델을 블록체인에 올릴 수 있으며, 기타 소규모 신경망 모델들도 증명 후 블록체인에 올릴 수 있다고 알려져 있습니다. 그러나 실제 데모는 거의 없으며, 손글씨 숫자 인식 하나만 확인되었습니다. 일부 도구는 1억(100M) 매개변수까지 지원한다고 주장하며, GPT2를 ZK 회로로 변환해 ZK 증명을 생성할 수 있다고도 합니다.
-
향후 방향: 네트워크 양자화(Network Quantization)를 통해 신경망의 부동소수점을 고정소수점으로 변환하고, 신경망을 경량화(ZK 친화적)합니다. 또한 대규모 매개변수 신경망을 ZK 회로로 변환하고, 증명 효율을 향상시켜(ZK 능력 확대) 더 큰 모델을 처리하려는 연구가 진행 중입니다.
요약
ZKML은 AI와 블록체인의 다리이며, 블록체인이 물리 세계를 인식하고, 스마트 계약이 의사결정을 하며, AI 모델을 프라이버시 보호 상태로 실행할 수 있게 해주는 매우 유망한 기술입니다.
이 기술은 역사가 짧지만 매우 빠르게 발전하고 있으며, 현재 이미 일부 간단한 신경망 모델을 ZK 회로로 변환하여 모델 자체나 추론 증명을 블록체인에 올릴 수 있는 수준에 도달했습니다. 언어 모델은 여전히 어려운데, 현재 Ddkang/zkml은 GPT2, Bert 및 Diffusion 자연어 처리 모델의 ZK 버전을 생성할 수 있다고 주장하지만 실제 성능은 불분명하며, 실행은 가능하더라도 블록체인에 올릴 수 있을지는 미지수입니다. 네트워크 양자화 기술, ZK 기술, 블록체인 확장 기술의 발전과 함께 언어 모델의 ZKML도 곧 실용화될 것으로 기대됩니다.
1. 배경
(ZK, ML에 대해 잘 알고 계시다면 이 장은 건너뛰셔도 됩니다).
제로 낯선 증명(ZK): 제로 낯선 증명이란 검증자에게 어떠한 유용한 정보도 제공하지 않으면서도 검증자로 하여금 특정 명제가 참임을 믿게 하는 증명 방식입니다. ZK는 주로 계산 과정의 정확성을 증명하고 개인정보를 보호하는 데 사용됩니다.
계산 과정의 정확성 증명: 예를 들어 ZK-rollup의 경우, 여러 트랜잭션을 한 번에 묶어 L1에 게시하면서 동시에 이 트랜잭션이 유효하다는 것을 증명하기 위해 제로 낯선 증명 기술을 사용합니다. L1에서 이 증명이 유효함이 검증되면 zk-rollup의 상태가 업데이트됩니다.
프라이버시 보호: Aztec 프로토콜을 예로 들면, Aztec의 zk.money에서 자산은 티켓 형태로 존재하며, 비트코인의 UTXO와 유사합니다. 티켓의 금액은 암호화되어 있으며, 사용자가 송금할 때는 기존 티켓을 소각하고 수취인에게 새로운 티켓과 잔돈을 자신에게 다시 생성합니다. 제로 낯선 증명은 소각한 티켓과 새로 생성한 티켓의 금액이 같으며, 사용자가 해당 티켓을 소유하고 있다는 사실을 프라이버시를 보호하면서 증명하는 데 사용됩니다.
머신러닝: 머신러닝은 인공지능의 한 분야입니다. 머신러닝 이론은 컴퓨터가 자동으로 "학습"할 수 있는 알고리즘을 설계하고 분석하는 데 초점을 맞춥니다. 머신러닝 알고리즘은 데이터로부터 자동으로 규칙을 추출하고, 이를 통해 미지의 데이터를 예측하는 데 사용됩니다. 머신러닝은 컴퓨터 비전, 자연어 처리, 생체 인식, 검색 엔진, 의료 진단, 신용카드 사기 탐지, 증권시장 분석, DNA 서열 정렬, 음성 및 필기 인식, 게임, 로봇 공학 등 다양한 분야에 널리 적용되고 있습니다.
2. ZKML이 해결하는 문제는?
ZKML은 최근 2년간 암호학계에서 큰 화제가 된 연구 및 개발 분야입니다. 머신러닝에 제로 낯선 증명을 적용한다는 이 기술의 주요 목표는 제로 낯선 증명을 통해 머신러닝의 프라이버시 보호 및 검증 가능성 문제를 해결하는 것입니다. 이를 통해 소형 모델이나 추론의 ZKP를 블록체인에 올릴 수 있게 되며, AI와 블록체인 사이의 다리 역할을 하게 됩니다.
-
모델을 블록체인에 올림: ML 모델을 ZK 회로로 변환하여 작은 ZKML 모델을 블록체인 스마트 계약 내에 저장할 수 있습니다. 사용자는 스마트 계약 메서드를 호출하여 모델을 사용할 수 있습니다. 예: Modulus Labs의 RockyBot은 WETH 가격을 예측하는 체인 상 AI 모델을 만들어 거래 결정에 활용하고 있습니다.
-
모델 추론 증명 등을 블록체인에 올림: ML 모델을 ZK 회로로 변환한 후 오프체인에서 추론을 수행하고 ZK 증명을 생성합니다. 이 ZK 증명은 추론 과정이 정확히 수행되었음을 입증합니다. 추론 결과와 ZK 증명은 체인에 제출되어 호출자가 참고하거나 스마트 계약이 증명을 검증하는 데 사용됩니다.
모델/추론 증명을 블록체인에 올리는 것이 어떤 의미인가?
-
블록체인이 물리 세계를 인식할 수 있게 함. 예: 블록체인 상에서 실행되는 얼굴 인식 모델은 블록체인에게 사람의 얼굴을 인식하게 하며, 이를 통해 블록체인은 그 얼굴이 여성일 가능성이 있고, 대략 몇 살 정도인지 등을 이해할 수 있습니다.
-
스마트 계약이 의사결정을 할 수 있게 함. 예: 체인 상의 WETH 가격 예측 모델은 스마트 계약이 거래 결정을 내리는 데 도움을 줄 수 있습니다.
-
AI 모델을 프라이버시를 보호하면서 실행. 예: 기업이 많은 컴퓨팅 파워를 들여 훈련한 모델을 외부에 프라이버시를 보장하는 방식으로 추론 서비스를 제공하고 싶거나, 사용자의 입력 정보를 비공개로 유지하고 싶을 경우. ZKML을 사용하면 모델/입력 정보의 프라이버시를 보장하면서도, 사용자에게 추론이 정확히 수행되었음을 증명함으로써 비신뢰적 추론을 실현할 수 있습니다.
ZKML에서 제로 낯선 증명의 역할:
1. 프라이버시 보호: ML 모델 또는 예측 과정 중 입력 데이터의 프라이버시를 보호.
-
데이터 프라이버시 (공개 모델 + 비공개 데이터): 저는 의료 데이터, 얼굴 이미지 등 민감한 데이터를 가지고 있습니다. 이러한 데이터에 대해 ZKML을 사용해 프라이버시를 보호하면서 공개된 신경망 모델을 실행하고 결과를 얻을 수 있습니다. 예: 얼굴 인식 모델.
-
모델 프라이버시 (비공개 모델 + 공개 데이터): 예를 들어 제가 막대한 비용을 들여 훈련한 모델을 외부에 노출하고 싶지 않을 경우, 모델 자체를 보호해야 합니다. ZKML을 사용하면 비공개 신경망 모델을 보호하면서도 공개된 입력에 대해 추론을 수행하고 출력을 생성할 수 있습니다.
2. 검증 가능성: ZKP를 통해 ML 추론 과정이 정확히 수행되었음을 입증하여 머신러닝 과정에 검증 가능성을 부여.
-
예를 들어, 모델 실행이 내 서버에서 이루어지지 않지만 추론이 정확히 수행되었음을 보장받고 싶을 경우. 나는 ZKML을 사용해 특정 입력과 모델로 추론을 수행하고 출력을 생성하며, ZKP는 이 과정이 정확히 수행되었음을 증명합니다. 실행이 내 컴퓨터에서 이루어지지 않았더라도, 나는 ZKP를 검증함으로써 추론이 정확히 수행되었는지 확인하고 그 결과를 신뢰할 수 있습니다.
3. ZKML의 활용 사례
-
계산 무결성
-
체인 상 AI(On-chain AI): AI 모델을 블록체인에 배포하여 스마트 계약이 AI 모델을 통해 의사결정 능력을 갖도록 함.
-
Modulus Labs: RockyBot On-chain verifiable ML trading bot (체인 상 검증 가능한 머신러닝 거래 로봇)
-
-
자기 개선 블록체인: 블록체인이 AI 기능을 활용해 역사 데이터를 바탕으로 전략을 지속적으로 향상시키고 수정할 수 있게 함.
-
인공지능을 통해 Lyra finance의 AMM을 강화.
-
Astraly를 위한 AI 기반 평판 시스템 구축.
-
Aztec 프로토콜을 위한 AI 기반 컴플라이언스 기능을 스마트 계약 수준에서 구현.
-
Modulus Labs: Blockchains that self-improve (링크):
-
-
AIGC를 체인에 연결: AIGC가 생성한 콘텐츠/예술 작품을 블록체인에 민팅하여 NFT로 만들고, ZK를 통해 생성 과정의 정확성을 입증하며, 데이터셋에 저작권 보호된 이미지가 포함되지 않았음을 증명.
-
ML as a Service (MLaaS) 투명성 (링크)
-
AI 보안: AI를 이용한 사기 탐지, 시브일 공격 방지 등. 스마트 계약 데이터를 기반으로 AI 이상 탐지 모델을 훈련시키고, 지표가 비정상일 경우 계약을 일시 중지하며, 이상 탐지 증명을 ZK로 생성하여 체인에 올림.
-
체인 상 ZKML 게임: 체인 상 인공지능 체스 플레이어, 신경망 기반 NFT 캐릭터 등.
-
검증 가능한 AI 모델 벤치마킹: ZK를 통해 모델 벤치마킹 증명을 제공하여 모델의 성능 및 효과 테스트 결과에 대한 검증 가능성을 제공.
-
모델 훈련의 정확성 증명: 모델 훈련은 매우 리소스를 많이 소모하므로, 현재로서는 ZK를 통한 모델 훈련 정확성 증명은 불가능하지만, 많은 사람들이 기술적으로는 가능하다고 보며, ZK를 사용해 모델이 특정 데이터를 사용했는지/사용하지 않았는지를 증명함으로써 AIGC의 저작권 문제를 해결하고자 노력하고 있습니다.
-
-
프라이버시 보호
-
지갑의 생체 인증 / 디지털 신원
-
WordCoin은 생체 인식 장치 Orb를 통해 홍채를 스캔하여 사용자에게 고유하고 검증 가능한 디지털 신원을 제공하고 있습니다. WorldCoin은 현재 zkml을 연구 중이며, World ID를 업그레이드할 계획입니다. 업그레이드 후에는 사용자가 자신의 서명된 생체 특징을 모바일 기기의 암호화된 저장소에 직접 보관하고, 홍채 코드 생성용 ML 모델을 다운로드한 후 로컬에서 제로 낯선 증명을 생성하여, 자신의 홍채 코드가 올바른 모델을 통해 서명된 이미지에서 생성되었음을 입증할 수 있게 됩니다.
-
-
블록체인 기반 머신러닝 보상 플랫폼
-
기업이 보상을 걸고 공개 데이터와 비공개 데이터를 제공합니다. 공개 데이터는 모델 훈련용, 비공개 데이터는 예측용입니다. AI 서비스 제공업체들이 모델을 훈련시킨 후 이를 ZK 회로로 변환합니다. 암호화된 모델을 스마트 계약에 제출하여 검증합니다. 비공개 데이터에 대해 예측을 수행하고 결과를 얻으며, ZK 증명을 생성하여 스마트 계약에 제출해 검증을 받습니다. 일련의 작업을 완료한 후 보상을 획득합니다. zkML: Goerli 테스트넷에서 circomlib-ml의 데모.
-
-
프라이버시 보호 추론: 예를 들어 개인 환자 데이터를 의료 진단에 사용한 후, 민감한 추론 결과(예: 암 검출 결과)를 환자에게 전송.(vCNN 논문, 2/16페이지)
-
4. ZKML 생태계 현황
SevenX Ventures가 정리한 ZKML 생태계를 기준으로 설명합니다.
-
하드웨어 가속: 여러 기관이 ZKP의 하드웨어 가속을 적극적으로 개발 중이며, 이는 ZKML의 발전에도 긍정적인 영향을 줍니다. 일반적으로 FPGA, GPU 및 ASIC 칩을 통해 ZKP 생성을 가속화합니다. 예: Accseal은 ZKP 하드웨어 가속용 ASIC 칩 개발 중, Ingonyama은 CUDA 지원 GPU용 ZK 가속 라이브러리 ICICLE을 구축 중, Supranational은 GPU 가속에 집중, Cysic과 Ulvetanna는 FPGA 가속에 집중.
-
입력: 체인 상 데이터 입력을 위해 Axiom, Herodotus, Hyper Oracle, Lagrange는 사용자의 블록체인 데이터 접근성을 향상시키고 보다 복잡한 체인 상 데이터 뷰를 제공합니다. 이후 이러한 역사 데이터에서 ML 입력 데이터를 추출할 수 있습니다.
-
추론: ModulusLabs는 ZKML 전용 새로운 zkSNARK 시스템을 개발 중입니다. 이 부분은 ZKML 도구 모음과 통합될 수 있으며, 주로 모델의 ZK화와 그 과정에서 필요한 도구 모음을 개발하는 데 집중합니다. Giza는 StarkNet 기반의 머신러닝 플랫폼으로, 완전 체인 상 모델 배포 확장을 중심으로 운영됩니다.
-
컴퓨팅: 누구나 접근 가능한 AI 모델을 훈련하기 위한 탈중앙화 컴퓨팅 네트워크 구축에 집중. 사용자들이 더 낮은 비용으로 에지 컴퓨팅 리소스를 활용해 AI 모델을 훈련할 수 있도록 합니다.
-
탈중앙화 훈련 / 컴퓨팅 파워: 누구나 접근 가능한 AI 모델을 훈련하기 위한 탈중앙화 컴퓨팅 네트워크 구축에 집중. 사용자들이 더 낮은 비용으로 에지 컴퓨팅 리소스를 활용해 AI 모델을 훈련할 수 있도록 합니다.
-
ZKML 도구 모음: 5장 기술 발전 역사 참조. 도표에서 ZAMA는 전형 동형 암호(FHE)를 사용해 머신러닝의 프라이버시를 보호하며, FHEML은 ZKML과 비교해 프라이버시만 보호하고 무신뢰 검증은 하지 않습니다.
-
사례: Worldcoin은 ZKML을 사용해 디지털 신원 인증을 수행. 사용자 기기 내 암호화된 저장소에 서명된 생체 특징을 보관하고, 홍채 인식용 머신러닝 모델을 ZK화하여 신원 인식 시 모델을 실행하고 생체 특징 일치 여부를 검증. ZKP로 실행 과정의 정확성을 증명. Modulus Labs는 체인 상 AI 거래 로봇을 개발. Cathie의 EIP7007은 zkML 기반 AIGC-NFT 표준. 체인 상 인공지능 체스 플레이어, 신경망 기반 NFT 캐릭터 등.

5. ZKML 기술 발전 역사
신경망을 ZK 회로로 변환하는 주요 난제는 다음과 같습니다.
-
회로는 고정소수점 연산을 필요로 하지만, 신경망은 부동소수점을 광범위하게 사용합니다.
-
모델 크기 문제: 대규모 모델은 변환 난이도가 높고 회로 크기도 큽니다.
ZKML 라이브러리의 발전 과정은 다음과 같습니다.
- 2021년, zk-ml/linear-regression-demo, Peiyuan Liao
선형 회귀 회로를 구현. 선형 회귀는 매우 기초적인 예측 알고리즘으로, 출력 변수와 입력 변수 간의 선형 관계를 가정하며, 수치형 변수 예측 및 두 개 이상의 변수 간 관계 분석에 적합합니다. 예: 주택 면적 및 기타 특성에 따라 주택 가격 예측, 혹은 역사 판매 데이터를 기반으로 미래 판매량 예측 등.
- 2022년, 0xZKML/zk-mnist, 0xZKML
MNIST 데이터셋을 기반으로 신경망 ZK 회로를 구현하여 손글씨 숫자를 인식할 수 있게 함. 예: 손으로 '2'를 쓰면, 그 글씨체가 '2'로 인식되고 추론 과정의 증명이 생성됨. 이 증명은 체인에 올릴 수 있으며, ethers + snarkjs를 사용해 체인 상 증명을 검증할 수 있음.
실제로 zk-mnist 라이브러리는 현재 마지막 층만 회로로 변환했으며, 전체 신경망을 회로로 변환한 것은 아닙니다.
- 2022년, socathie/zkML, Cathie
zk-mnist보다 진보된 점은 ZKML이 전체 신경망을 회로로 변환했다는 것입니다. Cathie의 zkMachineLearning은 cirocmlib-ml, keras2circom 등 ML 엔지니어가 모델을 회로로 변환할 수 있도록 돕는 여러 ZKML 도구 모음을 제공합니다.
-
2022년 11월, zk-ml/uchikoma, Peiyuan Liao
신경망의 부동소수점 연산을 고정소수점 연산으로 전환. 거의 모든 머신러닝 알고리즘을 블록체인과 쉽게 통합할 수 있는 제로 낯선 증명 회로로 변환할 수 있는 범용 도구와 프레임워크를 개발하고 오픈소스화.
-
시각 모델 → AIGC
-
언어 모델 → 챗봇, 글쓰기 보조
-
선형 모델 및 결정 트리 → 사기 탐지, 시브일 공격 방지
-
다중 모달 모델 → 추천 시스템
블록체인 친화적인 콘텐츠 생성 머신러닝 모델(AIGC)을 훈련시켜 ZK 회로로 변환. 이를 사용해 예술 작품을 생성하고 간결한 ZK 증명을 생성한 후, 예술 작품을 NFT로 민팅할 수 있음.
-
2022년 7월 출시, 2023년 3월 업데이트, zkonduit/ezkl
ezkl은 딥러닝 모델 및 기타 계산 그래프의 추론을 zk-snark(ZKML)에서 수행하기 위한 라이브러리 및 명령줄 도구입니다. 증명 시스템으로 Halo2를 사용합니다.
신경망과 같은 계산 그래프를 정의한 후 ezkl을 사용해 ZK-SNARK 회로를 생성할 수 있습니다. 추론을 위해 생성된 ZKP는 스마트 계약에서 검증할 수 있습니다.
최대 1억(100M) 매개변수 모델을 지원한다고 하나, 리소스 소모가 클 수 있음.
-
2023년 5월, Ddkang/zkml (링크)
zkml은 GPT2, Bert, Diffusion 모델을 ZK화할 수 있다고 주장합니다. 그러나 메모리를 상당히 많이 사용할 수 있으며, 생성된 증명을 스마트 계약에 저장할 수 있는지는 불확실합니다.
zkml은 ImageNet에서 92.4% 정확도를 달성한 모델의 실행을 검증할 수 있으며, MNIST 모델의 경우 4초 이내에 99% 정확도로 증명을 생성할 수 있습니다.
-
2023년 5월, zkp-gravity/0g
경량화된 신경망을 지원하며, 비공개 데이터+공개 모델을 처리할 수 있음.
종합적으로, 현재 ZKML 기술의 탐색 방향은 다음과 같습니다.
-
네트워크 양자화(Network Quantization): 신경망의 부동소수점을 고정소수점으로 변환하고, 신경망을 경량화(ZK 친화적).
-
대규모 매개변수 신경망을 ZK 회로로 변환하고 증명 효율을 향상시켜(ZK 능력 확대) 더 큰 모델을 처리하려는 노력.
6. 결론
ZKML은 AI와 블록체인의 다리이며, 블록체인이 물리 세계를 인식하고, 스마트 계약이 의사결정을 하며, AI 모델을 프라이버시를 보호하면서 실행할 수 있게 한다는 점에서 매우 유망한 기술입니다.
ZKML은 역사가 짧지만 매우 빠르게 발전하고 있으며, 현재 이미 일부 간단한 신경망 모델을 ZK 회로로 변환하여 모델 자체나 추론 증명을 블록체인에 올릴 수 있는 수준에 도달했습니다. 언어 모델은 여전히 어려운데, 현재 Ddkang/zkml은 GPT2, Bert 및 Diffusion 모델의 ZK 버전을 생성할 수 있다고 주장합니다. 네트워크 양자화 기술, ZK 기술, 블록체인 확장 기술의 발전과 함께 언어 모델의 ZKML도 곧 실용화될 것으로 기대됩니다.
TechFlow 공식 커뮤니티에 오신 것을 환영합니다
Telegram 구독 그룹:https://t.me/TechFlowDaily
트위터 공식 계정:https://x.com/TechFlowPost
트위터 영어 계정:https://x.com/BlockFlow_News












