제로지식 머신러닝(ZKML): ZK와 AI가 만나 어떤 불꽃을 피울 것인가?

2023.04.06

제로지식 머신러닝(ZKML): ZK와 AI가 만나 어떤 불꽃을 피울 것인가?

본 글에서는 ZKML 구축의 동기와 현재의 노력, 잠재적인 응용 분야에 대해 소개할 것이다.

2023.04.06 - 05:00:56

ZKML

Web3 심층 보도에 집중하고 흐름을 통찰

본 글에서는 ZKML 구축의 동기와 현재의 노력, 잠재적인 응용 분야에 대해 소개할 것이다.

작성: dcbuilder.eth, Worldcoin

번역: TechFlow

제로노울리지 머신러닝(ZKML)은 암호학 분야에서 최근 큰 관심을 받고 있는 연구 및 개발 분야이다. 하지만 정확히 무엇이며 어떤 용도로 쓰일까? 우선 이 용어를 두 부분으로 나누어 각각의 의미를 설명해보자.

ZK란 무엇인가?

제로노울리지 증명이란 한 당사자(증명자)가 다른 당사자(검증자)에게 특정 진술이 참임을 증명하면서 그 진술 자체 외에는 추가 정보를 전혀 공개하지 않는 암호 프로토콜이다. 이는 연구부터 프로토콜 구현 및 응용에 이르기까지 모든 측면에서 빠르게 발전하고 있는 분야이다.

ZK가 제공하는 두 가지 주요 "원시 요소"(또는 구성 요소)는 다음과 같다. 첫째, 주어진 계산에 대해 계산 무결성 증명을 생성할 수 있는 능력인데, 이 증명 과정이 원래 계산 수행보다 훨씬 쉬워야 한다. (이 속성을 우리는 "간결성"이라고 부른다.) 둘째, 계산의 일부를 숨기면서도 계산의 정확성을 유지할 수 있는 기능이다. (이 속성을 우리는 "제로노울리지성"이라고 부른다.)

제로노울리지 증명을 생성하는 것은 매우 큰 계산량을 필요로 하며, 일반적으로 원래 계산보다 약 100배 정도 더 비용이 든다. 즉, 최적의 하드웨어에서도 생성에 너무 오랜 시간이 걸리는 경우가 있어 실용적이지 않아 제로노울리지 증명을 계산할 수 없는 상황도 존재한다.

그러나 최근 암호학, 하드웨어 및 분산 시스템 분야의 발전으로 인해 제로노울리지 증명은 점점 더 강력한 계산 가능성 옵션이 되고 있다. 이러한 발전은 계산 집약적인 증명을 사용할 수 있는 프로토콜의 설계 가능성을 열어주었으며, 새로운 애플리케이션의 설계 공간을 확장시켰다.

ZK 활용 사례

제로노울리지 암호학은 Web3 분야에서 가장 인기 있는 기술 중 하나로서, 개발자들이 확장 가능하거나 개인정보 보호 기능을 갖춘 애플리케이션을 구축할 수 있게 해준다. 다음은 실제 적용 예시들이다. (다만 이 프로젝트들 대부분이 아직 진행 중이라는 점에 유의하자.)

1. ZK 롤업을 통한 이더리움 확장

Starknet
Scroll
Polygon Zero, Polygon Miden, Polygon zkEVM
zkSync

2. 개인정보 보호 애플리케이션 구축

Semaphore
MACI
Penumbra
Aztec Network

3. 신원 원시 요소 및 데이터 소스

WorldID
Sismo
Clique
Axiom

4. 1단계(Layer 1) 프로토콜

Zcash
Mina

ZK 기술이 성숙함에 따라, 해당 도구들을 사용하는 데 필요한 전문 지식이 줄어들고 개발자 친화적이게 되면서 새로운 애플리케이션의 폭발적인 출현이 있을 것으로 믿고 있다.

머신러닝

머신러닝(Machine Learning)은 인공지능(AI) 분야의 한 연구 방향으로, 컴퓨터가 명시적인 프로그래밍 없이 경험에서 자동으로 학습하고 향상할 수 있도록 한다. 알고리즘과 통계 모델을 이용해 데이터 내 패턴을 분석하고 식별한 후, 이를 바탕으로 예측이나 의사 결정을 내린다. 머신러닝의 궁극적인 목표는 인간의 개입 없이 스스로 적응하며 학습할 수 있고, 의료, 금융, 교통 등 다양한 분야에서 복잡한 문제를 해결할 수 있는 지능형 시스템을 개발하는 것이다.

최근 당신은 챗GPT와 바드 같은 대규모 언어 모델(LLM), 또는 DALL-E 2, 미드저니, 스테이블 디퓨전과 같은 텍스트-이미지 생성 모델의 발전을 눈여겨봤을 것이다. 이러한 모델들이 점점 더 정교해지고 다양한 작업을 수행할 수 있게 되면서, 특정 출력이 모델에 의해 생성된 것인지, 아니면 인간이 만든 것인지 구분하는 것이 중요해졌다. 다음 섹션에서는 이러한 고민을 살펴볼 것이다.

ZKML의 동기와 현재 노력

우리는 AI/ML이 생성한 콘텐츠와 인간이 생성한 콘텐츠를 점점 더 구분하기 어려워지는 세상에 살고 있다. 제로노울리지 암호학은 우리가 "특정 콘텐츠 C가 입력 X에 모델 M을 적용하여 생성되었다"는 주장을 할 수 있게 해줄 것이다. 우리는 어떤 출력이 대규모 언어 모델(chatGPT 등)이나 텍스트-이미지 모델(DALL-E 2 등)과 같이 제로노울리지 회로 표현을 생성한 모델에 의해 생성되었는지를 검증할 수 있게 될 것이다. 또한 이러한 증명의 제로노울리지 특성 덕분에, 필요 시 입력이나 모델의 일부를 숨길 수도 있다. 예를 들어 민감한 데이터 위에서 머신러닝 모델을 실행할 때, 제3자에게 입력값을 공개하지 않으면서도 사용자는 모델 추론 결과를 확인할 수 있다. (예: 의료 분야)

참고: ZKML이라고 말할 때 우리는 ML 모델의 훈련 과정이 아니라, 추론(inference) 단계에 대한 제로노울리지 증명을 의미한다. (훈련 자체도 이미 매우 계산 집약적이다.) 현재 기술 수준의 제로노울리지 시스템과 고성능 하드웨어를 결합하더라도, 현재 사용 가능한 대규모 언어 모델(LLMs)과 같은 거대한 모델에 대한 증명을 생성하는 데는 여전히 여러 수준의 격차가 존재한다. 그러나 작은 규모의 모델에 대한 증명 생성에는 어느 정도 진전이 있었다.

우리는 ML 모델에 대한 증명 생성 맥락에서의 제로노울리지 암호학 기술 수준을 조사하여 관련 연구, 논문, 애플리케이션 및 코드 저장소를 종합한 문서를 작성했다. ZKML 관련 리소스는 GitHub의 ZKML 커뮤니티 awesome-zkml 저장소에서 확인할 수 있다.

Modulus Labs 팀은 최근 "지능의 비용(Cost of Intelligence)"이라는 제목의 논문을 발표했는데, 여기서 기존의 다양한 ZK 증명 시스템을 벤치마킹하고 여러 크기의 모델들에 대한 실험 결과를 제시했다. 현재 plonky2와 같은 증명 시스템을 사용하면 강력한 AWS 머신에서 약 5천만 개의 파라미터를 가진 모델에 대해 약 50초 만에 증명을 생성할 수 있다. 다음은 논문에 포함된 그래프이다:

ZKML 시스템의 기술 수준을 향상시키기 위한 또 다른 시도는 Zkonduit의 ezkl 라이브러리인데, ONNX로 내보낸 ML 모델에 대해 ZK 증명을 생성할 수 있게 해준다. 이를 통해 모든 ML 엔지니어가 자신의 모델 추론 단계에 대한 ZK 증명을 만들고, 올바르게 구현된 검증기에 대해 출력값을 입증할 수 있다.

몇몇 팀들은 ZK 기술을 개선하고, ZK 증명 내부 연산을 위한 최적화 하드웨어를 개발하며, 특정 사용 사례에 맞춰 프로토콜의 효율적인 구현을 만들고 있다. 기술이 성숙함에 따라, 더 큰 모델도 비교적 약한 장비에서 짧은 시간 안에 ZK 증명이 가능해질 것이다. 이러한 발전을 통해 새로운 ZKML 애플리케이션과 사용 사례가 등장할 것으로 기대한다.

잠재적 사용 사례

특정 애플리케이션이 ZKML에 적합한지 여부를 판단하기 위해, ZK 암호학의 특성이 어떻게 머신러닝 관련 문제를 해결할 수 있는지를 고려할 수 있다. 이를 다음의 벤 다이어그램으로 설명할 수 있다:

정의:

1. 휴리스틱 최적화(Heuristic optimization) — 어려운 문제에 대해 전통적인 최적화 방법 대신 경험적 규칙(휴리스틱)을 사용하여 좋은 해를 찾는 문제 해결 접근법이다. 휴리스틱 최적화는 최적해를 찾는 대신, 중요한 정도와 최적화 난이도를 고려하여 합리적인 시간 내에 "충분히 좋은" 해를 찾는 것을 목표로 한다.

2. FHE ML — 완전동형암호(Fully Homomorphic Encryption) 기반 ML은 개발자가 개인정보를 보호하면서 모델을 훈련하고 평가할 수 있게 해준다. 그러나 ZK 증명과 달리, 수행된 계산의 정확성을 암호학적으로 입증할 방법은 없다.

Zama.ai 같은 팀들이 이 분야에서 활동하고 있다.

3. ZK vs Validity — 산업계에서는 이 용어들이 종종 혼용되는데, 유효성 증명(validity proof)은 계산이나 그 결과의 일부를 숨기지 않는 제로노울리지 증명이다. ZKML 맥락에서는 대부분의 현재 애플리케이션이 ZK 증명의 유효성 증명 측면을 활용하고 있다.

4. Validity ML — 계산이나 결과가 비밀로 유지되지 않는 ML 모델에 대한 제로노울리지 증명. 계산의 정확성을 입증한다.

다음은 몇 가지 잠재적인 ZKML 사용 사례 예시이다:

1. 계산 무결성 (유효성 ML)

Modulus Labs
체인 상에서 검증 가능한 ML 트레이딩 봇 - RockyBot

자기 개선형 시각 블록체인(예시):

Lyra 금융 옵션 프로토콜 AMM의 스마트 기능 향상
Astraly를 위한 투명한 AI 기반 평판 시스템 구축 (ZK 오라클)
Aztec 프로토콜(zk-rollup 기반 개인정보 보호 기능)을 위한 계약 수준 컴플라이언스 도구 개발에 필요한 기술적 돌파구 마련

2. 머신러닝 서비스(MLaaS) 투명성

3. ZK 이상/사기 탐지:

이 시나리오는 취약성/사기 여부에 대한 ZK 증명 생성을 가능하게 한다. 이상 탐지 모델을 스마트 계약 데이터 위에서 훈련시키고 DAO가 동의한 중요한 메트릭으로 설정함으로써, 스마트 계약을 더욱 능동적이고 예방적으로 일시 중지하는 등의 보안 절차를 자동화할 수 있다. 이미 스타트업들이 스마트 계약 환경에서 ML 모델을 보안 목적으로 활용하는 방법을 연구하고 있으므로, ZK 이상 탐지 증명은 자연스러운 다음 단계라 할 수 있다.

4. ML 추론의 일반적 유효성 증명: 주어진 모델과 입력 쌍에 대한 출력임을 쉽게 입증하고 검증할 수 있음.

5. 개인정보 보호 (ZKML).

6. 탈중앙화된 캐글: 모델의 가중치를 공개하지 않고도 특정 테스트 데이터셋에서 정확도가 x% 이상임을 입증.

7. 개인정보 보호 추론: 개인 환자 데이터를 의료 진단 모델에 입력하고, 민감한 진단 결과(예: 암 검사 결과)를 환자에게 직접 전달.

8. Worldcoin:

아이리스코드(IrisCode)의 업그레이드 가능성: World ID 사용자는 모바일 기기의 암호화된 저장소에 생체정보를 자기 관리할 수 있으며, 아이리스코드 생성용 ML 모델을 다운로드하고 로컬에서 제로노울리지 증명을 생성하여 아이리스코드가 성공적으로 생성되었음을 입증할 수 있다. 이 아이리스코드는 제로노울리지 증명을 검증함으로써 생성 사실을 확인할 수 있기 때문에, 누구든지 등록된 Worldcoin 사용자 중 한 사람에게 허가 없이 삽입할 수 있다. 즉, 향후 Worldcoin이 ML 모델을 이전 버전과 호환되지 않게 변경하여 아이리스코드를 생성하더라도, 사용자는 Orb(구슬 기기)에 다시 방문할 필요 없이 기기에서 로컬로 이 제로노울리지 증명을 생성할 수 있다는 의미이다.
Orb 보안성: 현재 Orb는 신뢰할 수 있는 실행 환경에서 여러 사기 및 변조 탐지 메커니즘을 수행한다. 그러나 사진 촬영 및 아이리스코드 생성 시 이러한 메커니즘이 활성화되어 있었음을 입증하는 제로노울리지 증명을 생성할 수 있다면, 아이리스코드 생성 전 과정에서 해당 메커니즘이 반드시 작동했음을 완전히 보장할 수 있어 Worldcoin 프로토콜에 더 나은 생체 인증(liveness) 보장을 제공할 수 있다.

요약하자면, ZKML 기술은 광범위한 응용 가능성을 지니며 빠르게 발전하고 있다. 점점 더 많은 팀과 개인이 이 분야에 참여함에 따라, ZKML의 활용 시나리오가 더욱 다양화되고 확장될 것으로 기대된다.

TechFlow 공식 커뮤니티에 오신 것을 환영합니다

Telegram 구독 그룹:https://t.me/TechFlowDaily

트위터 공식 계정:https://x.com/TechFlowPost

트위터 영어 계정:https://x.com/BlockFlow_News

원문 링크

즐겨찾기 추가

소셜 미디어 공유

작성자

Worldcoin