
Cysic 해석: 하드웨어 가속과 ZK 마이닝 산업의 부흥을 앞두고
저자: Nickqiao & 안개달, 지크 web3
올해 4월, 비탈릭은 홍콩 블록체인 서밋을 방문하여 《Reaching the Limits of Protocol Design》라는 제목의 연설을 했다. 이 자리에서 그는 이더리움 Danksharding 로드맵에서 ZK-SNARKs가 보여주는 가능성을 다시 언급했으며, ASIC 칩이 ZK 가속에 미칠 수 있는 큰 도움에 대해서도 전망했다.
이전에 Scroll 공동창업자 장예는 웹3 내부보다 전통 산업 분야에서 ZK의 응용 가능성은 더 클 수 있다고 지적한 바 있으며, 신뢰 가능한 컴퓨팅, 데이터베이스, 검증 가능한 하드웨어, 콘텐츠 위변조 방지 및 zkML 등 다양한 분야에서 ZK에 대한 큰 수요가 있다고 강조했다. 만약 실시간 ZK 증명 생성이 현실화된다면 웹3와 전통 산업 모두 범용적인 패러다임 전환이 기대되지만, 효율성과 경제적 비용 관점에서 보면 현재로서는 ZK의 대규모 채택까지는 아직 멀었다.
사실 2022년부터 정상급 벤처캐피털 a16z와 Paradigm은 공개적으로 보고서를 발표하며 ZK 하드웨어 가속의 중요성을 명확히 밝혔다. 특히 Paradigm은 미래 ZK 마이너들의 수입이 비트코인 또는 이더리움 마이너 수준에 버금갈 것이며, GPU 및 FPGA, ASIC 기반의 하드웨어 가속 솔루션은 거대한 시장성을 가질 것이라고 단언하기도 했다. 이후 Scroll과 Starknet 같은 주류 ZK 롤업 프로젝트들이 주목받기 시작하면서 하드웨어 가속은 일시적으로 시장의 핫한 개념으로 부상했으며, Cysic 등 특정 프로젝트의 출시 임박 소식과 함께 이러한 열기는 더욱 고조되고 있다.

우리는 ZK에 대한 막대한 수요 공간을 기반으로 하여, ZK 마이닝 풀과 실시간 ZKP 생성 SaaS 모델이 새로운 산업 체인을 개척할 수 있다고 판단할 수 있다. 이 잠재력이 큰 새 대륙 속에서, 기술력과 선발 우위를 갖춘 ZK 하드웨어 업체는 차세대 비트메인(Bitmain)이 되어 하드웨어 가속 영역을 장악할 가능성이 있다.
하드웨어 가속 분야에서 Cysic는 가장 주목받는 주자 중 하나일 수 있다. 이 팀은 유명한 ZKP 기술 경연 플랫폼인 ZPrize에서 중요한 상을 수상했으며, 2023년부터는 ZPrize의 멘토로 활동하고 있다. 또한 B2B용 ZK 마이닝 풀과 개인용 ZK-DePIN 하드웨어를 포함하는 로드맵을 통해 Polychain, ABCDE, OKX Ventures, Hashkey 등 정상급 VC들로부터 약 2천만 달러 규모의 대규모 펀딩을 유치했다.
7월 말 Cysic 테스트넷의 출시와 ZK 마이닝 풀의 곧 있을 오픈으로 인해 각 커뮤니티 내에서 Cysic에 대한 논의가 점차 뜨거워지고 있다. 본문은 Cysic의 제품 원리와 사업 모델을 더 많은 사람들에게 알리고, ZK 하드웨어 가속 원리에 대해 간단히 소개하는 것을 목표로 한다. 아래 내용에서는 Cysic 관련 지식을 간략히 정리하여 이해 장벽을 낮추는 데 도움을 주고자 한다.

ZK 증명 시스템을 작업 흐름으로 이해하기
ZK 증명 시스템은 매우 복잡하지만, 대략적인 구조를 이해하고자 한다면 역할과 작업 흐름 측면에서 나누어보는 것이 좋다. 일반적인 계산을 ZK화하는 시스템의 핵심 프로세스는 다음과 같이 요약할 수 있다:
먼저 사용자는 프런트엔드를 통해 ZK 시스템과 상호작용하며 증명하고자 하는 내용을 제출한다. 프런트엔드는 이를 형식 변환하여 ZK 증명 시스템이 처리할 수 있도록 준비한다. 이후 시스템은 Halo2, Plonk 등의 특정 증명 시스템이나 프레임워크를 이용해 ZK Proof를 생성한다. 이 과정은 다음 단계로 세분화할 수 있다:
1. 문제 설정: 먼저 무엇을 증명할 것인지 결정해야 한다. 예를 들어, 증명자(Prover)가 "나는 방정식 F(x)=w의 해 N을 알고 있다"고 주장하지만, N의 실제 값을 드러내고 싶지 않은 경우이다.
2. 산술화 및 CSP: 증명자가 증명하고자 하는 내용을 제출하면, 시스템은 이를 수학적 모델 또는 프로그램 형태로 동등하게 표현한 후 형식 변환을 수행하여 증명 시스템이 처리할 수 있도록 한다. 즉 앞선 주장인 "나는 방정식 F(x)=w의 해 N을 알고 있다"는 원래의 수학적 등식 형태에서 논리 게이트 회로 및 다항식 형태로 전환된다.

3. 이후 시스템은 Halo, Plonk 등의 적절한 증명 시스템을 선택하여 앞 단계에서 생성된 내용을 활용 가능한 ZKP 프로그램으로 컴파일한다. 증명자는 이 ZKP 프로그램을 사용해 증명을 생성하고, 검증자(Verifier)가 이를 검증하게 된다.

zkEVM처럼 이더리움 레이어2에서 자주 사용되는 ZK 시스템은 기본적으로 스마트 계약을 EVM 저수준 오퍼코드로 컴파일한 후, 각 오퍼코드를 논리 게이트 회로/다항식 제약 조건 형태로 변환하여 백엔드 ZK 증명 시스템이 처리하도록 한다.

참고로 현재 블록체인에서 널리 사용되는 ZKP 기술은 주로 zk-SNARK(제로지식 간결 비대칭 지식 증명)이며, ZK 롤업 대부분은 제로지식 특성보다는 SNARK의 간결성(succinctness)을 활용한다. 간결성은 ZKP가 매우 작은 공간(수백 바이트 정도)을 차지해 대량 정보를 압축할 수 있고, 검증 비용이 극도로 낮다는 것을 의미한다.
따라서 증명자와 검증자 사이의 작업량은 비대칭적이며, 증명자의 ZKP 생성 비용은 매우 크지만 검증자의 검증 비용은 매우 낮다. 이 비대칭성을 잘 활용하면 '단일 증명자, 다수 검증자' 시나리오에서 전체 비용을 증명자 측에 집중시키고 검증자 비용을 극도로 낮출 수 있는데, 이는 탈중앙화 검증에 매우 유리하다. 이더리움 레이어2의 설계 아이디어도 바로 여기에 있다.
그러나 검증 비용을 ZK 생성 측에 전가하는 이 방식은 완전한 해결책은 아니다. ZK 롤업 프로젝트 입장에서 ZKP 생성에 드는 높은 비용은 궁극적으로 UX와 수수료로 다시 전가될 수밖에 없으며, 이는 ZK 롤업의 장기 발전에 도움이 되지 않는다.
ZK가 신뢰 불필요 및 탈중앙화 검증 시나리오에서 큰 가치를 가지지만, 생성 시간의 병목 현상으로 인해 현재 zkEVM, zkVM, ZK 롤업, ZK 브릿지 등 어떤 형태든 대규모 채택을 위한 경제적 기반은 아직 부족하다.
이에 따라 Cysic, Ingonyama, Irreducible 등 ZK 가속 프로젝트들이 등장하여 다양한 방향에서 ZKP 생성 비용 감소를 시도하고 있다. 아래에서는 기술적 관점에서 ZKP 생성의 주요 비용과 가속 방법, 그리고 왜 Cysic가 ZK 가속 분야에서 큰 잠재력을 지녔는지를 간략히 소개하겠다.
연산 비용: MSM과 NTT
많은 사람들이 ZKP의 증명자(Prover)가 증명을 생성하는 데 시간이 매우 오래 걸린다는 것을 알고 있다. ZK-SNARK 프로토콜에서 흔히 발생하는 상황은 검증자(Verifier)가 증명을 검증하는 데 1초밖에 걸리지 않는 반면, 증명 생성에는 반나절 혹은 하루 이상이 소요될 수 있다는 것이다. ZKP를 효율적으로 활용하기 위해선 일반 프로그램을 ZK 친화적인 형식으로 변환해야 한다.
현재 이를 위한 두 가지 방법이 있다. 하나는 Halo2와 같은 증명 시스템 프레임워크를 사용해 회로(circuit)를 작성하는 것이며, 다른 하나는 Cairo나 Circom과 같은 도메인 특화 언어(DSL)를 사용해 계산을 중간 표현 형식으로 변환한 후 증명 시스템에 제출하는 것이다. 증명 시스템은 작성된 회로 또는 DSL로 컴파일된 중간 표현을 기반으로 ZK 증명을 생성한다.
프로그램 작업이 복잡할수록 증명 생성 시간이 길어진다. 또한 일부 연산은 본질적으로 ZK에 부적합하며, 이를 구현하려면 추가 작업이 필요하다. 예를 들어 SHA나 Keccak 해시 함수는 ZKP에 부적합하며, 이러한 함수 사용 시 증명 생성 시간이 길어진다. 고전 컴퓨터에서 실행 비용이 낮은 연산이라도 ZKP에서는 비효율적일 수 있다.

ZK에 부적합한 연산을 제외하더라도, ZK 증명 생성 과정은 사용하는 증명 시스템에 따라 다를 수 있지만 그 병목은 본질적으로 유사하다. ZK 증명 생성에서 가장 많은 컴퓨팅 리소스를 소비하는 두 가지 작업은 MSM(Multi-Scalar Multiplication)과 NTT(Number Theoretic Transform)이다. 이 두 작업은 증명 생성 시간의 80~95%를 차지한다. 구체적인 비율은 ZKP의 커밋 방식과 구현 방법에 따라 달라진다.
MSM은 타원 곡선 상의 다중 스칼라 곱셈을 처리하며, NTT는 유한 체 상에서의 FFT(고속 푸리에 변환)로 다항식 곱셈을 가속화하는 데 사용된다. 서로 다른 방식 조합은 FFT/MSM의 부하 비율을 다르게 만든다.
예를 들어 Stark는 PCS(Polynomial Commitment Scheme, 다항식 커밋 방식)로 해시 기반 FRI를 사용하며, KZG나 IPA에서 사용하는 타원 곡선을 사용하지 않기 때문에 MSM 계산이 전혀 없다. 표에서 위로 갈수록 FFT 연산이 많아지고, 아래로 갈수록 MSM 연산이 많아진다.

최적화 방안
MSM 연산은 예측 가능한 메모리 접근을 필요로 하므로 대규모 병렬화가 가능하지만, 많은 메모리 리소스를 소모한다. 또한 병렬화된다고 해도 확장성 문제가 존재하며 느릴 수 있기 때문에, 하드웨어 가속이 가능하더라도 거대한 메모리와 병렬 컴퓨팅 자원이 필요하다.
NTT는 무작위 메모리 접근을 요구하기 때문에 하드웨어에 부적합하며, 분산 인프라에서 처리하기 어렵다. NTT의 특성상 분산 환경에서 다른 노드의 데이터에 접근해야 하며, 네트워크 통신이 개입되면 성능이 크게 저하되기 때문이다.
따라서 데이터 접근 및 이동이 주요 병목이 되며, NTT 연산의 병렬화 능력을 제한한다. NTT 가속의 대부분 작업은 계산과 메모리 간 상호작용을 어떻게 관리할 것인지에 집중된다.
사실 MSM과 NTT의 효율성 병목을 해결하는 가장 간단한 방법은 이러한 연산 자체를 완전히 제거하는 것이다. Hyperplonk와 같은 새로 제안된 알고리즘은 Plonk를 수정해 NTT 연산을 제거함으로써 가속화를 용이하게 만들었지만, 새로운 병목인 sumcheck 프로토콜과 같은 계산 비용이 높은 부분을 도입하기도 했다. STARK 알고리즘은 MSM이 필요 없지만, FRI 프로토콜로 인해 많은 해시 계산이 필요하다.
ZK 하드웨어 가속과 Cysic의 최종 목표
소프트웨어 및 알고리즘 수준의 최적화가 중요하고 가치 있음에도 불구하고 명백한 한계가 존재한다. ZKP 생성 효율을 극대화하기 위해서는 하드웨어 가속이 필수적이며, 이는 ASIC과 GPU가 BTC와 ETH 마이닝 시장을 장악한 것과 같다.
문제는 ZKP 생성을 가속화하는 최적의 하드웨어가 무엇인지이다. 현재 GPU, FPGA, ASIC 등 여러 하드웨어가 ZK 가속에 사용될 수 있으며, 각각 장단점이 있다.
이들 하드웨어를 비교해보자:

개발 측면에서 그 차이를 간단한 예시로 설명하자면:
-
GPU에서는 CUDA SDK가 제공하는 API를 이용해 마치 네이티브 코드를 작성하듯 개발하며 병렬 컴퓨팅 능력을 얻을 수 있다;
-
FPGA에서는 하드웨어 기술 언어(HDL)를 새로 배운 후 이를 사용해 하드웨어 수준 연결을 직접 제어하며 병렬 알고리즘을 구현해야 한다;
-
ASIC은 칩 설계 단계에서 트랜지스터 연결 배치가 하드웨어 수준에서 고정되며, 이후 변경이 불가능하다.

이러한 솔루션들은 각각 장단점을 지니며, ZK 산업의 다른 발전 단계에 적합하다. Cysic는 ZK 하드웨어 가속의 궁극적 해결책이 되는 것을 목표로 하며, 다음과 같은 단계적 전략을 수립했다:
-
GPU 기반 SDK를 개발해 ZK 애플리케이션에 솔루션을 제공하고, 전 세계 GPU 리소스를 통합한다;
-
FPGA의 유연성과 균형 잡힌 특성을 활용해 맞춤형 ZK 하드웨어 가속을 신속히 구현한다;
-
자체 개발한 ASIC 기반 ZK DePIN 하드웨어를 개발한다;
-
Cysic Network는 SAAS 플랫폼 또는 마이닝 풀로서, ZK DePIN과 GPU의 모든 컴퓨팅 능력을 통합해 전체 ZK 산업에 컴퓨팅 및 검증 솔루션을 제공한다.
다음에서는 여러 세부 분야를 깊이 있게 살펴봄으로써 ZK 가속 솔루션의 세부 차이와 Cysic의 발전 방향을 충분히 이해해보자.
ZK 마이닝 풀과 SaaS 플랫폼: Cysic Network
사실 Scroll이나 Polygon zkEVM 같은 유명한 ZK 롤업들도 로드맵에서 '탈중앙화 Prover' 개념을 명확히 제시한 바 있다. 이는 본질적으로 ZK 마이닝 풀을 구축하는 것이다. 이러한 시장화 방식은 ZK 롤업 프로젝트가 부담을 줄이고, 마이너들과 마이닝 풀 운영자들이 ZK 가속 솔루션을 계속해서 최적화하도록 유도할 수 있다.
Cysic의 로드맵에는 Cysic Network라는 이름의 ZK 마이닝 풀 및 SaaS 플랫폼 계획이 명시되어 있다. 이 플랫폼은 Cysic 자체 컴퓨팅 능력을 통합할 뿐 아니라, 마이닝 인센티브를 통해 제3자 컴퓨팅 자원(GPU 및 일반 사용자의 zk DePIN 장비 등)도 흡수할 것이다.
전체 검증 작업 흐름은 다음과 같다:

-
zk 프로젝트가 증명 생성 작업을 에이전트(Agent)에게 제출하면, 에이전트는 이를 검증 네트워크로 전달한다. 초기에는 Cysic가 공식적으로 에이전트를 운영하며, 이후 자산 스테이킹을 도입해 누구나 에이전트가 될 수 있도록 할 예정이다;
-
-
Prover가 증명 작업을 수락하고 하드웨어를 사용해 ZK 증명을 생성한다. Prover는 작업을 수행하기 위해 토큰을 스테이킹해야 하며, 작업 완료 후 보상을 받는다;
-
-
검증자 위원회는 Prover가 생성한 증명의 유효성을 검사하고 투표한다. 일정 수 이상의 투표를 받으면 증명은 유효한 것으로 간주된다. 검증자는 토큰을 스테이킹해 위원회에 참여하고 투표하며 보상을 받는다. 이 과정은 EigenLayer의 AVS 개념과 결합해 기존 Restaking 인프라를 재활용할 수 있다.
상세한 상호작용 흐름은 다음과 같다:

위 프로세스에서 자산 스테이킹, 인센티브 분배, 계산 작업 제출 등은 모두 전용 플랫폼에 의존해야 하며, 이는 전용 블록체인이 필요함을 의미한다.
이에 따라 Cysic Network는 전용 퍼블릭 체인을 구축하였으며, 독특한 합의 알고리즘인 Proof of Compute(PoC)를 채택했다. 이는 VRF 함수와 Prover의 과거 성과(장비 가용성, 증명 제출 횟수, 증명 정확도 등)를 기반으로 블록 생성자를 선정하는 방식이다(여기서의 블록은 각 장비 정보 기록 및 토큰 인센티브 분배 용도임).
물론 ZK 마이닝 풀과 SaaS 플랫폼 외에도, Cysic는 다양한 하드웨어 기반 ZK 가속 솔루션에 광범위하게 포지셔닝하고 있다. 다음은 GPU, FPGA, ASIC 세 가지 경로에서의 성과를 살펴보자.
GPU, FPGA 및 ASIC
ZK 하드웨어 가속의 핵심은 핵심 연산을 가능한 한 병렬화하는 것이다. 하드웨어 기능 특성을 보면, CPU는 최대한의 유연성과 범용성을 위해 칩 면적의 상당 부분을 제어 기능과 각종 캐시에 할당해 병렬 연산 능력이 약하다.
GPU는 연산에 사용되는 칩 면적 비율이 크게 증가해 대규모 병렬 처리를 지원할 수 있다. 현재 GPU는 매우 보편화되어 있으며, Nvidia CUDA 등 라이브러리를 통해 개발자는 하드웨어를 몰라도 병렬성을 활용할 수 있다. CUDA SDK를 통해 MSM과 NTT 연산을 가속화하는 CUDA ZK 라이브러리를 패키징할 수 있다.
FPGA는 다수의 소형 처리 유닛 배열로 구성되며, FPGA 프로그래밍을 위해선 전용 하드웨어 기술 언어를 사용해 트랜지스터 회로 조합으로 컴파일해야 한다. 즉 FPGA는 명령어 시스템을 거치지 않고 트랜지스터 회로로 직접 특정 알고리즘을 구현하는 것이며, 이는 GPU보다 훨씬 더 큰 맞춤성과 유연성을 가진다.
현재 FPGA 가격은 GPU의 약 1/3 수준이며, 에너지 효율은 GPU보다 10배 이상 높을 수 있다. 이 뚜렷한 효율성 우위의 이유 중 하나는 GPU가 호스트 장치에 연결되어야 하며, 호스트 장치 자체가 많은 전력을 소모하기 때문이다. 즉 FPGA는 에너지 소비를 늘리지 않고도 MSM과 NTT 수요에 대응하기 위해 더 많은 연산 모듈을 추가할 수 있어, 컴퓨팅 집약적이고 높은 데이터 처리량과 낮은 응답 시간이 요구되는 ZK 증명 시나리오에 매우 적합하다.
그러나 FPGA의 가장 큰 문제는 프로그래밍 경험을 가진 개발자가 매우 적다는 점이다. ZK 프로젝트 입장에서 암호학 전문 지식과 FPGA 엔지니어링 전문 지식을 동시에 갖춘 팀을 구성하는 것은 극히 어렵다.
ASIC은 특정 프로그램을 완전히 하드웨어로 구현하는 것으로, 설계 완료 후 하드웨어는 변경할 수 없으며, 실행 가능한 프로그램도 고정되어 특정 작업에만 사용할 수 있다. 위에서 설명한 FPGA의 MSM 및 NTT 하드웨어 가속 장점은 ASIC 역시 동일하게 가진다. 특정 회로 설계 덕분에 ASIC은 모든 솔루션 중에서 성능이 가장 높고, 에너지 소비가 가장 적다.
현재 주류 ZK Circuit 기준으로 Cysic는 증명 생성 시간을 1~5초 수준으로 달성하고자 하며, 이를 달성하려면 오직 ASIC만이 가능하다.
이러한 장점들은 매우 매력적으로 들리지만, ZK 기술은 빠르게 발전하고 있으며, ASIC 설계 및 생산 주기는 일반적으로 1~2년이 소요되며 비용은 1,000~2,000만 달러에 달한다. 따라서 ZK 기술이 충분히 안정화된 후 대규모 생산에 진입해야 하며, 그렇지 않으면 생산된 칩이 곧바로 구식화될 위험이 있다.
이에 대해 Cysic는 GPU, FPGA, ASIC 세 분야 모두에 충분히 포지셔닝하고 있다.
GPU 가속 솔루션 측면에서, 다양한 신규 ZK 증명 시스템이 등장함에 따라 Cysic는 자체 개발한 CUDA 가속 SDK를 통해 이들을 지원하며, 커뮤니티 자원을 통합해 Cysic GPU 컴퓨팅 네트워크에 수십만 개의 고성능 그래픽카드를 연결했다. 또한 Cysic CUDA SDK는 최신 오픈소스 프레임워크보다 50~80% 이상 빠른 속도를 제공한다.
FPGA 측면에서 Cysic는 자체 개발 솔루션을 통해 전 세계에서 가장 빠른 MSM, NTT, Poseidon Merkle tree 모듈을 구현해 ZK 계산의 핵심 부분을 대부분 커버했으며, 이 솔루션은 여러 정상급 ZK 프로젝트의 프로토타입 검증을 통과했다.
Cysic가 자체 개발한 SolarMSM은 2^30 규모의 MSM 계산을 0.195초 내에 완료하며, SolarNTT는 동일 규모의 NTT 계산을 0.218초 내에 완료해, 현재 공개된 모든 FPGA 하드웨어 가속 결과 중 최고 성능을 기록하고 있다.


ASIC 분야에서도 ZK ASIC의 대규모 적용까지는 아직 거리가 있지만, Cysic는 이미 선제적으로 이 분야에 진출하여 자체 개발한 ZK DePIN 칩과 장비를 출시했다.
C 단말 사용자를 유치하고 다양한 ZK 프로젝트의 성능 및 비용 요구를 충족시키기 위해 Cysic는 두 가지 ZK 하드웨어 제품(ZK Air와 ZK Pro)을 출시할 예정이다.

ZK Air는 충전기나 노트북 어댑터 크기로, 일반 사용자가 Type-C 포트를 통해 노트북, iPad, 스마트폰 등에 직접 연결해 특정 ZK 프로젝트에 컴퓨팅 능력을 제공하고 보상을 받을 수 있다. 현재 ZK Air의 성능은 소비자용 그래픽카드를 초월하며, 소규모 ZK 증명 생성을 가속화할 수 있다.
ZK Pro는 기존의 마이닝 머신과 유사하며, 여러 대의 고성능 소비자용 그래픽카드를 연결한 GPU 서버 수준의 성능을 제공해 ZK 증명 생성을 크게 가속화하며, ZK-Rollup 및 ZKML(제로지식 머신러닝)과 같은 대규모 ZK 프로젝트에 적합하다.
이 두 장비를 통해 Cysic는 궁극적으로 안정적이고 신뢰할 수 있는 ZK-DePIN 네트워크를 구축할 것이다. 현재 두 제품은 개발 중이며, 2025년 출시 예정이다.
TechFlow 공식 커뮤니티에 오신 것을 환영합니다 Telegram 구독 그룹:https://t.me/TechFlowDaily 트위터 공식 계정:https://x.com/TechFlowPost 트위터 영어 계정:https://x.com/BlockFlow_News













