엔비디아가 ‘삽을 파는 방법’을 팔기 시작했다

2026.04.15

엔비디아가 ‘삽을 파는 방법’을 팔기 시작했다

당신이 이겨야 할 그 상대는, 당신이 그것을 이기기 위해 필요한 모든 도구를 당신에게 임대해 주고 있다. 임대료는 연간 납부하며, 계약 기간마다 가격이 인상된다.

2026.04.15 - 09:54:05

英伟达

Web3 심층 보도에 집중하고 흐름을 통찰

저자: Ada, TechFlow

샌프란시스코, 산호세 컨벤션 센터, GTC 현장.

엔비디아 최고 과학자 빌 대리(Bill Dally)가 무대 위에 앉아 있고, 그의 상대는 구글의 제프 딘(Jeff Dean)이다. 두 사람이 대화를 나누던 중, 대리는 하나의 숫자를 던진다. “기존에는 약 2500~3000개의 표준 셀로 구성된 표준 셀 라이브러리를 이식하는 데 8명의 엔지니어로 구성된 팀이 약 10개월이 걸렸다.”

그는 잠시 멈춘다.

“지금은 단일 GPU 카드로 하룻밤만 돌리면 된다.”

청중은 탄성을 내지 않는다. 이 말을 이해한 사람들은 그 의미를 이미 알고 있기 때문이다. 8명의 엔지니어가 10개월간 수행하던 작업이, 자사에서 생산한 한 개의 GPU에 의해 하룻밤 만에 완료된 것이다. 게다가 대리는 보완 설명으로, 이 방식으로 생성된 결과물이 면적, 전력 소비, 지연 시간이라는 세 가지 핵심 지표에서 인간 설계와 동등하거나 오히려 이를 능가한다고 덧붙인다.

다음 날 언론은 이를 “엔비디아가 AI로 GPU를 설계한다”는 제목으로 해석했다.

하지만 이 사건의 진실은 기사 제목보다 훨씬 더 흥미롭고 복잡하다.

엔비디아 내부에서 실제로 실행 중인 것은 무엇인가?

엔비디아 내부에서 실행되는 시스템은 ‘블랙박스’가 아니다. 오랜 기간 다듬어온 몇 가지 도구 체인(toolchain)이다.

NB-Cell은 강화 학습 기반의 프로그램으로, 표준 셀 라이브러리 이식과 같은 가장 고단한 작업을 전담한다. Prefix RL은 오랫동안 연구되어 온 ‘캐리 프리루크 체인(carry lookahead chain)’ 내 프리루크 단계 배치 문제를 해결하기 위해 개발되었다. 대리에 따르면, 이 시스템이 생성한 배치는 “인간이 결코 떠올릴 수 없는 형태”이며, 인간 설계와 비교해 핵심 성능 지표가 약 20~30% 향상된다.

또한, 엔비디아는 두 개의 내부 LLM—Chip Nemo와 Bug Nemo—를 운영 중이다. 이 모델들에는 엔비디아가 출시한 모든 GPU의 RTL 코드, 아키텍처 문서, 설계 사양 등이 역사적으로 축적된 데이터로 입력되었다. 대리의 설명에 따르면, 이는 마치 엔비디아가 G80부터 블랙웰(Blackwell)까지 20년간 쌓아온 ‘근육 기억’을 하나의 내부 모델로 증류한 것과 같다. 신입 엔지니어가 이 시스템에 접속하면, 바로 20년 경력의 베테랑 엔지니어와 동일한 수준의 지식과 역량을 활용할 수 있게 되는 것이다.

그렇다면 “AI가 GPU를 설계할 수 있는가?”

정확히 반대다. 대리의 원문 발언은 다음과 같다. “언젠가 ‘새로운 GPU 하나를 설계해줘’라고 말할 수 있기를 바라지만, 우리는 아직 그 단계에 이르지 못했다.”

즉, 엔비디아는 AI로 GPU를 직접 설계하지는 않았다. 하지만 그들이 한 또 다른 일은, 향후 전체 반도체 산업이 엔비디아 없이는 움직일 수 없게 만들었다.

20억 달러로 EDA 핵심 영역 확보

2025년 12월 1일, 엔비디아는 EDA 산업 3대 거두 중 하나인 신옵시스(Synopsys)에 20억 달러를 투자하며 지분을 확보했다. 양사는 공동 개발 협약을 체결하고, 엔비디아의 가속 컴퓨팅 스택을 신옵시스 전체 EDA 워크플로우에 통합하기로 했다. 블랙웰 및 차세대 루빈(Rubin) GPU는 신옵시스.ai와 심층 연동될 예정이다.

신옵시스의 위상에 대해 간략히 설명하자면, 세계 최첨단 공정으로 제작되는 모든 반도체 칩—애플 M 시리즈, AMD MI 시리즈, 구글 TPU—의 설계 단계는 거의 모두 신옵시스 또는 캐데인스(Cadence)의 도구 체인 위에서 실행된다. 이 두 회사와 지멘스 EDA(Siemens EDA)는 반도체 설계의 기반 도구 시장을 사실상 독점하고 있다. 당신은 퀄컴 칩을 사용하지 않을 수도 있고, TSMC 파운드리를 이용하지 않을 수도 있지만, 이 세 회사의 소프트웨어는 피할 수 없다.

신옵시스 투자 후 3개월 만에 엔비디아는 캐데인스, 지멘스, 다쏘 시스텔(Dassault Systèmes)까지 포진시키며, 이들 모두가 엔비디아 GPU 기반의 AI 주도 반도체 설계 도구를 개발 중임을 발표했다.

엔비디아가 공개한 벤치마크 데이터는 인상적이다. 신옵시스 PrimeSim은 블랙웰 기반에서 CPU 대비 30배 빠르고, Proteus는 20배, Sentaurus는 B200 기반에서 CPU 대비 12배 가속된다. 미디어텍은 H100을 활용해 캐데인스 Spectre 속도를 6배 향상시켰고, 아스테라 랩스(Astera Labs)는 신옵시스 + NVIDIA 조합을 통해 칩 검증 속도를 3.5배 높였다.

여기서 주목할 만한 하나의 세부 사항이 있다: 캐데인스의 밀레니엄 M2000(Millennium M2000) 플랫폼은 “EDA 시장을 위해 특별히 설계되었으며, 독점적으로 NVIDIA 블랙웰 기반으로 구동된다”고 명시되어 있다.

‘독점적(exclusive)’이라는 표현이 가장 주목할 가치가 있다. 즉, 기존 EDA 도구는 CPU에서 실행됐기에 인텔이나 AMD 칩 모두 사용 가능했으나, 이제는 최고 성능의 EDA 도구를 사용하려면 반드시 엔비디아 GPU를 구매해야 한다는 의미다.

플라이휠의 실제 모습

대다수 사람들이 이해하는 엔비디아의 플라이휠(flywheel)은 다음과 같다: AI 기업에 GPU를 판매 → AI 기업이 대규모 모델을 훈련 → 대규모 모델이 GPU의 불가대체성을 입증 → 더 많은 고객이 GPU를 구매.

이 플라이휠만으로도 이미 매우 강력하다. 그러나 이 아래에는 또 다른 층이 존재한다.

엔비디아는 자사 도구를 활용해 차세대 GPU를 설계함으로써 설계 효율성에서 ‘세대 차이’를 창출하고, 동시에 전 산업의 EDA 도구 체인 전체를 자사 하드웨어에 묶어버린다. 경쟁사가 이를 따라잡고자 해도, 따라잡기 위한 도구조차 엔비디아 생태계에서 빌려야 한다.

AMD의 주가를 급락시킨 실적 발표 뒤에는 바로 이러한 불안감이 숨어 있다. 엔비디아와 신옵시스는 공식적으로 “이 투자는 엔비디아 하드웨어 구매 의무를 수반하지 않는다”고 밝혔지만, 시장은 분명히 알고 있다: 가속 기능이 탑재된 EDA 도구는 우선 엔비디아 하드웨어에서만 출시되며, AMD와 인텔은 ‘최대 경쟁자의 플랫폼에 최적화된 경로’에만 의존해야 한다.

예를 들어 AMD 엔지니어가 블랙웰과 맞먹는 칩을 설계하려 할 때, 그가 여는 신옵시스 도구는 엔비디아 GPU에서 가장 빠르게 작동한다. 그렇다면 그는 두 가지 선택지밖에 없다: 설계 주기를 2배 이상 느리게 감수하든가, 혹은 자신이 이길 상대의 GPU를 대량 구매해 그 위에서 자신이 이길 상대의 칩을 설계해야 한다.

삽은 여전히 팔고 있다. 다만, 판매 방식이 바뀌었다.

국산 GPU의 현실적 위치

이 지점에서, 우리를 깨우는 한 조의 수치를 제시해야 한다.

엔비디아가 2025 회계연도 순이익을 700억 달러를 넘어서는 동안, 중국 국산 GPU ‘빅4’—모얼선스(Moore Threads), 먀오시(MuXi), 비런(Biren), 수이위안(Suiyuan)—는 IPO 창구 앞에서 줄 서 있다.

모얼선스의 기업공개(IPO) 신청서에 따르면, 2022년부터 2024년까지 3년간 누적 순손실은 50억 위안이며, 2025년 상반기 추가 손실은 2.71억 위안이다. 6월 30일 기준 누적 미상각 손실은 14.78억 위안에 달한다. 경영진은 최소 2027년까지는 연결 재무제표 기준 흑자를 달성하지 못할 것으로 전망한다. 먀오시는 상황이 다소 낫지만, 3년간 누적 손실은 30억 위안을 넘는다. 가장 어려운 상황은 비런으로, 3년 반 동안 누적 손실이 63억 위안을 초과했으며, 2025년 상반기 매출은 고작 5890만 위안에 불과해, 모얼선스 동기 매출 7.02억 위안의 1/10에도 미치지 못한다.

연구개발 투자 강도 역시 극단적이다. 모얼선스의 2022년 R&D 비용은 매출 대비 2422.51%였고, 2024년에도 여전히 309.88%에 달한다. 즉, 1년간 투입된 연구개발비가 매출의 3배 이상이라는 뜻이다. 이는 기업 운영이라기보다는, 1차 시장과 최근 열린 췩둥판(科创板, 췩둥판) 창구를 통해 지속적으로 ‘주입 치료’를 받는 형국이다.

도구 측면에서는 더욱 심각한 기술 격차가 존재한다. 화다구톈(HuaDa JiTian)은 2022년 IPO 신청서에서 자사 도구가 5nm 첨단 공정을 ‘일부 지원’한다고 명시했다. 개룬전자(Gailun Electronics)는 7nm/5nm/3nm 노드까지 지원 가능하지만, 특정 단일 도구에 집중해 전공정(E2E) 솔루션은 제공하지 못한다.

화다구톈 창업자 류웨이핑(Liu Weiping)은 솔직하게 인정한다. “국산 EDA는 첨단 공정에 대한 지원이 명백히 부족하며, 특히 현재의 7nm, 5nm, 3nm 공정에서 그러하다. 현재 국산 EDA는 14nm 수준까지는 구현 가능하지만, 7nm 공정 기술 자체는 확보했으나, 실제 응용과의 심층 융합을 위해서는 전 산업 사슬의 협력이 필요하다.”

즉, 첨단 공정의 전공정 EDA 솔루션은 국산 제품으로는 사실상 사용 불가능하다. 국산 GPU 기업들이 칩을 설계할 때 실제로 사용하는 도구는 여전히 신옵시스와 캐데인스이다. 2025년 트럼프 행정부는 핵심 소프트웨어 전반에 대한 수출 규제를 일시적으로 발표했으나, 실질적인 시행은 이루어지지 않았다. 그러나 7nm 이하 첨단 공정 EDA 도구는 현재까지 엄격한 수출 통제 상태에 있으며, 라이선스가 언제 취소될지 여부는 타국의 판단에 달려 있다.

자본시장의 반응은 거의 환상적이다. 먀오시가 상장 첫날 주가는 829.9위안을 기록하며 하루 만에 692.95% 급등했다. 모얼선스는 상장 직후 A주 시장에서 귀주마오타이(贵州茅台)와 한무기(寒武纪)에 이어 시가총액 3위에 올랐고, 당시 주가를 기준으로 계산된 시가총액은 약 3595억 위안에 달했다.

하지만 이 숫자 뒤에 숨겨진 실제 사업 실상은 다음과 같다. 여전히 적자를 기록하며 자금을 소비하고, 규제 대상인 해외 도구 체인에 의존해야만 칩 설계를 계속할 수 있는 기업들이, 2차 시장에서 ‘중국판 엔비디아’의 계승자로 평가받고 있는 것이다.

그런데 이들이 칩을 설계하는 데 사용하는 도구 체인이 지금 바로 엔비디아 생태계의 일부로 편입되고 있다. 엔비디아와 신옵시스 사이의 20억 달러 투자, 그리고 캐데인스 밀레니엄 M2000의 ‘독점적으로 NVIDIA 블랙웰 기반’이라는 라벨은, 추격 자체를 역설적인 상황으로 만들고 있다.

설계에서 제조까지의 완전한 체인

GTC 행사에서의 그 대화로 돌아가자.

대리는 전체 세션 내내 겸손한 태도를 유지했다. “AI는 아직 칩을 스스로 설계할 수 없다”는 말은 엔비디아가 지난 4~5년간 반복해 언급해온 내용이다. 다만 매년 표현 방식은 조금씩 달라졌다. 4년 전에는 “AI는 설계를 보조할 수 있다”, 3년 전에는 “AI는 특정 단계를 자동화할 수 있다”, 올해는 “8명이 10개월 걸리던 일을 하룻밤 만에 해낸다”고 말했다. 매년 한 걸음씩 전진하면서도, 항상 “궁극적 목표까지는 아직 멀었다”는 문장을 남긴다. 3년 뒤 되돌아보면, 이전의 ‘아직 멀었다’는 선언은 이미 현실이 되었고, 새로운 ‘아직 멀었다’는 선언은 경쟁사들이 아직 접근조차 하지 못하는 차원으로 설정된다.

엔비디아가 지난 12개월간 한 일은 단 하나뿐이다: AI를 반도체 산업 체인 중 가장 고부가가치이자 가장 높은 진입 장벽을 갖춘 몇 가지 핵심 단계에 적용하고, 이 도구들을 단계별로 전 산업에 판매하는 것이다.

칩 설계의 전단(Front-end)은 Chip Nemo와 같은 내부 LLM이 담당하고; 중단(Mid-end)의 표준 셀 라이브러리 이식 및 레이아웃 최적화는 NB-Cell, Prefix RL이 담당한다; 전체 EDA 도구 체인은 신옵시스에 대한 20억 달러 투자와 캐데인스의 ‘독점적으로 Blackwell 기반’이라는 선언을 통해 엔비디아 GPU에 고정된다; 제조 단계의 리소그래피 계산은 cuLitho가 담당하며, TSMC는 이미 이를 도입했다.

설계에서 제조에 이르기까지, 엔비디아는 각 단계를 AI로 다시 구축했다. 그리고 그 모든 단계는 결국 하나의 종착점으로 귀결된다: 당신이 가장 빠른 도구를 사용하려면, 반드시 엔비디아 GPU를 구매해야 한다.

블랙웰을 능가하는 칩을 설계하려는 모든 경쟁사에게 가장 민감한 상황은 이미 발생했다. 그 칩을 설계하기 위해 필요한 EDA 도구는 엔비디아 GPU에서 가장 빠르게 실행되며; 그 칩을 제조하기 위해 필요한 리소그래피 계산은 엔비디아가 제공하는 최고 속도 알고리즘 라이브러리로 수행되며; 그 설계 AI를 훈련하는 데 필요한 컴퓨팅 파워 역시 엔비디아 GPU에서 제공된다.

당신이 이겨야 할 상대가, 당신이 그를 이기기 위해 필요한 모든 도구를 당신에게 빌려주는 것이다. 임대료는 연 단위로 지불하며, 계약은 매년 인상된다.

TechFlow 공식 커뮤니티에 오신 것을 환영합니다

Telegram 구독 그룹:https://t.me/TechFlowDaily

트위터 공식 계정:https://x.com/TechFlowPost

트위터 영어 계정:https://x.com/BlockFlow_News

즐겨찾기 추가

소셜 미디어 공유

작성자

深潮 TechFlow

深潮TechFlow