
황인훈 최신 CES 연설: AI 에이전트, 차세대 로봇 산업으로 성장 가능하며 규모 수조 달러에 이를 전망
정리: 유신

오늘 오전 개막된 CES 2025에서 엔비디아 창립자이자 CEO인 젠슨 황(Jensen Huang)은 AI와 컴퓨팅의 미래를 조명한 획기적인 기조 연설을 발표했다. 생성형 AI의 핵심 개념인 토큰(Token)부터 최신 블랙웰(Blackwell) 아키텍처 GPU의 공개, 그리고 AI 기반 디지털화된 미래에 이르기까지, 이번 연설은 다방면의 시각에서 산업 전반에 깊은 영향을 미칠 것이다.

1) 생성형 AI에서 에이전트형 AI(Agentic AI)로: 새로운 시대의 서막
-
토큰의 탄생: 생성형 AI의 핵심 동력으로서 토큰은 텍스트를 지식으로 바꾸고 이미지에 생명을 불어넣으며, 완전히 새로운 디지털 표현 방식을 열었다.
-
AI 진화의 길: 인식 AI → 생성형 AI → 추론·계획·행동이 가능한 에이전트형 AI(Agentic AI)로 나아가며, AI 기술은 끊임없이 새로운 정점을 넘어선다.
-
트랜스포머의 혁명: 2018년 등장한 이래 트랜스포머는 컴퓨팅 방식을 재정의하며 기존 기술 스택 전체를 완전히 뒤바꿔놓았다.
2) 블랙웰 GPU: 성능 한계 돌파
-
차세대 GeForce RTX 50 시리즈: 블랙웰 아키텍처 기반으로 920억 개의 트랜지스터, 4000 TOPS의 AI 성능과 4 PetaFLOPS의 연산 능력을 갖추며, 이전 세대 대비 3배의 성능을 제공한다.
-
AI와 그래픽의 융합: 프로그래밍 가능한 셰이더와 신경망을 최초로 결합하여 '신경 텍스처 압축(Neural Texture Compression)' 및 '재질 셰이딩(Material Shading)' 기술을 도입, 압도적인 렌더링 효과를 실현했다.
-
고성능 컴퓨팅의 보편화: RTX 5070 노트북이 $1,299라는 가격에 RTX 4090 수준의 성능을 제공함으로써 고성능 컴퓨팅의 대중화를 가속화하고 있다.
3) AI 응용의 다영역 확장
-
기업용 AI 에이전트: 엔비디아는 네모(Nemo)와 라마 네모트론(Llama Nemotron) 등의 도구를 제공해, 자율적 추론이 가능한 디지털 직원을 구축하고 지능형 관리 및 서비스를 실현할 수 있도록 지원한다.
-
물리 AI (Physic AI): Omniverse와 Cosmos 플랫폼을 통해 AI를 산업, 자율주행, 로봇 분야에 통합하며 글로벌 제조 및 물류를 재정의하고 있다.
-
미래 컴퓨팅 시나리오: 엔비디아는 AI를 클라우드에서 개인 장치와 기업 내부로 확장해, 개발자부터 일반 사용자까지 모든 계층의 컴퓨팅 요구를 포괄하려 한다.
젠슨 황 연설 주요 내용:
여기는 지혜가 태어나는 곳이며, 일종의 새로운 공장—즉 토큰을 생성하는 발전기이다. 토큰은 AI의 기본 구성 요소로서 새로운 영역을 열고, 놀라운 세계로 들어가는 첫걸음을 내딛는다. 토큰은 문자를 지식으로 바꾸고, 이미지에 생명을 부여한다. 아이디어를 영상으로 변환하고, 어떤 환경에서도 안전하게 항법을 제공한다. 로봇에게 마스터처럼 움직이는 법을 가르치며, 우리가 승리를 축하하는 새로운 방법을 발견하도록 자극한다. 가장 필요할 때 마음의 평온을 가져다주기도 한다. 토큰은 디지털 데이터에 의미를 부여해 세상을 더 잘 이해하고, 잠재적 위험을 예측하며, 내재된 위협을 치료하는 방법을 찾도록 돕는다. 우리의 꿈을 현실로 만들고, 잃어버린 것을 복구할 수도 있다.
AI의 여정은 1993년 엔비디아가 첫 번째 제품 NV1을 출시하면서 시작되었다. 우리는 일반 컴퓨터로는 할 수 없는 일을 수행하는 PC를 만들고자 했으며, 그 결과 게임기가 PC 안에 들어오게 되었다. 이후 1999년 엔비디아는 프로그래밍 가능한 GPU를 발명했고, 이는 20년 이상의 기술 발전을 열었으며 현대 컴퓨터 그래픽스의 가능성을 여는 계기가 되었다. 그로부터 5년 후, CUDA를 출시해 GPU의 프로그래밍 가능성을 풍부한 알고리즘으로 표현했다. 이 기술은 처음에는 설명하기 어려웠지만, 2012년 AlexNet의 성공이 CUDA의 가능성을 입증하며 AI의 획기적인 발전을 이끌었다.
그 이후로 AI는 놀라운 속도로 발전해왔다. 인식 AI에서 생성형 AI를 거쳐 감지, 추론, 계획, 행동까지 가능한 에이전트형 AI(Agentic AI)로 진화하며 역량을 계속해서 확장하고 있다. 2018년 구글이 트랜스포머를 선보이면서 AI의 세계는 비로소 본격적으로 날개를 펼쳤다. 트랜스포머는 AI의 지형만 바꾼 것이 아니라 컴퓨팅 전체의 패러다임을 재정의했다. 머신러닝은 단순한 새로운 애플리케이션이나 사업 기회를 넘어서, 컴퓨팅 자체의 근본적인 혁신임을 깨달았다. 수작업으로 명령어를 작성하는 것에서 벗어나 머신러닝으로 신경망을 최적화하는 방식으로, 기술 스택의 모든 계층이 거대한 변화를 겪었다.
오늘날 AI는 이미 어디에나 존재한다. 텍스트, 이미지, 음성 이해는 물론 아미노산 번역이나 물리학 문제 해결까지 수행할 수 있다. 거의 모든 AI 응용은 다음 세 가지 질문으로 요약된다. 어떤 모달리티 정보를 학습했는가? 어떤 모달리티 정보로 번역되었는가? 어떤 모달리티 정보를 생성했는가? 이러한 기본 개념이 AI 기반 애플리케이션 하나하나를 이끄는 원동력이다.
이 모든 성과는 GeForce의 지원 없이는 불가능했을 것이다. GeForce는 AI의 대중화를 이끌었고, 이제 AI는 다시 GeForce를 완전히 혁신하고 있다. 실시간 레이 트레이싱 기술을 활용해 놀라운 그래픽 렌더링이 가능해졌으며, DLSS 덕분에 AI는 프레임 생성을 넘어서 미래의 화면을 예측할 수 있게 되었다. 3300만 화소 중 단 200만 화소만이 직접 계산되고, 나머지는 모두 AI가 예측하여 생성한다. 이런 기적 같은 기술은 AI의 강력한 능력을 보여줄 뿐 아니라, 더욱 효율적인 컴퓨팅과 무한한 미래 가능성을 보여준다.
그래서 지금 이렇게 많은 놀라운 일이 일어나고 있는 것이다. 우리는 GeForce를 통해 AI의 발전을 이끌었고, 이제 AI는 GeForce를 완전히 혁신하고 있다. 오늘, 차세대 제품군—RTX 블랙웰(RTX Blackwell) 시리즈를 발표한다. 함께 살펴보자.
이것은 블랙웰 아키텍처 기반의 완전히 새로운 GeForce RTX 50 시리즈다. 이 GPU는 성능 괴물이라 할 만하다. 920억 개의 트랜지스터, 4000 TOPS의 AI 성능, 4 PetaFLOPS의 AI 연산 능력을 갖췄으며, 이전 세대 아다(Ada) 아키텍처 대비 3배의 성능을 제공한다. 내가 방금 보여준 놀라운 화소들을 생성하기 위한 것이다. 또한 380 레이트레이싱 테라플롭스(Teraflops)를 제공하여 계산된 각 화소에 최고의 시각적 품질을 제공하며, 셰이딩 성능은 125 테라플롭스에 달한다. 이 그래픽카드는 마이크론(Micron)의 G7 메모리를 탑재해 초당 1.8TB의 전송 속도를 구현하며, 이는 이전 세대의 두 배 성능이다.
이제 AI 워크로드와 컴퓨터 그래픽스 워크로드를 결합할 수 있다. 이 세대 제품의 놀라운 특징 중 하나는 프로그래머블 셰이더가 신경망도 처리할 수 있다는 점이다. 이를 통해 우리는 '신경 텍스처 압축(Neural Texture Compression)'과 '신경 재질 셰이딩(Neural Material Shading)'을 발명했다. 이 기술들은 AI가 텍스처와 압축 알고리즘을 학습하여, 오직 AI만이 만들어낼 수 있는 경이로운 이미지 효과를 생성한다.
기계 설계 측면에서도 이 그래픽카드는 기적이다. 듀얼 팬 설계를 채택했으며, 카드 전체가 마치 거대한 팬처럼 작동한다. 내부 전압 조절 모듈(VRM)은 최첨단 기술로 구현되었다. 이러한 뛰어난 설계는 전적으로 엔지니어링 팀의 노력 덕분이다.
다음은 성능 비교다. 모두가 잘 아는 RTX 4090은 $1,599의 가격에 홈 PC 엔터테인먼트의 핵심 투자다. 반면 RTX 50 시리즈는 RTX 5070부터 RTX 5090까지 RTX 4090보다 두 배 높은 성능을 제공하면서도 시작 가격은 단 $549에 불과하다.
더 놀라운 것은 이러한 고성능 GPU를 노트북에 탑재했다는 점이다. RTX 5070 노트북은 $1,299의 가격에 RTX 4090과 동일한 성능을 제공한다. 이 설계는 AI와 컴퓨터 그래픽 기술을 결합하여 고효율과 고성능을 동시에 실현했다.

미래의 컴퓨터 그래픽스는 '신경 렌더링(Neural Rendering)'—즉 AI와 컴퓨터 그래픽스의 융합이 될 것이다. 블랙웰 시리즈는 두께 14.9mm의 얇은 노트북에서도 구현 가능하며, RTX 5070부터 RTX 5090까지 전 제품군이 울트라씬 노트북에 적합하다.
GeForce는 AI의 보급을 이끌었고, 이제 AI는 다시 GeForce를 완전히 혁신하고 있다. 기술과 지능의 상호 촉진을 통해 우리는 더 높은 경지로 나아가고 있다.
AI의 세 가지 스케일링 법칙 (Scaling Law)
다음은 AI의 발전 방향에 대해 이야기해보자.
1) 사전 훈련 스케일링 법칙 (Pre-training Scaling Law)
AI 산업은 빠르게 확장하고 있으며, 이를 이끄는 강력한 모델이 바로 '스케일링 법칙(Scaling Law)'이다. 연구자들과 산업계에 의해 반복 검증된 경험적 법칙으로, 훈련 데이터 규모, 모델 크기, 컴퓨팅 자원 투입량이 클수록 모델의 능력도 강해진다는 것을 보여준다.
데이터 증가 속도는 지수적으로 빨라지고 있다. 향후 몇 년 내 인류가 매년 생산하는 데이터의 양이, 그 이전 역사상 누적된 데이터总量을 초월할 것으로 예상된다. 이 데이터는 비디오, 이미지, 음성 등 다양한 모달리티로 다변화되고 있으며, 방대한 양의 데이터는 AI의 기초 지식 체계를 훈련시키는 데 사용되어 견고한 지적 기반을 마련한다.
2) 사후 훈련 스케일링 법칙 (Post-training Scaling Law)
또 다른 두 가지 스케일링 법칙이 부상하고 있다.
두 번째는 '사후 훈련 스케일링 법칙(Post-training Scaling Law)'으로, 강화 학습(Reinforcement Learning)과 인간 피드백(Human Feedback) 기술을 포함한다. 이 방식은 AI가 인간의 질의에 답변을 생성하고, 인간의 피드백을 통해 지속적으로 개선되는 과정을 말한다. 고품질 프롬프트를 통해 강화 학습 시스템은 AI가 특정 분야, 예를 들어 수학 문제 해결이나 복잡한 추론 능력 등을 더욱 능숙하게 하도록 돕는다.
AI의 미래는 단순한 인식과 생성을 넘어서, 스스로 완벽을 추구하며 경계를 뚫는 지속적인 자기 진화의 과정이다. 이것은 마치 과제 수행 후 피드백을 주는 멘토나 코치를 갖는 것과 같다. 테스트, 피드백, 자기 개선을 통해 AI 역시 유사한 강화 학습과 피드백 메커니즘을 통해 발전할 수 있다. 사후 훈련 단계에서 강화 학습과 합성 데이터 생성 기술을 결합하는 것은 마치 자기 연습과 같다. AI는 정리를 증명하거나 기하학 문제를 해결하는 등 복잡하고 검증 가능한 난제에 직면하여 강화 학습을 통해 자신의 답변을 지속적으로 최적화할 수 있다. 이러한 사후 훈련은 막대한 컴퓨팅 자원을 필요로 하지만, 궁극적으로 뛰어난 모델을 창출할 수 있다.
3) 추론 시간 스케일링 법칙 (Test-time Scaling Law)
점차 부상하고 있는 세 번째 법칙은 '추론 시간 스케일링 법칙(Test-time Scaling Law)'이다. 이 법칙은 AI가 실제로 사용될 때 독특한 잠재력을 보여준다. AI는 더 이상 파라미터 최적화에 국한되지 않고, 추론 시 동적으로 리소스를 할당하며, 필요한 고품질의 답변을 생성하는 데 집중한다.
이 과정은 직접적인 추론이나 일회성 답변이 아닌, 추론적 사고 과정과 유사하다. AI는 문제를 여러 단계로 분해하고, 여러 해법을 생성하여 평가한 후 최적의 해결책을 선택할 수 있다. 이러한 장기간 추론은 모델 능력 향상에 매우 효과적이다.
이 기술의 진화 과정을 이미 목격하고 있다. ChatGPT에서 GPT-4를 거쳐 현재의 Gemini Pro에 이르기까지, 모든 시스템은 사전 훈련, 사후 훈련, 추론 시간 확장을 거치며 점진적으로 발전하고 있다. 이러한 돌파구를 실현하기 위해서는 막대한 컴퓨팅 능력이 필요하며, 바로 이것이 엔비디아 블랙웰 아키텍처의 핵심 가치이다.
블랙웰 아키텍처 최신 소개
블랙웰 시스템은 이미 전면 양산에 들어갔으며, 그 성능은 놀라움을 자아낸다. 현재 모든 주요 클라우드 서비스 제공업체(CSP)가 이 시스템을 배포하고 있으며, 전 세계 45개 공장에서 제조되며, 액체 냉각, 공기 냉각, x86 아키텍처, 엔비디아 그레이스 CPU 버전 등 총 200가지 이상의 구성이 지원된다.
핵심 구성 요소인 NVLink 시스템은 자체 무게가 1.5톤에 달하며, 60만 개의 부품으로 이루어져 있어 자동차 20대와 맞먹는 복잡성을 지닌다. 그 안에는 2마일(약 3.2km)의 구리선과 5,000개의 케이블이 연결되어 있다. 제조 과정은 극도로 복잡하지만, 끊임없이 커지는 컴퓨팅 수요를 충족시키는 것이 목적이다.
이전 세대 아키텍처 대비 블랙웰은 와트 당 성능이 4배, 달러 당 성능이 3배 향상되었다. 즉 동일한 비용으로 모델 훈련 규모를 3배까지 확대할 수 있으며, 이러한 개선의 핵심은 생성형 AI 토큰(Generate AI token)이다. 이러한 토큰은 ChatGPT, Gemini 및 각종 AI 서비스 전반에 걸쳐 활용되며, 미래 컴퓨팅의 기반이다.
이를 기반으로 엔비디아는 AI와 컴퓨터 그래픽스를 완벽히 융합한 새로운 컴퓨팅 모델—'신경 렌더링(Neural Rendering)'을 추진하고 있다. 블랙웰 아키텍처 기반 72개의 GPU는 세계에서 가장 큰 단일 칩 시스템을 구성하며, 무려 1.4 엑사플롭스(ExaFLOPS)의 AI 부동소수점 성능과 1.2PB/s의 메모리 대역폭을 제공한다. 이는 전 세계 인터넷 트래픽 총량과 맞먹는 수준이다. 이러한 슈퍼컴퓨팅 능력은 AI가 더 복잡한 추론 작업을 처리할 수 있게 하며, 비용을 크게 절감하고 효율적인 컴퓨팅 기반을 마련한다.
AI 에이전트 시스템과 생태계
미래를 전망하면, AI의 추론 과정은 더 이상 단순한 단일 응답이 아니라 '내부 대화'에 가까워질 것이다. 미래의 AI는 답을 생성하는 것을 넘어 성찰하고, 추론하며 지속적으로 최적화할 것이다. AI 토큰 생성 속도가 빨라지고 비용이 낮아짐에 따라 AI 서비스의 품질은 눈에 띄게 향상되어 더욱 광범위한 응용 수요를 충족시킬 것이다.
기업들이 자율적 추론 능력을 갖춘 AI 시스템을 구축할 수 있도록 엔비디아는 세 가지 핵심 도구를 제공한다. 엔비디아 네모(NeMo), AI 마이크로서비스, 가속화 라이브러리이다. 복잡한 CUDA 소프트웨어와 딥러닝 모델을 컨테이너화된 서비스 형태로 패키징함으로써, 기업은 임의의 클라우드 플랫폼에서 이러한 AI 모델을 배포하고, 특정 분야에 특화된 AI 에이전트를 신속하게 개발할 수 있다. 예를 들어 기업 관리를 지원하는 서비스 도구나 사용자와 상호작용하는 디지털 직원 등이 그것이다.
이러한 모델은 기업에게 새로운 가능성을 열어주며, AI 응용 개발 장벽을 낮출 뿐 아니라, Agentic AI(자율형 AI) 방향으로 산업 전체가 확실한 한 걸음을 내딛도록 돕는다. 미래의 AI는 디지털 직원이 되어 SAP, ServiceNow 등의 기업 도구에 쉽게 통합되어 다양한 환경에서 고객에게 지능형 서비스를 제공할 것이다. 이는 AI 확장의 다음 이정표이자 엔비디아 기술 생태계의 핵심 비전이다.
훈련 및 평가 시스템. 앞으로 이러한 AI 에이전트는 마치 실제 직원처럼 여러분과 어깨를 나란히 하고 작업을 수행하는 디지털 노동력이 될 것이다. 따라서 회사에 이러한 전문화된 에이전트를 도입하는 것은 신입 직원을 채용하는 것과 같다. 우리는 다양한 도구 모음을 제공하여, 이러한 AI 에이전트가 회사 고유의 언어, 어휘, 업무 프로세스 및 작업 방식을 학습하도록 돕는다. 업무 결과물의 예시를 제공하면, 에이전트는 이를 생성하려 시도하고, 여러분은 피드백을 주거나 평가를 할 수 있다. 동시에 접근할 수 없는 작업이나 말해서는 안 되는 내용, 접근 가능한 정보 등을 제한할 수 있다. 이러한 전체 디지털 직원 운영 프로세스를 '네모(NeMo)'라고 부른다. 어느 정도로 보면, 각 기업의 IT 부서가 AI 에이전트의 HR 부서가 되는 셈이다.
현재 IT 부서는 다수의 소프트웨어를 관리하고 유지하고 있지만, 미래에는 다수의 디지털 에이전트를 관리하고, 교육하고, 입사시키며 개선하는 역할을 하게 될 것이다. 따라서 IT 부서는 점차 AI 에이전트의 HR 부서로 진화할 것이다.
또한 우리는 생태계가 자유롭게 사용할 수 있도록 많은 오픈소스 청사진(Blueprint)을 제공한다. 사용자는 이러한 청사진을 자유롭게 수정할 수 있다. 우리는 다양한 유형의 에이전트를 위한 청사진을 제공하고 있으며, 오늘 아주 멋지고 똑똑한 발표를 하나 한다. 우리는 라마(Llama) 기반의 새로운 모델 군을 출시했는데, 그것이 바로 엔비디아 라마 네모트론(Nvidia Llama Nemotron) 언어 기반 모델 시리즈다.
Llama 3.1은 현상급 모델이다. 메타(Meta)의 Llama 3.1은 약 3억 5천 650만 건의 다운로드를 기록했으며, 약 6만 개의 파생 모델을 만들어냈다. 거의 모든 기업과 산업이 AI 연구를 시작하게 된 핵심 이유 중 하나다. 우리는 라마 모델이 기업용 사례에 더 잘 미세 조정될 수 있음을 깨달았다. 우리의 전문성과 역량을 활용해, 이를 라마 네모트론(Llama Nemotron) 오픈 모델 키트로 미세 조정했다.
이 모델들은 크기에 따라 나뉜다. 소형 모델은 빠른 응답이 가능하고, 주류의 슈퍼 모델(Super Llama Nemotron)은 일반적인 용도에 적합하며, 초대형 모델(Ultra Model)은 교사 모델로 사용되어 다른 모델을 평가하고, 답변을 생성하며, 그 품질을 판단하거나 지식 증류(Knowledge Distillation) 모델로 활용된다. 모든 모델은 현재 공개 상태다.
이 모델들은 대화, 명령어 처리, 정보 검색 등의 분야에서 리더보드 상위권을 차지하며, 전 세계적으로 AI 에이전트 기능에 매우 적합하다.
우리는 생태계와의 협력도 매우 긴밀하다. 산업용 AI 분야에서 ServiceNow, SAP, 지멘스(Siemens)와의 협력을 비롯해, Cadence, Perplexity 등도 훌륭한 프로젝트를 진행하고 있다. Perplexity는 검색 분야를 혁신했고, Codium은 전 세계 3,000만 명의 소프트웨어 엔지니어를 지원하고 있다. AI 어시스턴트는 소프트웨어 개발자의 생산성을 크게 향상시킬 것이며, 이는 AI 서비스의 다음 큰 응용 분야가 될 것이다. 전 세계에는 10억 명의 지식근로자가 있으며, AI 에이전트는 다음의 로봇 산업이 될 수 있고, 잠재 가치는 수조 달러에 이를 것이다.
AI 에이전트 청사진
다음은 파트너사와 함께 완성한 AI 에이전트 청사진들을 소개한다.
AI 에이전트는 인간의 작업을 지원하거나 대체할 수 있는 새로운 디지털 노동력이다. 엔비디아의 에이전트형 AI 구성 요소, NEM 사전 훈련 모델, 네모(Nemo) 프레임워크는 조직이 AI 에이전트를 쉽게 개발하고 배포할 수 있도록 돕는다. 이러한 에이전트는 특정 분야의 전문가로 훈련될 수 있다.
다음은 네 가지 예시:
-
연구 보조 에이전트: 강의, 저널, 재무 보고서 등 복잡한 문서를 읽고 인터랙티브 팟캐스트를 생성하여 학습을 돕는다.
-
소프트웨어 보안 AI 에이전트: 개발자가 소프트웨어 취약점을 지속적으로 스캔하고 조치를 제안하도록 돕는다.
-
가상 실험실 AI 에이전트: 화합물 설계와 스크리닝을 가속화하여 잠재적 신약 후보를 빠르게 찾아낸다.
-
비디오 분석 AI 에이전트: 엔비디아 메트로폴리스(Metropolis) 청사진 기반으로 수십억 대의 카메라에서 데이터를 분석하여 인터랙티브 검색, 요약, 보고서를 생성한다. 예를 들어 교통량, 시설 프로세스를 모니터링하고 개선 제안을 제공한다.
물리 AI 시대의 도래
우리는 AI를 클라우드에서 기업 내부와 개인 PC에 이르기까지 모든 곳으로 확장하고자 한다. 엔비디아는 Windows WSL 2(Windows Subsystem for Linux)를 AI 지원을 위한 최적의 플랫폼으로 전환하는 작업을 진행 중이다. 이를 통해 개발자와 엔지니어는 언어 모델, 이미지 모델, 애니메이션 모델 등 엔비디아의 AI 기술 스택을 보다 쉽게 활용할 수 있게 된다.
또한 엔비디아는 코스모스(Cosmos)를 출시했다. 이는 세계 최초의 물리 세계 기반 모델 개발 플랫폼으로, 중력, 마찰, 관성, 공간 관계, 인과 관계 등 물리 세계의 역학적 특성을 이해하는 데 초점을 맞춘다. 물리 법칙에 부합하는 비디오와 장면을 생성하며, 로봇, 산업용 AI, 다중 모달 언어 모델의 훈련 및 검증에 널리 활용된다.
Cosmos는 엔비디아 옴니버스(Omniverse)와 연결되어 물리 시뮬레이션을 제공하며, 현실감 있는 신뢰할 수 있는 시뮬레이션 결과를 생성한다. 이 결합은 로봇 및 산업용 애플리케이션 개발의 핵심 기술이다.

엔비디아의 산업 전략은 세 가지 컴퓨팅 시스템을 기반으로 한다:
-
AI 훈련용 DGX 시스템;
-
AI 배포용 AGX 시스템;
-
강화 학습 및 AI 최적화를 위한 디지털 트윈 시스템;
이 세 시스템의 협업을 통해 엔비디아는 로봇 및 산업용 AI의 발전을 이끌며 미래의 디지털 세계를 구축하고 있다. 이를 '삼체 문제'라기보다는 '삼중 컴퓨터 솔루션'이라 부를 수 있다.
엔비디아의 로봇 비전을 세 가지 예시로 보여드리겠다.
1) 산업 시각화 응용
현재 전 세계에는 수백만 개의 공장과 수십만 개의 창고가 있으며, 이들은 50조 달러 규모의 제조업의 핵심을 이루고 있다. 미래에는 이 모든 것이 소프트웨어 정의 및 자동화되어야 하며, 로봇 기술이 통합되어야 한다. 우리는 세계 최고의 창고 자동화 솔루션 제공업체인 케온(Keon)과 세계 최대의 전문 서비스 제공업체 액센츄어(Accenture)와 협력하여 디지털 제조를 중심으로 매우 특별한 솔루션을 공동 개발하고 있다. 우리의 마케팅 방식은 다른 소프트웨어 및 기술 플랫폼과 유사하게 개발자와 생태계 파트너를 통해 진행되며, 점점 더 많은 생태계 파트너가 옴니버스 플랫폼에 접속하고 있다. 누구나 산업의 미래를 시각화하고 싶어하기 때문이다. 이 50조 달러 규모의 세계 GDP 속에는 너무 많은 낭비와 자동화 가능성의 기회가 있다.
케온과 액센츄어가 우리와 협력한 다음 사례를 살펴보자:
공급망 솔루션 기업 케온, 글로벌 전문 서비스 선도 기업 액센츄어, 엔비디아는 물리 AI를 수조 달러 규모의 창고 및 물류센터 시장에 도입하고 있다. 효율적인 창고 물류 관리는 일일 및 계절적 수요 변화, 공간 제약, 인력 공급, 다양한 로봇 및 자동화 시스템 통합 등 끊임없이 변화하는 변수들에 영향받는 복잡한 의사결정 네트워크를 해결해야 한다. 오늘날 물리적 창고의 운영 핵심 성과 지표(KPI)를 예측하는 것은 거의 불가능하다.
이 문제를 해결하기 위해 케온은 Mega(엔비디아 옴니버스 청사진)를 도입하여 산업용 디지털 트윈을 구축하고, 로봇 플릿(fleet)을 테스트 및 최적화하고 있다. 먼저 케온의 창고 관리 솔루션이 버퍼 위치에서 왕복 저장 솔루션으로 화물을 이동하는 등의 작업을 산업용 AI 대뇌가 있는 디지털 트윈에 할당한다. 로봇 플릿은 옴니버스 내 물리적 창고 시뮬레이션 환경에서 감지와 추론을 통해 작업을 수행하고, 다음 동작을 계획하며 실행한다. 디지털 트윈 환경은 센서 시뮬레이션을 사용해 로봇 대뇌가 작업 후 상태를 확인하고 다음 동작을 결정할 수 있게 한다. 메가(Mega)의 정밀한 추적 하에 이 사이클은 지속되며, 처리량, 효율성, 가동률 등 운영 KPI를 측정한다. 이 모든 것은 실제 창고를 변경하기 전에 이루어진다.
엔비디아의 협력을 통해 케온과 액센츄어는 산업 자율화의 미래를 재정의하고 있다.
앞으로 모든 공장은 실제 공장과 완전히 동기화된 디지털 트윈을 갖게 될 것이다. 여러분은 옴니버스와 코스모스를 활용해 무수히 많은 미래 시나리오를 생성할 수 있으며, AI는 최적의 KPI 시나리오를 결정하고, 이를 실제 공장 배치의 제약 조건 및 AI 프로그래밍 로직으로 설정할 수 있다.
2) 자율주행 자동차
자율주행 혁명은 이미 도래했다. 오랜 기간의 발전 끝에 Waymo와 Tesla의 성공은 자율주행 기술의 성숙을 입증했다. 이 분야에 대해 엔비디아는 세 가지 컴퓨터 시스템을 제공한다. AI 훈련용 시스템(DGX 시스템), 시뮬레이션 테스트 및 합성 데이터 생성용 시스템(옴니버스 및 코스모스), 차량 내 컴퓨터 시스템(AGX 시스템). 전 세계 거의 모든 주요 자동차 회사가 우리와 협력하고 있으며, Waymo, Zoox, Tesla뿐 아니라 세계 최대의 전기차 회사 BYD도 포함된다. Mercedes, Lucid, Rivian, 샤오미(Xiaomi), 볼보(Volvo) 등 혁신적인 신차를 출시할 예정인 기업들도 있다. Aurora는 엔비디아 기술을 활용해 자율주행 트럭을 개발 중이다.
매년 1억 대의 자동차가 생산되며, 전 세계 도로에는 10억 대의 자동차가 운행 중이고, 연간 주행 거리는 수조 마일에 달한다. 이들은 점차 고도 자동화 또는 완전 자동화를 실현할 것이다. 이 산업은 첫 번째로 수조 달러 규모의 로봇 산업이 될 것으로 예상된다.
오늘 우리는 차세대 차량용 컴퓨터 '소어(Thor)'를 출시한다고 발표한다. 이는 범용 로봇 컴퓨터로, 카메라, 고해상도 레이더, 라이다 등 센서의 방대한 데이터를 처리할 수 있다. Thor는 현재 산업 표준인 오린(Orin)의 업그레이드 버전으로, 계산 능력이 20배 향상되었으며 이미 전면 양산에 들어갔다. 동시에 엔비디아의 Drive OS는 기능 안전성 최고 수준(ISO 26262 ASIL D) 인증을 받은 세계 최초의 AI 컴퓨팅 운영체제이다.
자율주행 데이터 공장
엔비디아는 옴니버스 AI 모델과 코스모스 플랫폼을 활용해 자율주행 데이터 공장을 구축하고, 합성 주행 시나리오를 통해 훈련 데이터를 대폭 확장한다. 여기에는 다음이 포함된다:
-
오믹맵(OmniMap): 지도 및 지리공간 데이터를 통합해 주행 가능한 3D 환경을 구축한다.
-
신경 재구성 엔진(Neural Reconstruction Engine): 센서 로그를 활용해 고해상도 4D 시뮬레이션 환경을 생성하고, 훈련 데이터용 시나리오 변형을 생성한다.
-
Edify 3DS: 자산 라이브러리에서 검색하거나 새로운 자산을 생성하여 시뮬레이션용 장면을 만든다.
이러한 기술을 통해 수천 건의 주행 시나리오를 수십억 마일의 데이터로 확장하여, 보다 안전하고 진보된 자율주행 시스템 개발에 활용한다.
3) 범용 로봇
범용 로봇의 시대가 다가오고 있다. 이 분야의 돌파구를 이끄는 핵심은 훈련이다. 인간형 로봇의 경우 모방 데이터를 수집하기 어렵지만, 엔비디아의 아이แซ크 그루트(Isaac Groot)가 이를 해결한다. 이는 시뮬레이션을 통해 방대한 데이터셋을 생성하며, 옴니버스와 코스모스의 다중 우주 시뮬레이션 엔진을 활용해 정책 훈련, 검증 및 배포를 수행한다.
예를 들어 개발자는 Apple Vision Pro를 통해 원격으로 로봇을 조작하고, 실제 로봇 없이 데이터를 수집하며, 위험 없는 환경에서 작업 동작을 가르칠 수 있다. 옴니버스의 도메인 랜덤화(Domain Randomization) 및 3D에서 실제 장면으로의 확장 기능을 통해 지수적으로 증가하는 데이터셋을 생성하여 로봇 학습에 방대한 자원을 제공한다.
요컨대 산업 시각화, 자율주행, 범용 로봇을 막론하고, 엔비디아의 기술은 물리 AI와 로봇 분야의 미래 변화를 선도하고 있다.
마지막으로 중요한 발표 하나를 더 하겠다. 이 모든 것은 10년 전 회사 내부에서 시작한 'Project Digits'라는 프로젝트 없이는 불가능했을 것이다. 정식 명칭은 Deep Learning GPU Intelligence Training System(딥러닝 GPU 지능 훈련 시스템)이며, 줄여서 Digits라 부른다.
정식 출시 전, 우리는 DGX를 회사 내부의 RTX, AGX, OVX 및 기타 제품군과 조화를 이루도록 조정했다. DGX1의 등장은 진정으로 AI의 방향을 바꿨으며, 이는 엔비디아가 AI 발전에 기여한 이정표였다.
DGX1의 혁명성
DGX1의 목적은 연구자와 스타트업에 즉시 사용 가능한 AI 슈퍼컴퓨터를 제공하는 것이었다. 과거 슈퍼컴퓨터는 전용 시설을 건설하고 복잡한 인프라를 설계하고 구축해야 비로소 존재할 수 있었다. 그러나 DGX1은 AI 개발을 위해 특별히 설계된 슈퍼컴퓨터로, 복잡한 조작 없이 박스를 열면 바로 사용할 수 있다.
2016년, 나는 첫 번째 DGX1을 스타트업 OpenAI에 전달했던 것을 기억한다. 당시 엘론 머스크(Elon Musk), 일야 수츠케버(Ilya Sutskever), 엔비디아의 많은 엔지니어들이 자리해 있었으며, 우리는 DGX1의 도착을 함께 축하했다. 이 장비는 AI 컴퓨팅 발전을 크게 앞당겼다.
오늘날 AI는 어디에나 존재한다. 연구기관과 스타트업 실험실에만 국한되지 않는다. 내가 처음 언급했듯이, AI는 이제 새로운 컴퓨팅 방식이자 소프트웨어 개발 방식이 되었다. 모든 소프트웨어 엔지니어, 창의적 아티스트, 심지어 컴퓨터 도구를 사용하는 일반 사용자에게도 AI 슈퍼컴퓨터가 필요하다. 그러나 나는 항상 DGX1이 더 작았으면 하는 바람을 가져왔다.
최신 AI 슈퍼컴퓨터
다음은 엔비디아의 최신 AI 슈퍼컴퓨터다. 여전히 Project Digits에 속하며, 아직 더 좋은 이름을 찾고 있으므로 제안을 환영한다. 이 장치는 정말 놀랍다.
이 슈퍼컴퓨터는 엔비디아의 완전한 AI 소프트웨어 스택(DGX Cloud 포함)을 실행할 수 있다. 클라우드 슈퍼컴퓨터로 사용할 수도 있고, 고성능 워크스테이션 또는 책상 위의 분석 워크스테이션으로도 활용 가능하다. 무엇보다 이 장치는 비밀리에 개발한 신규 칩 GB110을 기반으로 하며, 우리가 제작한 가장 작은 그레이스 블랙웰(Grace Blackwell)이다.
손에 칩을 들고 있는데, 내부 설계를 보여주겠다. 이 칩은 세계적인 SoC 기업 미디어텍(MediaTek)과 공동 개발했다. 이 CPU SoC는 엔비디아 전용으로 제작되었으며, NVLink 칩투칩 인터커넥트 기술로 블랙웰 GPU에 연결된다. 이 소형 칩은 이미 전면 양산에 들어갔다. 이 슈퍼컴퓨터는 약 5월경 정식 출시될 예정이다.
우리는 '이중 연산력' 구성도 제공하는데, ConnectX를 통해 여러 장치를 연결하고 GPU 다이렉트(GPUDirect) 기술을 지원한다. 이는 AI 개발, 분석 작업, 산업 응용 등 다양한 요구를 충족하는 완전한 슈퍼컴퓨팅 솔루션이다.
또한 세 가지 새로운 블랙웰 시스템 칩의 양산, 세계 최초의 물리 AI 기반 모델, 그리고 자율형 AI 에이전트 로봇, 인간형 로봇, 자율주행 자동차 등 세 가지 로봇 분야의 돌파구를 함께 발표했다.
TechFlow 공식 커뮤니티에 오신 것을 환영합니다
Telegram 구독 그룹:https://t.me/TechFlowDaily
트위터 공식 계정:https://x.com/TechFlowPost
트위터 영어 계정:https://x.com/BlockFlow_News












