
黃仁勳 2026 GTC Taipei 演講:AI 代理人時代來臨,計算就是收入
TechFlow Selected深潮精選

黃仁勳 2026 GTC Taipei 演講:AI 代理人時代來臨,計算就是收入
「計算就是收入,計算就是利潤。沒有收入和利潤,就是損失」
整理 & 編譯:深潮TechFlow

嘉賓:黃仁勳,英偉達 CEO
播客源:邦妮區塊鏈 Bonnie Blockchain
原標題:黃仁勳 2026 GTC Taipei 演講7大核心要點,輝達最新佈局懶人包!【邦妮區塊鏈】
播出日期:2026年6月2日
要點總結
在 2026 年 GTC Taipei 演講中,黃仁勳把英偉達的下一階段戰略集中到一個核心判斷:AI 已從生成內容進入能夠工作的代理人時代,Token 不再只是技術指標,而是收入、利潤和 GDP 的生產單元。圍繞這一變化,英偉達推出 Vera Rubin、Vera CPU、企業級代理人工具包、與 Microsoft 合作的新一代 PC,以及面向物理 AI 的 Cosmos 3、Alpamayo 2 和 Isaac GR00T。黃仁勳強調,未來十年的計算模式將由模型、代理人框架、工具技能和運行時共同構成,並會從雲、企業、本地 PC 擴散到機器人、工廠、衛星和邊緣設備。對臺灣供應鏈而言,這意味著 AI 工廠、功耗效率、基礎設施交付速度和全棧協同能力,將成為下一輪產業增長的關鍵。
精彩觀點摘要
AI 代理人時代的到來
- "有用的 AI 已經到來,AI 現在是利潤生成器,也是 GDP 生成器。它背後不只是大語言模型,而是一種全新的計算模式:代理人。"
- "代理人由大語言模型和代理人框架組成,框架像操作系統一樣連接記憶、工具、推理、規劃和行動。"
- "代理人系統的突破,來自大語言模型已經能夠思考、推理、規劃和使用工具,也來自代理人框架能夠管理記憶、協調流程並調度工具。"
- "每家公司都會成為代理人公司,每家公司內部都會運行代理人,也都會需要自己的代理人操作系統。"
Token、AI 工廠與基礎設施經濟學
- "Token 現在是有利潤的收入單位。AI 公司想生產更多 Token,就會建設更多 AI 工廠,這正是臺灣計算需求暴漲的原因。"
- "計算就是收入,計算就是利潤。沒有收入和利潤,就是損失。"
- "如果一座 AI 工廠只有 1 吉瓦電力,電力上限就是 1 吉瓦;在這個前提下,每瓦吞吐量就是收入,因為每一個 Token 都有價值。"
- "只因為芯片更便宜就選擇錯誤架構,並不會轉化成真正收益,你需要確保的是每瓦收入。買得越多,賺得越多。"
Vera Rubin 與英偉達的基礎設施轉型
- "Vera Rubin 不是一顆芯片,也不只是 GPU,而是一個從端到端構建的完整系統。"
- "英偉達過去是 GPU 公司,後來成為系統公司,現在正在進一步變成基礎設施公司,幫助客戶建設 AI 工廠。"
- "Vera Rubin 是英偉達歷史上最有野心的工程,全公司 4 萬名工程師都參與其中,臺灣供應鏈也共同參與了這個系統的創造。"
- "Grace Blackwell 是為處理 AI,尤其是推理而生;Vera Rubin 則是為運行代理人而生。"
Vera CPU 與代理人的計算需求
- "過去所有 CPU 都是為人類打造的,這顆 CPU 是為代理人打造的。"
- "代理人沒有耐心。它們生活的世界不是以秒為單位,而是以納秒為單位。代理人使用工具時,希望響應越快越好;訪問數據庫時,希望結果立刻返回。"
- "Vera CPU 是為代理人打造的 CPU,它強調單線程性能、每時鐘指令數、每核心帶寬和系統總帶寬。"
- "這個市場一定會比上一個市場更大,因為代理人的數量會遠遠超過人類,而且代理人非常沒有耐心。這就是 NVIDIA Vera CPU。"
下一代個人電腦
- "未來的代理人計算模式會運行在 AI 雲、企業內部,也會運行在你的 PC 上。"
- "新的操作系統將是傳統操作系統加上大語言模型;大語言模型在很多意義上就是現代版 DirectX,是計算機的智能擴展。"
- "應用程序會被代理人運行時取代,現代應用將成為一個代理人。"
- "英偉達與 Microsoft 正在重新發明 PC,並推出覆蓋桌面、筆記本和工作站的新一代 Windows 機器。"
物理 AI、自動駕駛與機器人
- "語言模型訓練的是人類視角的數據,但機器人需要從機器人自身視角理解世界,物理 AI 最大的問題是數據。"
- "Cosmos 3 是物理 AI 的前沿基礎模型,可以理解、推理、生成、閉環仿真,甚至成為策略本身。"
- "有了 AI 之後,計算本身也會變成數據;可以用 Cosmos 3 訓練更多 AI 模型,並把它增強為自己的專有模型。"
- "無論是雲端代理人、PC 代理人、自動駕駛系統還是人形機器人,背後的計算模式都是一樣的:模型、框架、工具技能和運行時。"
黃仁勳欽點臺灣小吃成 AI 供應鏈
黃仁勳:
臺灣生態系統發展到今天的規模,真的令人難以置信。大多數人談到生態系統時,首先想到的是我們的軟件棧,想到英偉達計算系統之上的開發者生態。但英偉達的生態並不止於此,它一路向上延伸到臺灣供應鏈,也就是一切開始的地方;再一路向下延伸到數據中心,最終到達終端用戶。
今天,我們幾乎會談到這個生態系統的每一個環節。這裡有太多人值得感謝。我熱愛這裡的生態系統,這裡有非常多企業,也有許多我最喜歡的生態夥伴。臺灣擁有極其豐富的生態系統,這是全球最好的供應鏈生態系統。
AI 代理人時代來臨
黃仁勳:
兩年前我來到這裡時,開始和大家談 AI 如何從生成式 AI 走向下一波浪潮,下一波 AI 是代理式 AI。今天我們可以說,代理式 AI 已經到來,有用的 AI 已經到來。
從產業角度看,這意味著 Token 的需求正在變得極其旺盛。因為如果 AI 能真正做事,人們就會想生產更多這樣的能力。Token 現在已經是有利潤的單位,是能夠產生收入的單位。既然它能賺錢,AI 公司就會想構建更多 Token、生成更多 Token、建設更多 AI 工廠,這也是臺灣計算需求暴漲的原因。
這正是大家如此忙碌、業務表現如此好的原因。事實上,它看起來也反映在你們一些公司的股價上。計算模式已經改變,一切都變了。
第一個重點是:有用的 AI 已經到來,AI 現在是利潤生成器,也是 GDP 生成器。在它背後,是一種全新的計算模式。它不只是大語言模型,而是代理人。今天我們幾乎所有內容,都會建立在這個基礎之上。
讓我花一點時間說明我在說什麼。這裡面是一個代理人,一個代理人應用。過去,這裡會是應用程序,是代碼,是操作系統,也就是應用程序裡的代碼運行在操作系統之上。今天,它是代理人,由一個或多個大語言模型組成,並被放在一個代理人框架裡。這個框架會幫助它協調工作,讓它真正完成有生產力的任務。
當輸入進入系統時,代理人必須理解、觀察、推理、行動,並使用工具。工具可以是電子表格、網頁瀏覽器、數據處理引擎,也可以是數據庫引擎。每一次信息流轉,無論是處理上下文、理解正在發生什麼、推理下一步該做什麼,還是形成可以執行的計劃,都需要由某種軟件來協調。
所以,代理人的本質就是這樣一個系統。它處理短期記憶,也就是工作記憶,也處理長期記憶,就像人類一樣。記憶管理系統因此變得極其重要。整個系統就叫做代理人。大語言模型負責思考,代理人框架把所有東西連接起來,就像操作系統一樣。
這就是新的計算模式,也是代理人能夠完成驚人任務的原因。這是一個重大突破:大語言模型已經能很好地思考、推理、規劃、使用工具;與此同時,我們也擁有了能管理記憶、協調流程、調用工具的代理人框架。因此,我們現在可以做很多過去做不到的事。
AI 工廠的 Token 是什麼?
黃仁勳:
Token、DSX、GPU、CPU、Vera……我們已經打造了下一代系統 Vera Rubin。Vera Rubin 不是一顆芯片,也不只是 GPU。它從 GPU 開始,但遠不止於 GPU。整個端到端系統,才是 Vera Rubin。
它包含 GPU、Vera Rubin NVLink 72,並由我稍後會介紹的 Vera CPU 協調。它也包括革命性的 Vera 存儲系統、CX9、我們的軟件棧 DOCA,以及內置的安全處理器。系統中的所有數據,無論是靜態存儲、傳輸過程中,還是正在被使用時,都會被加密。整個系統都是安全的,因為 AI 模型極其珍貴。這也是為什麼整套系統都遵循機密計算。
這些系統裡的任何一個,單獨拿出來都足以成為一次完整革命。Vera Rubin 是英偉達歷史上最有野心的工程。全公司 4 萬名工程師都參與了 Vera Rubin 的工作,更不用說在座各位也參與了整個系統的創造。Vera Rubin 真的是一個奇蹟,它不只是一顆芯片,而是許多組件共同構成的系統。
甚至還不止於此。很久以前,英偉達是一家 GPU 公司;這些年,我們逐漸演進成一家系統公司。你們現在看到的,是我們從零開始設計過的最複雜系統。可到最後,我們的客戶和夥伴並不是想買計算機,他們想建設 AI 工廠。
這就是英偉達再次開始轉型的原因。大家可以看到,我們的很多技術已經擴展到完整基礎設施尺度。我們的夥伴也處在基礎設施尺度上:發電廠、冷卻系統、電網供應商,以及許多工業企業,現在都成為我們生態的一部分。歸根結底,我們要構建完整技術棧,就像當初構建 GPU、Grace Blackwell、NVLink 72 一樣;現在,我們要構建全棧系統,讓客戶能夠建設出卓越的 AI 基礎設施。
做好這件事,幫助客戶建設和部署 AI 工廠,變得極其重要。原因很簡單:計算就是收入,計算就是利潤。沒有收入和利潤,就是損失。
大家需要理解一件事:當一套 AI 基礎設施上線時,它可以很快上線,也可能拖很久;吞吐量可以很高,也可以很低;彈性和可靠性可以好,也可以差;有效使用壽命可以很長,也可以很短。因為這代表 500 億、600 億,甚至 1000 億美元級別的投入,所以這條曲線極其重要。
這也是為什麼英偉達是很好的合作伙伴。我們具備完整集成能力,不只是做了一頁演示文稿,而是真正創造了整個基礎設施,把一切連接起來,並且自己大規模建設,確保系統能夠良好運行。因此,我們的首個 Token 時間、首個推理時間、訓練啟動時間都更快。
第二,我們的每瓦吞吐量、每瓦 Token 數是世界級的。原因在於我們集成所有東西,從零開始設計所有東西,模擬整個系統,並採用極致協同設計。就像剛剛展示的 Vera Rubin 機櫃,一切設計都是為了實現驚人的吞吐量。
如果你的數據中心、你的工廠擁有 1 吉瓦電力,那它就不會再有更多,這就是你能獲得的全部發電能力。在 1 吉瓦電力下,每瓦吞吐量就是收入,因為每一個 Token 都能產生利潤,每一個 Token 都是收入。
這就是未來。計算就是收入,每瓦性能就是你的收入。只因為芯片更便宜就選擇錯誤架構,並不會轉化成真正收益,你需要確保的是每瓦收入。買得越多,賺得越多。
我現在站在大家面前,可以告訴大家:Vera Rubin 已經全面投產。我們為 Vera Rubin 建立的供應鏈規模,是 Grace Blackwell 的兩倍。過去組裝一個 Grace Blackwell 機櫃需要兩個小時,現在只需要五分鐘。所以不僅產能更高,生產吞吐也快得多,而我們需要這一切來滿足需求。
這個生態系統非同尋常。為了支持 Grace Blackwell,併為 Vera Rubin 的爬坡做準備,已經有數百萬平方英尺的產能上線。我想感謝大家。Vera Rubin 已經全面投產。謝謝各位。
Vera Rubin 系統介紹
黃仁勳:
Vera Rubin 不只是為了 AI 而建。Vera Rubin 不只是為了運行 AI 而建,它是為了運行代理人而建。這是一個代理式系統。請想象其中的複雜度。也正因為如此,代理人是最後一個計算機科學突破。它花了這麼多年,才終於實現潛力並變得有用。能夠運行它的計算機,也理應是世界上最先進的。
這就是 Vera Rubin。我們來看一下。請把 Vera Rubin 帶上來。
這是 Vera Rubin,Vera Rubin NVLink 72。這是下一代系統的一部分,在下一次 GTC,我會和大家講更多;今天我們還有很多內容要談。這是 Vera CPU 機櫃,256 顆 CPU,全部液冷。我稍後會介紹 Vera。這是 Vera BlueField 存儲處理系統,也是安全系統。當然,還有我們的 Mellanox 網絡,這是全球首個 CPO。這就是 Vera Rubin,令人驚歎的技術組合在一起。
當年我們打造 Hopper,是為了預訓練。預訓練是當時最重要的應用,也是我們面對的最重要負載。後來打造 Grace Blackwell 時,大家說:"Jensen,英偉達很擅長預訓練,推理很簡單。"大家還記得嗎?當時很多人說:"推理很簡單,我們也能做。"
但大家知道,推理等於金錢。模型非常複雜,要在極高響應速度、快速交互和高吞吐之間同時做到優秀,非常困難。這就是我們創造 NVLink 72 的原因。
今天,英偉達的 Token 成本是全球最低的。不是低 10%,而是低了數倍,甚至數量級差距。這一切都因為我們做了極致協同設計,因為我們理解推理的計算模型和計算模式,並創造了 NVLink 72。
到了 Vera Rubin,事情已經超越推理。現在是代理式系統中的推理。這就是 Vera Rubin。沒有線纜,沒有軟管,沒有風扇。上一次我把它展示給大家時,線纜到處都是。
VERA CPU:AI 代理人的 CPU
黃仁勳:
Vera CPU,是為 AI 時代打造的 CPU。到目前為止,所有 CPU 都是為人打造的。我們曾經是用戶,也是租戶。人類使用 CPU 的方式,是生活在以秒計量的世界裡。我們在雲中租用 CPU,CPU 核心越多,能夠出租的資源就越多。舊 CPU 的使用場景和經濟學,與代理人完全不同。
代理人沒有耐心。它們生活的世界不是以秒為單位,而是以納秒為單位。代理人使用工具時,希望響應越快越好;訪問數據庫時,希望結果立刻返回。代理人每等待一刻,就會被阻止進入下一步、再下一步、再下一步。因此,我們必須讓 CPU 儘可能低延遲、儘可能具備交互性。
這就是我們為 AI 時代創造 Vera CPU 的原因。在我們的系統裡,它有三種用途。第一種當然是在 Vera Rubin 中用於思考。在 Vera Rubin 機櫃裡,已經有兩顆 CPU。大家知道,我們正在製造並銷售數以百萬計的 Vera Rubin,也已經賣出了數以百萬計的 Grace Blackwell。英偉達已經是全球最大的 CPU 製造商之一。
Vera Rubin 機櫃裡的兩顆 CPU,其中一顆用於協調和管理 GPU、管理 KV 緩存,並處理機櫃中運行的各種軟件。我們還有 Grace BlueField,用於安全和隔離。Vera 計算部分則用於代理人框架,負責 AI 模型的協調、工具使用和數據庫訪問。
這裡的數據服務器是 Vera BlueField,它是世界上最快的存儲服務器和存儲系統。它之所以至關重要,是因為代理人會以極高速度訪問記憶。存儲服務器和 CPU,現在已經處在數據中心最昂貴部分的關鍵路徑上。
之所以這裡最昂貴,是有充分理由的。AI 工廠的經濟學核心是 Token,而 Token 在這裡被創造出來。所以,你當然希望製造並生成儘可能多的 Token。經濟價值都集中在這裡,而 CPU 和存儲系統絕不能成為阻礙。
因此,Vera CPU 給 CPU 架構帶來了很大壓力,這也是我們從零開始打造全新架構的原因。這是一種世界從未見過的 CPU,我們稱之為 Vera。這是為代理人打造的 CPU。過去所有 CPU 都是為人類打造的,這顆 CPU 是為代理人打造的。
第一,Vera 的每時鐘指令數必須極強,因為我們需要縮短延遲,縮短處理時間。我們要的是單線程性能,而不是單純吞吐。單線程性能必須是世界級,必須是最好的。所以 Vera 的 IPC 極高,是全球最高水平:每個時鐘週期抓取、解碼並執行 10 條指令。
第二,CPU 進出數據所需的帶寬必須達到世界級。這裡既包括每核心帶寬,也包括總體帶寬。我前面說過,代理式系統本質上是解耦和分佈式的。當計算解耦並分佈式部署時,網絡就成為問題。因此,我們必須儘可能快速地在 CPU 核心之間、CPU 與存儲之間、CPU 與 GPU 之間移動數據。
系統周圍以及 CPU 核心內部的帶寬都必須達到世界級,因為 CPU 核心之間正在以極高帶寬互相通信。它們不是一個核心一個核心地出租,而是全部一起協作。Vera 的橫截面帶寬非常驚人。它是第一個支持 PCI Express Gen 6 的系統,也率先配備 LPDDR5,帶寬達到每秒 1.2 到 2 TB,是最高性能 CPU 的 2 到 3 倍。
這是為代理人打造的 CPU。這個市場一定會比上一個市場更大,因為代理人的數量會遠遠超過人類,而且代理人非常沒有耐心。這就是 NVIDIA Vera CPU。
未來十年最重要的計算模式
黃仁勳:
這真的是最重要的一頁。這裡的核心結論是:這就是未來十年的應用模式,也是未來十年的計算模式。代理人、代理人框架,以及由框架協調的大語言模型,每家公司都會運行它。每家公司都會成為代理人公司,每家公司內部都會有代理人運行,每家公司都會發現,代理人需要自己的操作系統。
每家公司都在問我們:如何安全地運行代理人?如何為自己的工作負載構建代理人?所以,我們有 NVIDIA 企業 AI 代理人工具包。大家其實已經看著我公開地一步步構建它。
英偉達做的幾乎所有事情,大家都知道,如果回看我 5 年前或 10 年前的 GTC 演講,你會看到我多年來一直在談今天這些事情,因為我們一直在為這一刻做準備。
企業要構建代理人即服務,或者構建用於運營的代理人,需要四樣東西。第一,需要模型。當然,大語言模型越聰明越好、越便宜越好、越快越好。第二,需要一個框架來協調整個系統。第三,這些模型想要使用工具,而這些工具帶有技能。我剛剛展示過 CUDA-X 庫,它們未來會成為代理人的強大工具。第四,需要一個運行時,也就是把一切連接在一起的操作系統。
這就是 NVIDIA 代理人工具包。它包括可以修改的模型,也就是 NVIDIA 世界級開源模型。我還想展示更多。你可以運行來自任何地方的代理人,可以運行 Claude Code 這樣的強大代理人,也可以運行 Codex 這樣的強大代理人。你可以把它們放進一個名為 Open Shell 的框架中,在企業內部實現高度安全的運行。
這個 Shell 會保護代理人,讓它始終受安全策略約束。隱私受到保護,權限和特權被明確分配,身份也受到保護。因此,Open Shell 正在全球範圍內被採用。NVIDIA Open Shell 是開源的,你會看到很多公司採用它,包括 Red Hat、Canonical 和 Microsoft。它會被到處採用。
這是一個重要運行時,而且這個運行時完全針對無處不在的 NVIDIA AI 平臺優化。你可以在任何雲、本地環境,甚至設備端運行 Open Shell。現在,你有代理人可以使用的工具和庫,有可以修改或直接使用的模型,也有代理人框架。這些代理人框架現在可以在本地或其他任何地方運行。
我最喜歡的代理人用例之一,是芯片設計師。這是英偉達最重要的工作之一。因此,我們當然要和 Cadence 合作,構建一個芯片設計超級代理人。它由 Codex 或 Claude Code 協調,以 RTL、架構圖、原理圖或規格說明作為輸入,幫助你修復需要修復的內容。我們共同打造了一些超級代理人,並用 Nemotron 針對 NVIDIA 運行時進行了優化。
英偉達致力於為世界構建開放模型,讓你們、讓我們所有人都能創造自己的代理人。今天,我們宣佈 Nemotron 3 Ultra,這是我們的下一代開放模型,而且非常聰明。Nemotron 模型不僅給你模型,也給你我們用於訓練模型的全部數據。
因為我們擁有一個強大的合作伙伴聯盟,大家可以看到這裡列出的所有夥伴。我們共同合作、彼此貢獻數據。通過這些偉大合作關係,從模型到訓練腳本,再到數據,全部都會完整開放給你們。這是開放模型的最佳形態,也是世界上最好的開放模型系統政策。目標很簡單:你可以拿走所有內容,在上面繼續增加,讓它變得更好,並讓它成為你自己的模型。
Nemotron 3 Ultra 速度快了 5 倍,成本也降低了 30%,並且完全開放。我們對此非常堅定。這是 Nemotron 3,我們現在也正在開發 Nemotron 4。正是這套由模型、框架、工具技能和運行時構成的完整工具包,讓全球每一家企業都能像 Cadence 用超級代理人那樣,創造屬於自己的代理人。
NVIDIA 新一代個人電腦
黃仁勳:
Microsoft 和 NVIDIA 將重新發明 PC。這將成為新的 PC。明晚,應該是我們這裡的明晚,我會和 Satya 一起,談更多我們過去三年共同推進的工作。Microsoft 與 NVIDIA 花了這麼長時間,徹底重新思考 PC 的運行方式,就是為了準備好迎接這一刻。
正如我前面提到的,代理人這種計算模式會運行在 AI 雲中,會運行在企業內部,也會運行在你的 PC 上。當 PC 擁有一個自主代理人時,會發生什麼?它會幫助你,理解你。你可以和它說話,它可以看見你。你可以讓它讀文件,幫你做研究。它還能做更多事情,我稍後會展示。
新的操作系統,當然是舊操作系統加上大語言模型。在很多意義上,大語言模型就是現代版 DirectX。它有輸入和輸出,理解提示詞,理解計算機視覺,可以生成視頻,也可以生成聲音。它是 PC、也是計算機的現代智能擴展。
在此之上,正如我前面說過,應用程序將被代理人運行時取代,而現代應用就是代理人。
各位,NVIDIA RTX Spark 筆記本電腦。謝謝。我口袋裡的東西太多了。好了,這是世界上最驚人的芯片。這是我們與 MediaTek 合作打造的 N1X。我剛才好像看到了 Rick。這是 N1X,一顆漂亮的芯片。坦率說,這是一顆需要 33 年才能打造出來的芯片。
原因在於,100% 的 NVIDIA 軟件棧都能在這裡運行。你想做數字生物學,沒問題;想做地震處理,沒問題;想做天體物理,沒問題。所有與 CUDA 相關的東西,所有物理、所有生物學、所有基因組學、所有 AI,都沒有問題。所有計算機圖形,也沒有問題。
英偉達創造過的每一個應用,以及 Windows 曾經運行過的每一個應用,Microsoft 和 NVIDIA 都細緻優化過,讓這臺計算機真正能夠運行世界曾經創造過的一切。除此之外,它現在還能運行代理人。這是一臺令人難以置信的計算機,我為它感到非常自豪。
這臺計算機可以擁有本地 Nemotron 3 Ultra 模型,或者 Nemotron 3 超級模型;也可以連接雲端的 Claude Code、Codex,或其他模型;也可以連接網絡上的模型。它會工作,並完成驚人的事情。RTX Spark 是對筆記本電腦的重新發明,但事實上,Microsoft 和 NVIDIA 正在重新發明整個 PC。
今天,我們宣佈一個全新產品線:三款革命性的 Windows 機器,覆蓋桌面、筆記本和工作站。它們 100% 兼容 Windows,100% 支持 CUDA,100% 搭載 NVIDIA AI Tensor Core。你在全球各種 NVIDIA 平臺上看到能運行的一切,都能在這裡運行。
我們為此準備了路線圖。這是一個全新的產品家族。每一代架構,我們都會有桌面、筆記本、工作站;下一代仍然會有桌面、筆記本、工作站。我非常高興,也非常榮幸的是,全球 100% 的 PC 行業都加入我們,一起重新發明 PC。這是一個新產品線,也是一個新的開始。
Cosmos 3:物理 AI 的基礎模型
黃仁勳:
在語言模型的場景中,我們在互聯網上訓練所用的英文和各種語言,都是從人類視角出發的。它們由我們書寫,也由我們閱讀。然而,如果要為 AI 機器人創造數據,就必須從機器人的感知和視角出發。世界上絕大多數視頻數據是第三人稱視角,而不是第一人稱視角。
因此,對於代理式系統、機器人系統和物理 AI 來說,數據是最難的問題。大家已經看到我們沿著這條階梯向上推進。我們從遙操作開始,本質上就是人類示範。這和強化學習中的人類反饋突破並沒有不同。之後,我們使用仿真,這就是 Omniverse 發揮作用的地方。這也類似於強化學習中的可驗證獎勵。
我們用這些系統來啟動 AI 模型,啟動物理 AI 模型。最終,我們能夠從第三人稱視角學習,並把它重新投射到第一人稱視角。通過這種啟動過程,我們最終擁有了一個世界基礎模型,它能夠從任何你想要的視角理解物理世界。第三人稱、第一人稱、由外向內、由內向外,都可以。這確實是一個重大突破。
今天,我們宣佈 Cosmos 3。Cosmos 3 是物理 AI 的前沿。我們在語言模型上處在前沿,許多人也在研究語言模型。但在物理 AI 上,我們絕對是全球最強。我為團隊能做到這一點感到無比自豪。
這是你們所有工作的基礎模型。無論你想創造機器人、工廠機器人,還是在工廠裡工作的機器人,只要涉及物理世界,你現在都有一個夥伴:Cosmos 3。它可以理解和推理,可以生成,可以在閉環中仿真,甚至可以成為策略本身。它在全球各類榜單上都處在領先位置。我為 Cosmos 感到非常自豪。今天,我們宣佈 Cosmos 3。
過去是數據加計算得到 AI。現在我們有了 AI,計算也會成為數據。所以,使用 Cosmos 3,訓練一大批 AI 模型。Cosmos 是一個非常出色的開放模型系統,它和 Nemotron 完全一樣。我們開放模型,開放數據,甚至開放訓練方法,讓你可以為自己增強它,並把 Cosmos 變成你的專有模型。
Alpamayo 2:自駕車推理
黃仁勳:
今天,我們宣佈 Alpamayo 2,這是一個面向自動駕駛汽車的開放模型。我們正與全球汽車公司合作。如果看這些已經加入 NVIDIA Hyperion、正在打造 NVIDIA Hyperion 汽車的品牌,它們代表了全球大約 80% 的汽車。也就是說,這些製造商覆蓋了全球 80% 左右的汽車。
未來會有大量 NVIDIA Hyperion 系統,它們能夠運行 Alpamayo,也能夠運行任何其他自動駕駛技術棧。我們也連接到出行服務。全球大約 97% 的出行服務正在與我們連接。因此,當我們把 Alpamayo 部署在 Hyperion 運行時和 Halos 操作系統上時,我們就能連接全球這些服務。
Isaac GR00T:人形機器人
黃仁勳:
NVIDIA Isaac GR00T 是我們的人形機器人技術棧,包含模型、數據生成、仿真、運行時以及操作系統。它代表了 GR00T 平臺,也就是 Isaac GR00T 平臺。
大家可以看到,我們每一個系統都遵循完全相同的模式:無論是雲端代理式系統、PC 上的代理式系統、自動駕駛汽車的機器人系統,還是人形機器人的機器人系統,都是同一種模式。
當然,在每一個案例裡,我們都會完整構建一切。我們做垂直整合,做徹底集成,採用協同設計和極致協同設計,然後再把它開放出來,讓每個人按自己需要使用其中任何部分。你想使用什麼,我們甚至會幫助你修改。
但現在還缺少一件事:機器人系統需要一個參考平臺。這些機器人系統太複雜了,有大量馬達和傳感器,也非常脆弱。然而,我們需要一種方式交付這些參考平臺。就像我們為 PC、DGX、雲和自動駕駛汽車所做的那樣,現在我們也要為機器人這麼做。
今天,我們宣佈 NVIDIA Isaac GR00T,這是一個完全整合的人形機器人參考平臺。它每隻手有 25 個自由度,機器人本體有 31 個自由度,高 6 英尺,重 150 磅。就像我一樣,只是第一個數字比我小,第二個數字比我大,其他方面差不多。
這個平臺運行新的 Thor,以及我們的完整軟件棧、數據生成棧、數據仿真棧和運行時。所有東西都整合進一個機器人平臺,供所有人使用。我們是為高等教育和大學研究人員打造它的,因為對他們來說,自己構建這樣的平臺實在太難了。
覆盤總結
黃仁勳:
過去六個月,計算機行業已經被徹底改變。變化發生的原因是代理人終於被實現了,並且與最新前沿模型匯合,讓 AI 現在能夠真正做有用的工作。
這種計算模式會一遍又一遍重複:一個代理人由模型和框架組成,使用帶有技能的工具,並運行在某個運行時之上。運行時取決於它是在雲端、本地企業環境、PC,還是機器人裡。但計算模式完全一樣。
你會根據自己的偏好使用不同框架,也會根據自己的偏好使用不同模型。你會為了自己的專有用途改進它們。你會創造超級代理人,把它們租給別人,幫助別人完成工作。這個代理式平臺、這種代理式模式,正是 NVIDIA 企業 AI 工具包要支持的東西。對你們來說,這是參與 AI 的很好方式;對我們來說,這也是巨大的增長機會。
Vera Rubin 已經全面投產。Grace Blackwell 是為了處理 AI,尤其是推理而打造的;Vera Rubin 是為了運行代理人而打造的。它已經全面投產。它遠遠不只是一顆 GPU,而是一整個解耦、分佈式的代理人處理系統。
英偉達已經真正成為一家基礎設施公司。不只是 GPU 公司,不只是系統公司,而是基礎設施公司。我們的目標是幫助你們創造最大收入、最大利潤,並儘可能快地做到這一點。
在代理人世界裡,這種新的計算方式意味著 CPU 也要為代理人而建,而不是為人而建。為代理人打造的 CPU 有自己的特殊需求。我們的 NVIDIA Vera 是一次革命。我很高興看到它的爬坡和訂單情況,它會成為英偉達歷史上最快、最成功的產品發佈。
NVIDIA 和 Microsoft 已經創造了全新的 PC 產品線。這是一個新的開始。當然,我剛才描述的同一種代理式處理模式、代理式計算模式,也會運行在各種設備上。我提到了 PC,但未來它會出現在機器人、衛星、基站、工廠、雲端、本地、邊緣設備中。這種代理式 AI 系統和代理式計算模式,會在各種計算機中不斷複製。我們對個人電腦的理解,很可能會發生變化。
歡迎加入深潮 TechFlow 官方社群
Telegram 訂閱群:https://t.me/TechFlowDaily
Twitter 官方帳號:https://x.com/TechFlowPost
Twitter 英文帳號:https://x.com/BlockFlow_News














