
黃仁勳最新訪談:逼 DeepSeek 與華為深度綁定,這對美國太可怕了
TechFlow Selected深潮精選

黃仁勳最新訪談:逼 DeepSeek 與華為深度綁定,這對美國太可怕了
關於對華出口,他批評極端的出口管制政策十分幼稚。
整理:小小,網易智能
英偉達 CEO 黃仁勳最近接受了美國知名科技播客主持人德瓦克什·帕特爾(Dwarkesh Patel)的專訪,全面回應了關於公司護城河、谷歌 TPU 競爭、對華芯片出口等關鍵議題。
他強調英偉達的護城河已延伸至供應鏈深處,通過上千億美元的採購承諾與臺積電及存儲供應商建立了深度綁定。
對於 TPU 競爭,黃仁勳指出 Anthropic 只是 ASIC 增長的獨特個例而非趨勢。英偉達的加速計算覆蓋了分子動力學、數據處理、流體力學等遠超越 AI 的廣闊市場,且 CUDA 的高可編程性使其能每年實現 10到 50 倍的性能飛躍。
他同時解釋了為何英偉達不親自成為超大規模雲服務商。儘管現金流充沛,英偉達仍恪守做必須做的事且儘可能少做的原則,選擇通過投資 CoreWeave、OpenAI、Anthropic 等支持生態系統,而非親自下場與客戶爭利。他同時承認未能更早大規模投資 Anthropic 是自己的失誤。此外他強調即使 AI 革命從未發生,英偉達仍會憑藉加速計算在物理、化學、數據處理等領域成為一家非常大的公司。
關於對華出口,他批評極端的出口管制政策十分幼稚。黃仁勳指出 AI 算力是芯片與能源的結合,儘管受到 EUV 光刻機的限制,中國仍擁有龐大的 7nm 芯片製造能力。考慮到當前主流大模型主要還是在 Hopper 這一代架構上訓練,中國完全可以通過充沛的電力能源和擴大芯片集群規模,來彌補單顆芯片的性能差距。
不僅如此,中國龐大的 AI 研究團隊正通過更高效的計算機科學來提升模型性能。黃仁勳以 DeepSeek 為例警告稱這絕非無關緊要的進步。如果這類優秀的開源模型被迫專門針對華為等本土硬件進行深度優化且運行效果最佳,客觀上將直接削弱美國技術棧的全球優勢。他認為主動放棄全球第二大市場將迫使中國建立獨立於美國的底層計算架構。隨著這些基於開源標準的技術逐步向全球南方輸出,美國極有可能在長期的 AI 生態標準競爭中陷入被動。
以下為黃仁勳專訪全文:
控制供應鏈是英偉達最大護城河?
帕特爾:很多軟件公司估值在跌,因為大家覺得 AI 會把軟件變成大宗商品。有種看法是英偉達把設計文件發給臺積電,臺積電造邏輯芯片和開關,再用 SK 海力士、美光、三星的 HBM 封裝,然後送到臺灣地區的 ODM 那裡組裝成機架。本質上英偉達做的是軟件,硬件是別人造的。如果軟件被商品化,英偉達是否也會被商品化?
黃仁勳:最終總得有人把電子轉化成 Token。這個轉化過程很難被完全商品化。讓一個 Token 比另一個更有價值就像讓一個分子比另一個分子更有價值一樣,需要大量的技術、工程、科學和發明。這些工作遠未被完全理解也遠未結束。我不認為這種被商品化的情況會發生。
但我們會讓這個過程變得更高效。你問這個問題的方式其實就是我對公司的思考模型,輸入是電子且輸出是 Token,中間是英偉達。我們的原則是做必要的事但儘量少做。所謂儘量少做就是我自己不需要做的就找夥伴合作,讓它成為我生態系統的一部分。
今天的英偉達可能是擁有最大合作伙伴生態系統的公司,包括上游下游供應鏈、所有計算機公司、應用開發者、模型廠商。AI 就像一個五層蛋糕,我們在每一層都有自己的生態。我們儘量少做但我們必須做的那部分極其困難,我不認為那部分會被商品化。
另外我也不覺得企業軟件公司會被商品化。現在大多數軟件公司是工具廠商,比如 Excel、PowerPoint、Cadence、Synopsys。我的看法和很多人相反,AI 智能體的數量會指數級增長且工具用戶的數量也會指數級增長。這些工具的實例數量很可能會暴增。
比如 Synopsys 的設計編譯器會有大量智能體來用它做佈局、設計規則檢查。今天限制我們的是工程師數量,明天每個工程師身後都會有一群智能體。我們能用前所未有的方式探索設計空間,用的還是今天的工具。工具的高頻使用會讓軟件公司飛速發展。現在之所以還沒發生是因為智能體還不夠會用工具。要麼這些軟件公司自己造智能體,要麼智能體會變得足夠好去熟練使用這些工具,我覺得兩者都會發生。
帕特爾:我看你最新的文件裡對代工廠、內存、封裝有近 1000 億美元的採購承諾。半導體研究機構 SemiAnalysis 認為這個數字會達到 2500 億美元。一種解讀是英偉達的護城河在於鎖定了未來多年的稀缺組件。別人或許有加速器但拿不到內存和邏輯芯片。這是否是你們未來幾年的主要護城河?
黃仁勳:這是我們能做到而別人很難做到的事情之一。我們向上遊做了巨大承諾,有些是顯性的就是你提到的那些。有些是隱性的,比如上游很多投資是我跟那些 CEO 說我來告訴你這個行業會有多大、為什麼會有這麼大,我推理給你看並讓你看到我所看到的,然後他們才投的。
他們為什麼願意為我投資而不是為別人?因為他們知道我有能力買下他們的供應並通過我的下游賣出去。英偉達的下游需求和下游供應鏈太龐大了,所以他們願意在上游投資。
你看 GTC 大會,大家驚歎於它的規模和人氣。那是整個 AI 社區聚在一起,因為他們需要互相交流與被看見。我讓他們聚在一起,讓下游看到上游且上游看到下游,所有人看到 AI 的進步。他們還能見到所有 AI 原生代、所有初創公司。這樣他們就能親眼驗證我告訴他們的事情。我花大量時間,直接或間接地讓供應鏈、合作伙伴、生態系統理解面前的機會。
有人說我的主題演講像是在上課且有點折磨人。其實那就是我的用意。我得讓整個供應鏈、上下游、生態系統理解即將發生什麼、為什麼發生、何時發生、規模多大,並且能像我一樣系統性地思考。
關於護城河我們其實是在為未來提前佈局。如果我們未來幾年真的成長到萬億美元規模,到那時自然有能力搭建與之匹配的供應鏈。但前提是沒有我們今天的業務體量和影響力也沒有我們業務的高速流轉,就像現金流一樣供應鏈也有自己的流轉和週轉速度。如果業務週轉慢沒有人會願意為一個空架子搭建供應鏈。我們今天能維持這樣的規模,根本原因在於下游需求極其旺盛。當他們親眼看到、聽到、意識到這一切正在真實發生,才讓我們得以在現有規模下做成現在這些事。
帕特爾:我想具體瞭解一下上游能否跟得上。你們連續多年收入翻倍,每年向世界提供的算力增長超過兩倍。
黃仁勳:在這個規模上還能翻倍確實很驚人。
帕特爾:但你看邏輯芯片。你們是臺積電 N3 節點的最大客戶也是 N2 節點的最大客戶之一。SemiAnalysis 發現今年 AI 會佔 N3 產能的 60%,明年到 86%。如果你已經佔了大頭怎麼翻倍?年復一年地翻倍?我們是否已經進入一個階段,即 AI 算力增速必須因為上游限制而放緩?你看到解決辦法了嗎?歸根到底我們怎麼才能年復一年地把晶圓廠產能也翻一倍?
黃仁勳:在任何一個時間點,瞬時需求都可能大於全球上下游的總供應。甚至可能被水管工數量限制,這確實發生過。
帕特爾:水管工應該被邀請參加明年的 GTC。
黃仁勳:好主意。但這其實是個好現象。你希望一個行業的瞬時需求大於總供應,反過來就不太好了。如果某個組件缺口太大,整個行業會蜂擁去解決。你看現在已經沒太多人討論 CoWoS 了。因為過去兩年我們拼命解決這個問題現在情況已經不錯了。臺積電現在知道 CoWoS 的供應必須跟得上邏輯和內存的需求。他們正在以和擴展邏輯同樣的速度擴展 CoWoS 和未來封裝技術。這非常好,因為 CoWoS和 HBM 內存以前是比較小眾的,現在它們成了主流計算技術。
我們現在能影響更廣泛的供應鏈了。AI 革命剛開始時我說的這些話五年前就說過了。有人相信並投資了,比如美光 CEO 桑傑·梅赫羅特拉(Sanjay Mehrotra)及其團隊。我清楚記得那次會議,我準確地說明了會發生什麼、為什麼發生以及今天的狀況。他們真的加倍投入了。我們在 LPDDR和 HBM 內存上合作,他們大力投資結果取得了巨大的成功。有些人來得晚一些但現在都來了。
每個瓶頸都會得到大量關注。我們現在提前幾年就開始預判瓶頸。比如過去幾年我們在 Lumentum、Coherent 和硅光生態系統上的投資,重塑了供應鏈。我們圍繞臺積電建立了整個供應鏈並和他們合作開發硅光整合平臺 COUPE,發明了很多技術並把專利授權給供應鏈保持開放。
我們通過發明新技術、新流程、新測試設備比如雙面探測、投資公司幫他們擴產來增強供應鏈。我們在努力塑造生態系統,讓供應鏈能夠支撐這個規模。
帕特爾:有些瓶頸好像比其他瓶頸容易解決,比如 CoWoS 擴產。
黃仁勳:我們負責克服最難的那個。
帕特爾:哪個?
黃仁勳:水管工和電工。這是我擔心那些末日論者的地方。他們說工作要消失、崗位要完蛋。如果我們阻止人們成為軟件工程師,我們就會耗盡軟件工程師。十年前就有同樣的預言。有些末日論者說無論如何別當放射科醫生,你現在還能在網上看到那些視頻說放射科會是第一個消失的職業,世界再也不需要放射科醫生了。猜猜我們現在缺什麼?放射科醫生。
帕特爾:有些東西可以規模化有些則不行,你每年怎麼造出兩倍的邏輯芯片?最終內存和邏輯都受限於 EUV 光刻機。你怎麼年復一年地拿到兩倍的 EUV 光刻機?
黃仁勳:這些產能都是可以快速規模化的,兩三年內就能做到。你只需要向供應鏈發出一個需求信號。能造一個就能造十個,能造十個就能造一百萬個。這些東西複製起來並不難。
帕特爾:你會在供應鏈裡走多遠?會直接去找 ASML 說三年後英偉達要做到年收入兩萬億美元,我們需要多得多的 EUV 光刻機嗎?
黃仁勳:有些要直接說,有些間接說。如果能說服臺積電,ASML 也會被說服。我們要找到關鍵的瓶頸點。但如果臺積電被說服了,幾年內你就會有足夠多的 EUV。
我的觀點是沒有任何瓶頸會持續超過兩三年。與此同時我們還在把計算效率提高 10 倍、20 倍,Hopper到 Blackwell 是30到 50 倍。因為 CUDA 很靈活我們在不斷髮明新算法、新技術,在增加容量的同時提高效率。這些事情都不讓我擔心。讓我擔心的是我們下游的東西。能源政策阻止能源擴展,而沒有能源你建不了新產業。沒有能源你沒法搞一個新的製造業。
我們要讓美國再工業化。我們要把芯片製造、計算機制造、封裝帶回來。我們要造電動汽車、機器人。我們要造 AI 工廠。沒有能源這些都建不起來,而能源需要很長時間。芯片產能是兩三年能解決的問題。CoWoS 產能也是兩三年能解決的問題。
TPU 會打破英偉達對 AI 算力的控制嗎?
帕特爾:世界上排名前三的模型裡,有兩個即 Claude和 Gemini 都是在谷歌 TPU 上訓練的。這對英偉達意味著什麼?
黃仁勳:我們做的東西很不一樣。英偉達做的是加速計算,不只是一個張量處理單元。加速計算可以用在很多地方,涵蓋分子動力學、量子色動力學、數據處理、結構化數據、非結構化數據、流體動力學、粒子物理。除此之外也做 AI。
加速計算比這廣泛得多。雖然 AI 是當下的話題且顯然很重要和影響很大,但計算比這寬泛得多。英偉達重塑了計算的方式,從通用計算轉向加速計算。我們的市場覆蓋範圍比任何 TPU或 ASIC 都要大得多,我們是唯一一家能加速各種應用的公司。我們有巨大的生態系統,各種框架和算法都能在英偉達上跑。
因為我們的計算機設計成讓別人可以操作,所以任何運營商都能買我們的系統。而大部分自建系統你得自己當運營商,因為它們的靈活性不夠導致別人操作不了。因為誰都能搭建並操作我們的系統,所以我們存在於每一個雲裡,包括谷歌、亞馬遜、Azure 以及甲骨文的雲平臺。
如果你想租給別人用,那你最好有來自很多行業的龐大客戶群做承購方。如果你想自己用,我們當然也能幫你自己運營,就像我們在 xAI 幫馬斯克那樣。而且我們能讓任何公司、任何行業的運營商都具備能力,你可以給禮來公司建一臺用於科學研究和藥物發現的超級計算機,我們可以幫他們運營,用於整個藥物發現和生物科學領域。
有一大堆應用是 TPU 做不了的。英偉達的 CUDA 也是一個很棒的張量處理單元,但它還能處理數據處理的每一個環節、計算、AI 等等。我們的市場機會大得多,覆蓋範圍廣得多。因為我們支持現在世界上每一個應用,你可以在任何地方建英偉達系統並且知道一定會有客戶。這是一個很不一樣的局面。
帕特爾:你們的收入很驚人但不是來自制藥也不是來自量子計算,而是主要來自 AI。因為 AI 這個前所未有的技術正在以史無前例的速度增長。那問題就來了,什麼才是對 AI 本身最有利的?TPU 本質上是一個巨大的脈動陣列,特別擅長做矩陣乘法。GPU 則更靈活且適合那些有很多分支判斷或者內存訪問不規則的任務。但問題在於 AI 到底在幹什麼?說白了 AI 就是一遍又一遍地做那些非常可預測的矩陣乘法。既然如此你為什麼還要在芯片上留出面積給線程束調度器或線程與內存體之間的切換這類通用功能呢?這些面積本來可以全部用來做矩陣乘法。而 TPU 恰恰就是專門針對當下正在爆發的那部分計算需求設計的。你覺得呢?
黃仁勳:矩陣乘法是 AI 的重要部分但不是全部。如果你想出一種新的注意力機制、換一種分解方式、或者發明一個全新的架構即混合狀態空間模型(SSM),你需要一個普遍可編程的架構。如果你想做一個融合了擴散模型和自迴歸的模型,你需要的也是一個普遍可編程的架構。我們能跑你能想到的任何東西。這就是優勢。因為它是可編程的,所以發明新算法要容易得多。
發明新算法的能力才是 AI 進步這麼快的原因。TPU 和其他東西一樣都受摩爾定律影響,每年大概進步 25%。要每年實現 10 倍或 100 倍的飛躍,唯一的方法是每一年都從根本上改變算法和計算方式。
這就是英偉達的根本優勢。Blackwell比 Hopper 能效高 50 倍。我第一次說 35 倍時沒人信。後來有人寫文章說我留了一手實際上是 50 倍。單靠摩爾定律做不到,我們靠的是新模型比如專家混合模型(MoE),它們被並行化、分解、分佈在整個計算系統裡。如果沒有 CUDA 也沒有真正深入去寫新內核的能力,這很難做到。
這是可編程架構和英偉達極端協同設計能力的結合。我們甚至可以把一些計算卸載到網絡結構本身比如 NVLink,或者網絡裡的 Spectrum-X。我們可以同時改變處理器、系統、網絡結構、庫和算法。沒有 CUDA 我根本不知道從哪下手。
帕特爾:這引出一個關於英偉達客戶的有趣問題。你們 60%的收入來自五個超大規模雲廠商。在另一個時代客戶是教授做實驗,他們需要 CUDA 且用不了別的加速器,他們只需要用 CUDA跑 PyTorch 且一切都優化好了。但這些超大規模雲廠商有能力自己寫內核。事實上為了從特定架構裡擠出最後 5%的性能,他們必須這麼做。Anthropic 和谷歌主要跑自己的加速器即 TPU和 Trainium。就連用 GPU的 OpenAI 也有 Triton 因為他們需要自己的內核。他們不用 cuBLAS和 NCCL 而是有自己的軟件棧也能編譯到其他加速器上。如果你的大部分客戶能且正在做 CUDA 的替代品,那 CUDA 在多大程度上還是前沿 AI 跑在英偉達上的關鍵因素?
黃仁勳:CUDA 是一個豐富的生態系統。如果你想在任何計算機上做開發,首選 CUDA 是非常明智的。因為生態系統太豐富了,我們支持每一個框架。如果你想寫自定義內核,我們對 Triton 的貢獻巨大,Triton 的後端有大量英偉達技術。
我們很樂意幫助每一個框架變得更好。框架很多比如 Triton、vLLM、SGLang。現在又冒出一堆強化學習框架比如 verl和 NeMo RL。後訓練和強化學習這塊正在爆炸。所以如果你想基於某個架構做開發選 CUDA 最有意義,因為你知道它的生態很好。
你知道如果出了問題,問題更可能出在你自己的代碼裡而不是底下那堆積如山的底層系統上。別忘了你面對的是多麼龐大的代碼規模。當系統不工作時你要問自己是我錯了還是計算機錯了?你當然希望每次都發現是自己錯了,因為只有這樣你才能始終信任計算機。顯然我們自己還有很多 bug。但關鍵在於我們的系統已經被無數次檢驗過,你可以放心地在上面構建。這就是我想說的第一點即生態系統的豐富性、可編程性和能力。
第二點如果你是個開發者,你最想要的是一個裝機基礎。你希望自己的軟件能跑在很多其他計算機上。你不是隻為自己寫軟件而是為你所在的集群或別人的集群寫,因為你是框架開發者。英偉達的 CUDA 生態系統最終就是它最大的財富。
我們現在有數億個 GPU 在外面,每個雲裡都有。從 A10、A100、H100、H200到 L 系列、P 系列以及各種尺寸和各種形狀。如果你是個機器人公司,你希望那個 CUDA 堆棧能直接在機器人內部運行。我們幾乎無處不在。這個裝機基礎意味著一旦你開發了軟件或模型,它在任何地方都能用。這個價值無可估量。
最後我們存在於每一個雲裡,這讓我們真正獨一無二。如果你是個 AI 公司或開發者,你不確定會和哪個雲服務商合作也不知道想把負載跑在哪裡。沒關係,我們無處不在包括你自己的機房。生態系統的豐富性、裝機基礎的廣泛性、存在位置的多樣性,這些加在一起讓 CUDA 價值連城。
帕特爾:有道理。但我想問的是這些優勢對你最大的客戶來說到底有多重要?對很多人來說 CUDA 可能很有價值。但你收入的大頭其實來自那些有能力自己搭建軟件棧的大客戶。特別是如果未來 AI 進入一些可以用強化學習進行嚴格驗證的領域,那問題就變成了誰能寫出在大型集群上跑得最快的矩陣乘法和注意力內核?這是一個非常可驗證的優化問題。
那些超大規模雲廠商完全有能力自己寫這些定製內核。當然英偉達的性價比可能還是更好所以他們可能依然會選擇英偉達。但這樣一來問題就變成了最後是不是隻比誰的硬件規格更好以及每美元能買到的算力和帶寬更多?
歷史上英偉達靠著 CUDA 護城河,在 AI 硬件和軟件上都能保持 70%以上的利潤率。但現在的問題是如果你最大的客戶其實有能力繞過這條護城河,你還能維持這麼高的利潤率嗎?
黃仁勳:我們分配給這些 AI 實驗室的工程師數量是驚人的,跟他們一起工作優化他們的軟件棧。原因是沒人比我們更懂我們的架構。這些架構不像 CPU 那麼通用。CPU 有點像凱迪拉克且好開和不飆快車,誰都能開得不錯且有巡航控制,一切都很簡單。而英偉達的 GPU 和加速器更像 F1 賽車。我能想象每個人都能開到 160 公里時速,但要推到極限需要相當多的專業知識。我們用大量 AI 來寫內核。
我很確定在相當長一段時間內我們仍然會被需要。我們的專業知識常常能讓 AI 實驗室合作伙伴輕鬆再提升 2 倍性能。優化完一個內核或整個軟件棧後,模型速度提升 50%、2 倍乃至 3 倍,這很常見。考慮到他們擁有所有 Hopper和 Blackwell 的集群規模,這是一個巨大的數字。提升一倍直接等於收入翻倍。
英偉達的計算堆棧在總擁有成本 TCO 上是全世界最好的,沒人能比。沒有任何一個平臺能向我展示出比我們更好的性能與 TCO 比。Dylan的 InferenceMAX 基準測試就擺在那裡,誰都可以用。但 TPU 不來測且 Trainium 也不來測。我很鼓勵他們用 InferenceMAX 來展示自己所謂的超低推理成本。但很難因為沒人願意來。
還有 MLPerf,我也很想讓 Trainium 來展示他們一直宣稱的 40%優勢。也很想聽他們展示 TPU 的成本優勢。但在我看來從第一性原理出發他們說的那些優勢完全說不通。所以我認為我們成功的原因很簡單就是我們的 TCO 太好了。
第二你說我們 60%的客戶是前五大雲廠商,但這些業務大部分是面向外部的。比如 AWS 中使用英偉達的芯片大部分是給外部客戶而不是內部用。Azure 裡的客戶顯然也都是外部的,甲骨文的同樣如此。他們青睞我們是因為我們的影響力大,我們能給他們帶來全世界最優秀的客戶且這些客戶都建在英偉達上。而這些公司之所以建在英偉達上,是因為我們的影響力和多功能性太強了。
所以我認為這個飛輪是裝機基礎、架構的可編程性、生態系統的豐富性,再加上世界上有成千上萬家 AI 公司。如果你是 AI 初創公司你會選哪個架構?你會選最豐富的而我們就是最豐富的,你會選安裝基礎最大的而我們就是最大的,你會選生態最完善的。這就是飛輪。
結合以上幾點來看我們的每美元性能最好且客戶的 Token 成本最低。我們的每瓦性能世界最高,所以如果一個合作伙伴建了一個 1 吉瓦的數據中心,這個數據中心最好能產出最大量的收入和 Token,這直接等於收入。你希望它產出儘可能多的 Token 來最大化收入,而我們是世界上每瓦 Token 數最高的架構。另外如果你的目標是出租基礎設施,我們有世界上最多的客戶。這就是飛輪運轉的原因。
帕特爾:有意思。我想問題歸根結底是實際的市場結構到底是什麼樣?因為即使有其他公司存在,可能有一個世界裡面成千上萬家 AI 公司每家都佔大致相等的算力份額。但現實情況是即便通過這五大雲廠商,真正在亞馬遜上用算力的其實是 Anthropic、OpenAI 以及那些大型基礎實驗室。這些大玩家自己有能力也有資源讓不同的加速器跑起來。
如果你說的這些關於性價比和每瓦性能等等都是真的,那為什麼像 Anthropic 這樣的公司幾天前剛宣佈和博通與谷歌達成一項涉及多吉瓦的 TPU 交易,把他們大部分算力放在上面?對谷歌來說 TPU 也佔了他們絕大部分算力。所以如果我看這些大型 AI 公司似乎他們的算力曾經全是英偉達現在不是了。我很好奇如果紙面上這些優勢都成立,他們為什麼偏偏選了別的加速器?
黃仁勳:Anthropic 只是一個特例並不是什麼大趨勢。你可以想一想如果沒有 Anthropic 這家公司,TPU 哪來的增長?百分之百是因為 Anthropic。同樣如果沒有 Anthropic,Trainium 又哪來的增長?百分之百也是因為 Anthropic。這基本上是公開的秘密了。不是什麼 ASIC 的機會變得很多而是隻有一個 Anthropic 而已。
帕特爾:但 OpenAI和 AMD 有交易且他們自己在造 Titan 加速器。
黃仁勳:是的,但我覺得大家都承認他們絕大部分算力還是跑在英偉達上。我們仍然會一起做很多工作。我不介意別人用別的東西、嘗試別的東西。如果他們不嘗試怎麼知道我們的有多好?有時候你需要被提醒一下。我們必須不斷贏得我們現在的位置。
總有人誇下海口。你看看有多少 ASIC 項目被取消了。僅僅因為你要造一個 ASIC 你還得造出比英偉達更好的東西這沒那麼容易。實際上這不合理除非英偉達一定有什麼缺陷。但我們的規模和速度擺在這裡,我們是世界上唯一一家每年都推出新品的公司且每年都實現巨大飛躍。
帕特爾:我猜他們的邏輯是它不需要比英偉達更好,只要不比 70%差太多就行,因為他們付給你 70%的利潤率。
黃仁勳:不,別忘了 ASIC 的利潤率也很高。假設英偉達利潤率是 70%且 ASIC 利潤率是 65%。你到底省了什麼?
帕特爾:你是說像博通那樣的?
黃仁勳:對。你得付錢給別人。據我所知 ASIC 利潤率非常高,他們自己也這麼認為且對他們驚人的 ASIC 利潤率很自豪。
所以你問為什麼。很久以前我們就是沒能力做。當時我沒有深刻意識到做一個像 OpenAI、Anthropic 這樣的基礎 AI 實驗室有多難以及他們需要供應商本身的鉅額投資。我們當時沒能力投資 Anthropic 幾十億美元來換取他們用我們的算力。但谷歌和 AWS 有能力。他們一開始就投入巨資且作為回報 Anthropic 用了他們的算力。我們當時就是沒能力。
我的失誤是我沒有深刻意識到他們真的別無選擇,沒有風投會投 50到 100 億美元到一個 AI 實驗室指望它變成 Anthropic,這是我的失誤。但即使我當時理解了我也不認為我們有能力那麼做。但我不會再犯同樣的錯誤了。
我很樂意投資 OpenAI 也很樂意幫他們擴展,我相信這是必要的。後來當我有能力時 Anthropic 來找我們,我很樂意成為投資者且很樂意幫他們擴展。我們當時就是做不到。如果我能讓一切重來,如果當時的英偉達有現在這麼大我會非常樂意那麼做。
英偉達為什麼不成為超大規模雲廠商?
帕特爾:多年來英偉達一直是 AI 領域賺錢並賺大錢的公司。現在你在投資,比如據報道你們已向 OpenAI 投了 300 億美元並向 Anthropic 投了 100 億美元。現在他們的估值漲了且我相信還會繼續漲。所以如果這些年來你一直在給他們提供算力且你看到了它的發展方向,而他們一兩年前的價值只有現在的十分之一甚至一年前,而你又有那麼多現金,那要麼英偉達自己成為一個基礎實驗室投入巨資去做,要麼在現在這個估值下更早地做你這些交易。而且你有現金。所以為什麼不更早做呢?
黃仁勳:我們在力所能及的時候儘快做了且一有能力就儘快做了。如果我能我會更早做。在 Anthropic 需要我們做的時候我們就是沒能力,那時這不在我們的考慮範圍內。
帕特爾:怎麼講?是錢的問題嗎?
黃仁勳:是的即投資規模。我們當時從未在公司外部做過投資,更不用說那麼大數額了。我們沒有意識到我們需要這麼做。我一直以為他們可以像所有公司一樣去風投那裡融資。但他們想做的事風投做不到。OpenAI 想做的事風投做不到。我現在認識到了但我當時不知道。
但這就是他們的天才之處,他們聰明就聰明在這裡。他們當時就意識到必須做那樣的事。我很高興他們做到了。即使這導致 Anthropic 去找了別人,我仍然很高興它發生了。Anthropic 的存在對世界是好事且我為此高興。
帕特爾:我想你們仍然在賺很多錢而且每個季度都賺得更多。既然你有這麼多不斷賺來的錢,英偉達應該用它做什麼?有一個答案是已經出現了一整套中間商生態系統,把資本支出轉化為這些實驗室的運營支出讓他們可以租算力。因為芯片很貴但它們生命週期裡能賺很多錢,因為 AI 模型越來越好。它們產生的 Token 價值在增加但部署成本高。英偉達有錢做資本支出。事實上據報道你們正在支持 CoreWeave 且金額高達 63 億美元並已經投了 20 億。英偉達為什麼不自己成為一個雲服務商?為什麼不自己成為超大規模雲廠商並自己出租算力?
黃仁勳:這是我們公司的理念且我認為是明智的。我們應該做必要的事但儘量少做。意思是說在我們構建計算平臺的工作上如果我們不做,我真心相信沒人會做。如果我們不冒我們冒的那些險,如果我們不按我們的方式做 NVLink 並不構建整個軟件棧,不按我們的方式創建生態系統並不投入 20年 CUDA 並在大部分時間裡虧損,如果我們不做沒人會做。
如果我們不創建所有 CUDA-X 庫使它們面向特定領域,十五年前我們開始做特定領域庫,因為我們意識到如果我們不創建這些特定領域庫,無論是光線追蹤、圖像生成還是早期 AI 工作、這些模型,或者數據處理、結構化數據處理、向量數據處理,如果我們不創建沒人會做。我完全相信這一點。我們為計算光刻做了一個庫叫 cuLitho,如果我們不做沒人會做。所以加速計算之所以能有今天的進步是因為我們做了這些。
所以我們應該做那件事且應該全身心投入並全力以赴去做。然而世界上有很多雲,如果我不做總有人會做。所以我們奉行做必要的事但儘量少做的理念,它存在於我們公司的每一天。我做的每一件事都用這個視角來看。
就雲而言如果我們不支持 CoreWeave 存在,這些新雲、這些 AI 雲就不會存在。如果我們不幫 CoreWeave 它們就不會存在。如果我們不支持 Nscale 他們就不會有今天的成就。如果不支持 Nebius 他們也不會是今天這樣。現在他們做得非常好。
這是一種商業模式。我們應該做必要的事且儘量少做。所以我們投資於我們的生態系統因為我希望我的生態系統蓬勃發展。我希望這個架構、AI 能夠連接儘可能多的行業、儘可能多的國家,讓整個星球都建立在 AI 之上並建立在美國技術棧之上。這個願景正是我們在追求的。
還有一件事,有很多優秀的基礎模型公司且我們儘量投資所有人。這是我們做的另一件事。我們不挑贏家且我們需要支持所有人。這是我們應該做的也是我們的樂趣所在。這對我們的業務至關重要。但我們也不遺餘力地不去挑贏家所以我投了一家就會投所有。
帕特爾:你為什麼特意不挑贏家?
黃仁勳:首先這不是我們的工作。其次英偉達剛起步時有 60家 3D 圖形公司而我們是唯一活下來的。如果你從這 60 家裡猜誰會成功,英偉達會排在最不可能成功名單的首位。
這是很久以前的事了。英偉達的圖形架構恰恰是錯的且不是有點錯。我們造了一個完全錯的架構,開發者沒法支持它且它永遠不會成功。我們基於良好的第一性原理推理但最終得出了錯誤的解決方案。每個人都會把我們排除在外但我們活下來了。
所以我有足夠的謙遜認識到這一點即不要挑贏家。要麼讓他們自己照顧自己,要麼就照顧所有人。
帕特爾:有一點我沒明白,你說我們不是因為他們是新雲就優先考慮他們想扶持他們,但你也列舉了一堆新雲說沒有英偉達它們就不會存在。這兩件事怎麼兼容?
黃仁勳:首先他們自己得想存在並且來請求我們幫助。當他們想存在並且有商業計劃、專業知識和熱情時,他們顯然覺得自己有些能力。但如果歸根結底他們需要一些投資來啟動,我們會支持他們。但他們越早啟動飛輪越好。
你的問題是我們想不想做融資業務?答案是不想。有人在做融資業務,我們寧願和他們合作而不是自己當融資方。我們的目標是專注於我們做的事且保持商業模式儘可能簡單並支持我們的生態系統。
當像 OpenAI 這樣的組織需要 300 億美元規模的投資因為他們在 IPO 之前,而我們深信他們會成為一家不可思議的公司,世界需要他們存在且世界希望他們存在,我希望他們存在並且他們順風順水,讓我們支持他們並讓他們擴展。這些投資我們會做因為他們需要我們。但我們不是想做盡可能多的事而是想做盡可能少的事。
帕特爾:這可能是個顯而易見的問題,但我們在 GPU 短缺的情況下過了好幾年,現在因為模型變好導致短缺還在加劇。
黃仁勳:我們確實缺 GPU。
帕特爾:是的。英偉達以分配稀缺配額而聞名,不只看誰出價高而是看我們希望確保這些新雲存在,比如給 CoreWeave 一些,給 Crusoe 一些,給 Lambda 一些。這對英偉達有什麼好處?首先你同意這種分化市場的描述嗎?
黃仁勳:不同意。你的前提完全錯了。我們對這些事情足夠謹慎且非常謹慎。第一如果你不下采購訂單光說沒用。在收到採購訂單之前我們能做什麼?所以第一件事是我們和每個人努力工作完成預測,因為這些東西要很長時間才能造好且數據中心也要很長時間。我們通過預測等方式來協調供需這是首要任務。
第二我們儘量和儘可能多的人做預測但最終你還是得下訂單。也許無論什麼原因你沒下訂單,我能怎麼辦?在某個時間點先到先得。除此之外如果你的數據中心還沒準備好,或者某些組件還沒準備好讓你啟用數據中心,我們可能會先服務別的客戶。這只是為了最大化我們自己工廠的吞吐量且我們可能會做一些調整。
除此之外優先順序是先到先得。你得下采購訂單。當然有一些故事。比如這一切始於一篇關於拉里·佩奇和馬斯克跟我吃飯時求取 GPU 的文章,那從未發生。我們確實吃了飯且是很愉快的一頓飯但他們從未求取 GPU。他們只是需要下訂單。一旦下了訂單我們會盡力把產能分配給他們這不復雜。
帕特爾:好。所以聽起來有一個隊列,然後根據數據中心是否準備好、何時下采購訂單,你在某個時間拿到貨。但這聽起來仍然不是價高者得。有什麼理由不那樣做?
黃仁勳:我們從不那樣做。
帕特爾:為什麼不是價高者得?
黃仁勳:因為那是不好的商業實踐。你定好價格然後人們決定買不買。我理解芯片行業其他人會在需求高時漲價但我們不那樣做。這從來不是我們的做法。你可以信賴我們。我寧願做個可靠的人並做行業的基石。你不用事後猜測。如果我報了一個價那就是那個價,就這樣。如果需求飆升價格依然穩定。
帕特爾:另一方面這就是你們和臺積電關係好的原因吧?
黃仁勳:是的,英偉達和他們做生意快 30 年了。英偉達和臺積電沒有簽署法律合同但總有一些粗略的公平。有時我對且有時我錯。有時我拿了好 deal 且有時我拿了差 deal。但總體而言這段關係非常好。我可以完全信任他們並且可以完全依賴他們。
你可以信賴英偉達的一點是今年的 Vera Rubin 會不可思議。明年 Vera Rubin Ultra 會來。後年 Feynman 會來。再後一年我還沒介紹名字。每一年你都可以信賴我們。你去找世界上任何其他 ASIC 團隊隨便挑,你能說我可以把全部業務押在你身上且你每年都會為我服務嗎?你能說你的 Token 成本每年都會下降一個數量級且我可以像相信時鐘一樣相信你嗎?
我剛才對臺積電說了類似的話。對歷史上任何其他代工廠你都不可能這麼說。但今天你可以對英偉達這麼說。你可以每年都信賴我們。如果你想買 10 億美元的 AI 工廠沒問題。想買 1 億美元沒問題。1000 萬美元或者只有一個機架都沒問題。或者只有一個顯卡沒問題。如果你想下 1000 億美元的訂單也沒問題。我們是當今世界上唯一一家你可以這麼說的公司。
我也可以對臺積電這麼說。我想買一個或者買十億個都沒問題。我們只需要經過規劃流程以及所有成熟的人會做的事。所以我認為英偉達能成為世界 AI 產業的基石,這個地位我們花了幾十年才達到。這是巨大的承諾和巨大的奉獻。我們公司的穩定性與一致性非常重要。
是否應該向中國銷售 AI 芯片?
帕特爾:我想問關於中國的問題。我實際上不知道我是否支持向中國賣芯片但我喜歡對嘉賓唱反調。達里奧·阿莫代伊(Dario Amodei)支持出口管制,我問他為什麼美國和中國不能都在數據中心裡擁有一群天才?但既然你站在另一邊我會反過來問你。
一種思考方式是 Anthropic 幾天前發佈了 Mythos 預覽版。這個模型他們甚至沒有公開發布,因為他們說它有很強的網絡攻擊能力且世界還沒準備好,要等他們把那些零日漏洞修補好。但他們說它發現了所有主流操作系統和每個瀏覽器的成千上萬個高危漏洞。它在 OpenBSD 裡發現了一個漏洞且那個是專門設計來避免零日漏洞的操作系統,這個漏洞存在了 27 年。
所以如果中國公司、中國實驗室、中國政府能拿到 AI 芯片,來訓練一個像 Claude Mythos 這樣有網絡攻擊能力的模型並用更多算力跑幾百萬個實例,這是否對美國公司、美國國家安全構成威脅?
黃仁勳:首先 Mythos 是在相當普通的算力上訓練的且算力規模也相當普通,只不過訓練它的是一家非常優秀的公司。它所用的算力類型和數量在中國其實非常充足。你要知道芯片在中國是存在的。
他們製造了全球 60%以上的主流芯片,這個產業對他們來說非常大。他們擁有世界上最厲害的計算機科學家之一。如你所知幾乎所有 AI 實驗室裡大部分研究人員都是中國人,佔了全球 50%的 AI 研究人員。所以問題來了,既然他們已經擁有這麼多資產如充足的能源與大量的芯片以及全球近半的 AI 人才,如果你真的擔心他們,那麼創造一個更安全的世界最好的方式是什麼?
去打壓他們把他們變成敵人可能不是最好的答案。他們是競爭對手且我們希望美國贏。但我認為進行對話、進行研究對話可能是最安全的。由於我們目前對中國的態度在這個領域明顯缺失。我們的 AI 研究人員和他們的 AI 研究人員交流至關重要。我們雙方都試圖就 AI 不應該被用來做什麼達成一致,這至關重要。
關於在軟件裡找漏洞,當然這正是 AI 應該做的。它會在很多軟件裡找到漏洞嗎?當然。有很多漏洞。AI 軟件裡也有很多漏洞。這正是 AI 應該做的,我很高興 AI 達到了一個水平能幫我們提高這麼多生產力。
有一件事被低估了,就是圍繞網絡安全、AI 網絡安全、AI 安全、AI 隱私的生態系統非常豐富。有一整個 AI 初創公司生態系統在試圖為我們創造那個未來,即一個不可思議的 AI 智能體周圍有成千上萬個 AI 智能體在保護它並確保它安全。那個未來一定會到來。
認為會有一個 AI 智能體到處跑而沒人看著這有點瘋狂。我們很清楚這個生態系統需要蓬勃發展。事實證明這個生態系統需要開源且需要開放模型和開放軟件棧,這樣所有 AI 研究人員與所有厲害的計算機科學家才能去構建同樣強大的 AI 系統並保證 AI 的安全。所以我們需要確保的一件事是保持開源生態系統的活力,這不能被忽視。其中很多來自中國且我們不應該扼殺它。
關於中國當然我們希望美國擁有儘可能多的算力。我們受限於能源但有很多人在解決這個問題,我們不能讓能源成為國家的瓶頸。但我們也希望世界上所有的 AI 開發者都在美國技術棧上開發,並把 AI 的進步尤其是開源的部分貢獻給美國生態系統。創建兩個生態系統將是極其愚蠢的,一個開源的且只能跑在外國技術棧上,一個封閉的且跑在美國技術棧上。我認為這對美國將是可怕的後果。
帕特爾:信息量很多,我梳理一下。中國有算力但有些估計說因為他們沒有 EUV 也就是因為芯片製造出口管制,他們實際能生產的 Flops 只有美國的十分之一。那麼他們最終能訓練出像 Mythos 這樣的模型嗎?能。但問題在於因為我們有更多的 Flops,美國實驗室能先達到這些能力水平因為 Anthropic 先達到了。
另外就算他們訓練出這樣的模型,大規模部署的能力也很重要。如果你有個網絡黑客有一百萬個實例比有一千個危險得多。所以推理算力真的很重要。事實上他們有這麼多優秀的 AI 研究人員,這恰恰是可怕的地方,因為讓這些工程師研究人員更高效的是什麼?是算力。
如果你和美國任何一個 AI 實驗室聊他們會說限制他們的是算力。DeepSeek 創始人、通義千問領導層都說過。他們說他們受限於算力。那麼問題來了,我們讓美國公司因為有更多算力而先達到 Mythos 級別的能力並讓我們的社會為此做好準備,這不是更好嗎?而中國因為算力少會更晚達到這個水平?
黃仁勳:我們的目標當然應該始終是第一個到達也始終擁有更多算力。但要讓你描述的那種結果成立,你必須把情況推到極端也就是他們得完全沒有算力。只要他們還有一些算力,問題就變成了到底需要多少才夠?事實上中國擁有的算力是巨大的。你剛才也說了他們是世界第二大計算市場。如果他們真想集中算力做一件事他們完全有能力做到。
帕特爾:但這是真的嗎?有人估計說中芯國際在工藝節點上落後。
黃仁勳:他們擁有的能源是驚人的對吧?AI 是個並行計算問題不是嗎?為什麼他們不能因為能源幾乎免費就把 4 倍、10 倍的芯片放在一起?他們有這麼多能源。他們有完全空置且完全通電的數據中心。他們的基礎設施容量巨大。如果他們想他們就把更多芯片聚在一起即使是 7 納米的。
他們製造芯片的能力是世界上最大的之一,半導體行業知道他們壟斷了主流芯片。他們有超額產能且產能過剩。所以認為中國將無法獲得 AI 芯片的想法完全是胡說八道。當然如果你問我如果全世界根本沒有算力美國會不會遙遙領先?但那不是一個真實場景。他們已經擁有大量算力。你擔心的那個閾值他們已經達到並超過了。
所以我認為你誤解了,AI 是一個五層蛋糕,最底層就是能源。當你能源充足時它可以彌補芯片的不足。如果你芯片充足它可以彌補能源的不足。例如美國能源稀缺,這就是為什麼英偉達必須不斷推進架構並做極端協同設計,以便在芯片運出量少的情況下因為能源太有限而我們的每瓦吞吐量高得離譜。
但是如果你的瓦特數完全充足且幾乎是免費的,你會在乎每瓦性能嗎?你會有很多。你可以用舊芯片來做。7 納米芯片基本上就是 Hopper。我必須告訴你今天的模型大部分是在 Hopper 這一代上訓練的。所以 7 納米芯片已經足夠好了。能源豐富是他們的優勢。
帕特爾:但還有他們能否製造足夠多芯片的問題。
黃仁勳:但他們能。證據是什麼?華為剛剛度過了公司歷史上業績最好的一年。
帕特爾:他們出貨了多少芯片?
黃仁勳:大量。數百萬個,比 Anthropic 擁有的多得多。
帕特爾:問題在於中芯國際能生產多少邏輯芯片以及能生產多少內存?
黃仁勳:我告訴你實際情況。他們有大量的邏輯芯片也有大量的 HBM2 內存。
帕特爾:但如你所知訓練和推理的瓶頸往往是帶寬量。所以如果你用的是 HBM2,我不記得具體數字,但和你最新的產品比內存帶寬可能差了一個數量級,這非常大。
黃仁勳:華為是一家網絡公司。
帕特爾:但這不能改變你需要 EUV 來製造最先進 HBM 的事實。
黃仁勳:完全不對。你可以把它們聚在一起就像我們用 NVL72 聚在一起一樣。他們已經展示了硅光子技術,把所有計算連成一個巨大的超級計算機。你的前提完全錯了。
事實是他們的 AI 發展進展得相當順利。世界上最好的 AI 研究人員因為他們算力有限,他們也提出極其聰明的算法。記住我剛才說摩爾定律每年大約進步 25%。然而通過優秀的計算機科學我們仍然可以把算法性能提高 10 倍。我的意思是優秀的計算機科學才是槓桿。
毫無疑問 MoE 是一個偉大的發明。所有那些令人難以置信的注意力機制減少了計算量。我們必須承認 AI 的大部分進步來自算法進步而不僅僅是原始硬件。如果大部分進步來自算法、計算機科學和編程,那告訴我他們的 AI 研究大軍不是他們的根本優勢?我們看到了。DeepSeek 絕不是一個無關緊要的進展。要是哪天像 DeepSeek 這樣的成果先在華為平臺上出現,那對我們國家會是非常糟糕的結果。
帕特爾:為什麼?因為目前像 DeepSeek 這樣的模型如果是開源的,可以在任何加速器上跑。為什麼將來會不是這樣?
黃仁勳:假設它針對華為優化了且針對他們的架構優化了,那就會讓我們的處於劣勢。你描述了一種我認為是好消息的情況。一家公司開發了軟件並開發了一個 AI 模型且在美國技術棧上跑得最好。我認為那是好消息。你把它作為前提說那是壞消息。我來告訴你真正的壞消息即世界上所有的 AI 模型都是在非美國硬件上開發的並且跑得最好。
帕特爾:我想我只是沒看到證據表明存在巨大的差異會阻止你切換加速器。美國的實驗室正在跨所有云且跨所有加速器跑他們的模型。
黃仁勳:我就是證據。你拿一個為英偉達優化的模型,然後試著在別的東西上跑。
帕特爾:但美國的實驗室確實在那麼做。
黃仁勳:而且它們跑得並不更好。英偉達的成功就是完美的證據。AI 模型是在我們的軟件棧上創建的且在我們的軟件棧上跑得最好,這怎麼就不合邏輯了?
帕特爾:Anthropic 的模型在 GPU 上跑也在 Trainium和 TPU 上跑。
黃仁勳:需要做很多工作才能改過來。但是去全球南方並去中東。開箱即用,如果所有 AI 模型都在別人的技術棧上跑得最好,那你現在就是在提出一個荒謬的主張說這對美國是好事。
帕特爾:但我不理解這個論點。假設中國公司先推出了下一個 Mythos。他們先在美國軟件裡發現所有安全漏洞,但他們可以在英偉達硬件上運行然後擴展到全球南方。這怎麼會是好事?
黃仁勳:那不好。所以我們別讓那發生。
帕特爾:你為什麼認為這是完全可以替代的,如果你不給他們運算力,它就會被華為完全取代?他們是落後的對吧?他們的芯片比你差。
黃仁勳:現在有證據即他們的芯片產業巨大。
帕特爾:你可以直接比較一下 H200 和華為 910C的 Flops、帶寬或內存。華為那款大概只有 H200 的二分之一到三分之一。
黃仁勳:他們用更多的數量來彌補。
帕特爾:看來你的論點是他們有所有這些現成的能源對吧?他們需要用芯片來填充。
黃仁勳:而且他們擅長製造。
帕特爾:我相信最終他們也許能在製造上超過所有人。但眼下這幾年很關鍵。
黃仁勳:你說的關鍵幾年具體是哪些年?
帕特爾:就是接下來的幾年。我們會擁有能發動各種網絡攻擊的模型。
黃仁勳:在那種情況下如果接下來的幾年是關鍵,那麼我們必須確保世界上所有的 AI 模型都是在美國技術棧上構建的。
帕特爾:如果它們是在美國技術棧上構建的,那又怎麼防止它們如果它們擁有更先進的能力去發動等同於 Mythos 的網絡攻擊呢?
黃仁勳:無論如何都沒有保證。
帕特爾:但如果你提早擁有它,我們可以為它做準備。
黃仁勳:聽著你為什麼要讓 AI 產業的一層失去整個市場以便你能讓另一層受益?有五層且每一層都必須成功。最需要成功的那一層是 AI 應用。你為什麼如此執著於那個 AI 模型和那一家公司?為了什麼?
帕特爾:因為這些模型實現了這些令人難以置信的攻擊能力而且你需要算力來運行它們。
黃仁勳:能源、芯片和 AI 研究人員生態系統使它成為可能。
帕特爾:好我們退一步說。中國得自己建出足夠的 7 納米產能。別忘了他們現在還卡在 7 納米,而你們會往 3 納米、2 納米、1.6 納米走比如 Feynman 那一代。到時候你在用 1.6 納米他們還在 7 納米。他們只能靠數量來彌補單顆芯片的性能差距。而他們能源充足。你賣給他們越多芯片他們手裡的總算力就越多。
黃仁勳:聽著我只是覺得你的說法太絕對了。美國理應領先。美國的算力規模比世界上任何其他地方都高出 100 倍。美國理應領先。好吧美國現在就領先。英偉達打造的是最先進的技術。我們確保美國實驗室最先知道這些技術並最先有機會購買。如果他們錢不夠我們甚至會投資他們。美國理應領先。我們想盡一切辦法確保美國領先。第一點你同意嗎?我們確實正在這麼做。
帕特爾:但如果他們的瓶頸是算力,把芯片運到中國怎麼能讓美國保持領先?
黃仁勳:不。我們有 Vera Rubin 給美國。Vera Rubin 是給美國的。現在我算不算美國的一部分?你把我算作美國的一部分嗎?
帕特爾:算。
黃仁勳:那英偉達呢?你把英偉達算作一家美國公司對吧?第一為什麼我們不能拿出一種更平衡的監管方式讓英偉達能在全球取勝,而不是把全球市場拱手讓掉?為什麼要讓美國把世界讓出去?
芯片產業是美國生態系統的一部分,是美國技術領導力的一部分,是 AI 生態系統的一部分也是 AI 領導力的一部分。為什麼你的政策和你的理念會導向讓美國放棄全球市場中如此巨大的一塊?
帕特爾:阿莫代伊曾引用過一句話,他說這就像波音吹噓我們向敵對國家出售核彈但導彈外殼是波音製造的。這在某種程度上支持了美國技術棧。從根本上說你在給敵國這種能力。
黃仁勳:把 AI 和你剛才提到的那些東西相提並論是荒唐的。
帕特爾:但 AI 類似於濃縮鈾對吧?它可以有積極用途也可以有消極用途。我們仍然不想把濃縮鈾送到其他國家。
黃仁勳:這是一個糟糕的類比且一個不合邏輯的類比。
帕特爾:但是如果這些算力可以運行一個能對美國所有軟件進行零日漏洞利用的模型,那它怎麼就不是一種武器呢?
黃仁勳:首先解決這個問題的方法是與研究人員、與中國、與所有國家進行對話,確保人們不以那種方式使用技術。這是必須發生的對話。
第二點我們還需要確保美國領先,Vera Rubin、Blackwell 在美國大量供應並堆積如山。顯然我們的結果會顯示這一點。我們有大量的算力。我們這裡有很棒的 AI 研究人員。
然而我們也必須認識到 AI 不僅僅是一個模型。AI 是一個五層蛋糕。AI 產業在每一層都很重要且我們希望美國在每一層都獲勝包括芯片層。放棄整個市場不會讓美國長期在芯片層、在計算堆棧中贏得技術競賽,這就是事實。
帕特爾:我想關鍵問題是現在向中國賣芯片怎麼能幫我們在長期獲勝?你看特斯拉向中國賣了很久的電動汽車,iPhone 也在中國賣得很好。但這些並沒有把中國鎖定在美國的技術生態裡。他們照樣做出了自己的電動汽車且現在在全球佔主導。智能手機也是一樣。
黃仁勳:當我們今天開始對話時你承認英偉達的地位非常不同。你用了護城河這樣的詞。對我們公司來說最重要的事情是我們生態系統的豐富性,這關乎開發者。50%的 AI 開發者在中國。美國不應該放棄這一點。
帕特爾:但我們美國有很多英偉達開發者,這並不能阻止美國實驗室將來也能夠使用其他加速器。事實上現在他們也在使用其他加速器這很好。我不明白為什麼在中國情況不會是這樣,如果你向他們出售英偉達芯片就像谷歌可以使用 TPU 和英偉達一樣。
黃仁勳:我們得持續創新。你可能也知道我們的份額在增長而不是在縮小。你剛才隱含了一個前提即就算我們在中國市場競爭也遲早會輸掉。我不是那種一醒來就覺得自己會輸的人。這種輸家心態和輸家前提對我來說毫無意義。
我們不是在造汽車。汽車今天買這個品牌明天換另一個很容易。計算不是這樣。x86 能活到今天是有原因的且 ARM 那麼有粘性也是有原因的。這些生態系統很難替代。換掉它們需要花大量時間和精力且大多數人根本不願意這麼做。所以我們的任務就是繼續培育這個生態系統並不斷推進技術,這樣我們才能在市場上競爭。
你基於遲早會輸這個前提就說我們應該放棄一個市場。我無法認同這種邏輯。這沒有道理。我不認為美國是輸家。我們這個行業不是輸家。
關鍵是你走向了極端。你的論點從極端開始認為如果我們在關鍵時刻給他們任何算力我們就會失去一切這很幼稚。
帕特爾:讓我為自己闡述一下我的論點。我的想法不是說存在某個關鍵的計算閾值而是任何邊際算力都是有幫助的。所以如果你有更多的算力你可以訓練一個更好的模型。
黃仁勳:我只想讓你承認對美國技術產業的任何邊際銷售都是有益的。
帕特爾:如果跑在這些芯片上的 AI 模型具備網絡攻擊能力,或者這些芯片被用來訓練這類模型並運行更多攻擊實例,那它雖然不是核武器但確實啟用了一種武器。
黃仁勳:按你這個邏輯你不如把它用到微處理器和 DRAM 上。你甚至可以用到電上。
帕特爾:但事實上我們確實對製造最先進 DRAM 的相關技術實施了出口管制。我們對中國製造芯片的各種東西都有各種出口管制。
黃仁勳:我們向中國銷售大量的 DRAM和 CPU 且我認為這是正確的。
帕特爾:我想這回到了根本問題即 AI 是否不同?如果你擁有那種能在軟件中發現零日漏洞的技術,我們是否希望最大限度地減少中國首先達到並廣泛部署它的能力?
黃仁勳:我們希望美國領先且我們可以控制這一點。
帕特爾:如果芯片已經在那裡且他們正用它們來訓練那個模型我們如何控制?
黃仁勳:我們有大量的算力。我們有大量的 AI 研究人員。我們在儘可能快地競賽。
帕特爾:再說一次我們擁有的核武器比任何人都多但我們不想把濃縮鈾送到任何地方。
黃仁勳:我們不是濃縮鈾且它是一個芯片而且是一個他們可以自己製造的芯片。
帕特爾:但他們從你這裡購買是有原因的。我們有中國公司創始人的引言說他們受限於算力。
黃仁勳:因為我們的芯片更好。總的來說我們的芯片更好。這是毫無疑問的。如果沒有我們的芯片你能承認華為經歷了創紀錄的一年嗎?你能承認一大批芯片公司已經上市了嗎?你能承認嗎?
帕特爾:能。
黃仁勳:你能否也承認我們曾經在那個市場擁有非常大的份額而我們現在不再擁有大份額?我們也可以承認中國約佔世界技術產業的 40%。為美國技術產業放棄這個市場對我們的國家是一種傷害。對我們的國家安全是一種傷害且對我們的技術領先地位是一種傷害,這一切都為了一個公司的利益。這對我來說毫無意義。
帕特爾:我想我有點困惑,感覺你在說兩種不同的陳述。一是如果我們被允許競爭我們將贏得與華為的競爭因為我們的芯片會好得多。二是沒有我們他們也會做完全相同的事情。這兩件事怎麼能同時進行呢?
黃仁勳:這顯然是真的。在沒有更好選擇的情況下你會接受唯一的選擇。這怎麼不合邏輯了?這太合邏輯了。
帕特爾:他們想要英偉達芯片是因為它們更好?
黃仁勳:是的。
帕特爾:芯片更好意味著更多的算力且更多的算力意味著你可以訓練更好的模型。
黃仁勳:我們的芯片更好不只是算力更高,還因為它更容易編程且我們有更好的生態系統。而且我們向中國賣芯片美國自己也在受益。我們維持了美國的技術領先地位且開發者繼續在美國技術棧上工作。當這些 AI 模型擴散到全球時美國技術棧仍然是那個最適合運行它們的平臺。這樣我們就能持續推進和擴散美國技術。我認為這是好事也是美國技術領先地位中非常重要的一環。
現在你所倡導的政策導致美國電信行業基本上被政策排擠出世界,以至於我們不再控制自己的電信。我不認為那是明智的。這有點狹隘並且導致了我在向你描述的、你似乎很難理解的意外後果。
帕特爾:現在問題很清楚就是好處和成本哪個更大。我想讓你承認一個潛在的成本。算力是訓練強大模型的輸入而強大模型確實有很強的攻擊能力比如網絡攻擊。美國公司先達到 Mythos 那種能力水平然後暫緩發佈,給美國公司和美國政府時間修補漏洞並加固軟件這是好事。
但如果中國因為獲得了更多算力而更早做出類似的模型並大規模部署,那會很糟糕。這件事到現在還沒發生一個關鍵原因就是美國公司包括英偉達擁有更多的算力。所以我們把芯片賣給中國就是在幫他們縮小這個差距。這是一個成本。先不談好處你承不承認這確實是一個潛在的成本?
黃仁勳:那我也告訴你另一個潛在的成本。如果我們放棄中國市場即世界第二大市場,就等於把 AI 堆棧中最重要的一層也就是芯片層整個讓了出去。他們會在自己的市場裡發展規模並建立自己的生態系統。未來的 AI 模型會針對他們的技術棧做優化而他們的模型又是開放的。隨著 AI 擴散到全球其他地方他們的標準和技術棧反而會變得比我們的更優越。
帕特爾:我想我只是足夠相信英偉達的內核工程師和 CUDA 工程師,認為他們可以優化。
黃仁勳:AI 不僅僅是內核優化你知道的。
帕特爾:當然但你可以做很多事情比如從蒸餾到一個非常適合你芯片的模型。
黃仁勳:我們會盡力的。
帕特爾:你擁有所有的軟件。很難想象即使他們在一段時間內有一個稍微更好的開源模型,會對中國生態系統產生長期鎖定。
黃仁勳:中國現在是全球開源軟件最大的貢獻者也是開放模型最大的貢獻者。而今天這些開源生態是建立在美國技術棧、建立在英偉達之上的。
AI 技術棧的五層都很重要且美國應該每一層都贏。當然最重要的是最上面的應用層,誰能把 AI 擴散到社會里用得最多誰就從這場工業革命裡受益最大。但每一層都必須成功。
如果我們把這個國家嚇住讓所有人都覺得 AI 是核彈且所有人都討厭 AI、害怕 AI,我不知道這對美國有什麼好處。你這是在害美國。如果我們嚇唬所有人讓他們別去學軟件工程說 AI 會消滅所有軟件工程崗位,結果我們真的沒了軟件工程師那才是對美國最大的傷害。
如果我們嚇唬所有人讓他們別當放射科醫生,說計算機視覺已經免費了且 AI 讀片比人強,那我們是混淆了工作和任務。放射科醫生的工作是照護病人而讀片只是其中的一項任務。如果我們連這個都搞錯了且嚇得沒人去讀放射科,我們最後會缺放射科醫生並缺好的醫療服務。
所以我說當你從一個極端前提出發把一切看成要麼零要麼無窮,最後就會用一種不真實的方式嚇唬人。真實世界不是這樣的。
我們希望美國第一嗎?當然。我們需要 AI 技術棧的每一層都領先嗎?當然。
你今天談 Mythos 因為 Mythos 確實重要。但幾年後當美國想把我們的技術棧、我們的技術推廣到全世界比如到印度、中東、非洲、東南亞,當我們的國家想出口技術且想出口標準的時候,我希望到那時我們倆能再聊一次。到那天我會告訴你你今天設想的這些政策是如何讓美國無緣無故地放棄了世界第二大市場的。
我們不應該主動放棄這個市場。如果競爭不過失去也就失去了但為什麼要主動讓出去?現在沒人主張全有或全無,不是說我們要把所有東西都賣給中國。沒人這麼主張。
我們應該始終把最好的技術、最多的技術優先留在美國,並且讓美國最先擁有。但與此同時我們也應該去全球各地競爭並贏下市場。這兩件事可以同時做到。只是需要一些分寸、一些成熟而不是非黑即白。這個世界不是非黑即白的。
帕特爾:好關鍵在於這一點。他們會針對自己幾年後能造出的最好芯片來優化模型。這些模型會被出口到世界各地從而形成標準。由於 EUV 出口管制正如我們所說你們將邁向 1.6 納米。但即使幾年後他們很可能仍然停留在 7 納米。
在國內他們可能會說我們有這麼多能源且可以大規模量產所以繼續用 7 納米也沒問題。但在出口市場上他們的 7 納米芯片要直接跟你們的 1.6 納米芯片競爭。到那時候他們的模型必須針對 7 納米做極其深度的優化,以至於在 7 納米上跑他們的模型反而比在你們的 1.6 納米上跑效果更好。
黃仁勳:我們能不能先看看事實?Blackwell 在光刻技術上比 Hopper 先進了 50 倍嗎?差得遠。我反覆強調過摩爾定律已經死了。從 Hopper到 Blackwell 單看晶體管姑且說提升了 75%吧而且中間隔了三年。但 Blackwell比 Hopper 快50 倍。
我的觀點是架構很重要且計算機科學也很重要。半導體物理學當然重要但計算機科學同樣重要。AI 的影響力主要來自整個計算堆棧,這就是為什麼 CUDA 如此有效且如此受歡迎的原因。它是一個生態系統且一個計算架構並提供了極大的靈活性。你想徹底改變架構且搞出 MoE、搞出擴散模型、搞出分解式架構都能做到而且很容易做到。
事實是 AI 對上層堆棧的依賴程度不亞於下層架構。從這個角度說我們的架構和軟件堆棧是針對我們自己的生態系統優化的這本身就是優勢。正如我們剛對話時就談到英偉達的生態系統有多豐富。為什麼大家總是首選 CUDA 來編程?因為他們確實喜歡且中國的研究人員也一樣。
但如果我們被迫離開中國這是一個政策錯誤,顯然會適得其反且對美國不利。它會加速他們的芯片產業並迫使他們所有的 AI 生態系統專注於自己的內部架構。現在糾正還不算太晚但事情已經在發生了。
你將來會看到他們不會停留在 7 納米這很明顯。他們擅長製造且會從 7 納米繼續往前推進。那 5 納米和 7 納米之間有 10 倍的差距嗎?答案是否定的。架構很重要且網絡也很重要,這就是英偉達收購 Mellanox 的原因。能源也很重要。所有這些都很重要且事情並不像你說的那麼簡單。
英偉達為什麼不製造多種不同的芯片架構?
帕特爾:我們之前討論了臺積電和內存等環節的瓶頸。如果未來我們處在這樣一個局面即你已經佔了 N3 節點的大部分產能且接下來會佔 N2 的大部分,你會不會考慮回頭用 N7 的閒置產能?比如說 AI 需求太大且領先節點的擴產跟不上,那你就用舊節點來造 Hopper或 Ampere 但加上我們今天知道的數值格式改進和其他優化。你覺得 2030 年之前會發生這種事嗎?
黃仁勳:沒必要。因為每一代架構的提升不光是靠晶體管尺寸。我們在工程、封裝、堆疊、數值格式、系統架構上做了大量工作。
產能不夠的時候再回頭去搞一箇舊節點,那需要投入的研發成本沒人負擔得起。我們能負擔的是往前走而不是往回走。當然如果有一天全球產能真的徹底到頭了,問我願不願意回頭用 7 納米?我當然願意。
帕特爾:有人跟我討論過一個問題即英偉達為什麼不併行做幾個完全不同架構的芯片項目?比如像 Cerebras 那樣的晶圓級芯片或者像 Dojo 那樣的大封裝甚至做一個不帶 CUDA 的。你們有資源也有人才且可以同時做這些。既然 AI 和芯片架構的方向不確定為什麼要把所有雞蛋放在一個籃子裡?
黃仁勳:我們可以做只是我們沒有發現更好的方向。你說的那些我們都模擬過且結果證明它們不如現在的方案。所以我們不做。我們正在做的就是我們想做的。如果未來的工作負載發生根本性變化我不是指算法而是指實際的計算任務類型,這取決於市場的需求形態,我們可能會考慮增加其他類型的加速器。
比如最近我們納入了 Groq 且會把它整合到 CUDA 生態裡。原因在於 Token 的價值現在已經很高了且可以對 Token 實行差異化定價。幾年前 Token 要麼免費要麼很便宜。現在不同客戶有不同的需求且願意為不同的答案付不同的錢。比如我們的軟件工程師如果能給他們響應更快的 Token 讓他們效率更高,我願意為此多付錢。
但這個市場是最近才出現的。所以我們決定擴展帕累託前沿並做一個響應更快但吞吐量更低的推理細分市場。以前吞吐量高就是更好,但現在我們認為可能存在一個高 ASP(平均售價)Token 的市場即使工廠的總吞吐量下降更高的單價也能彌補。這就是我們做這件事的原因。除此之外如果我有更多的錢我還是會投到英偉達現有的架構上。
帕特爾:這種高端 Token 和推理市場細分的想法很有意思。假設深度學習革命沒有發生英偉達現在在做什麼?
黃仁勳:加速計算且我們一直在做這個。我們公司的基本判斷是通用計算的擴展能力基本到頭了。
所以我們把 GPU和 CUDA跟 CPU 結合起來,把 CPU 上的某些工作負載卸載到 GPU 上加速。這樣可以把一個應用提速 100 倍甚至 200 倍。這些應用可以是工程、科學、物理、數據處理、計算機圖形、圖像生成等等。即使沒有 AI,英偉達也會是一家非常大的公司。
原因很簡單即通用計算繼續擴展的路基本走完了且出路在於特定領域的加速。我們起步於計算機圖形但還有很多其他領域涵蓋粒子物理、流體、結構化數據處理等等都能從 CUDA 受益。我們的使命就是把加速計算帶給世界並推進那些通用計算做不了的應用,幫助突破某些科學領域。早期的應用包括分子動力學、能源勘探的地震數據處理、圖像處理等等。
如果沒有 AI 我會很難過。但正因為我們在計算上取得的進步,我們讓深度學習變得普及了。任何研究人員、科學家、學生都能用一臺 PC 或一張 GeForce 顯卡做很厲害的科學。這個基本承諾一點都沒變。
你看 GTC 大會開頭那部分跟 AI 一點關係都沒有,包括計算光刻、量子化學、數據處理。這些工作依然非常重要。我知道 AI 很讓人興奮但還有很多人做著非常重要且跟 AI 無關的工作。張量不是唯一的計算方式。我們想幫助所有人。
帕特爾:非常感謝。
黃仁勳:不客氣。我很享受與你的對話。
帕特爾:我也是。
歡迎加入深潮 TechFlow 官方社群
Telegram 訂閱群:https://t.me/TechFlowDaily
Twitter 官方帳號:https://x.com/TechFlowPost
Twitter 英文帳號:https://x.com/BlockFlow_News














