
黃仁勳最新訪談全文:放棄中國市場是“失敗者心態”,算力封鎖根本攔不住中國 AI
TechFlow Selected深潮精選

黃仁勳最新訪談全文:放棄中國市場是“失敗者心態”,算力封鎖根本攔不住中國 AI
“我們在構建計算平臺上做的工作,如果我們不做,我真的相信沒有人會做。”
整理 & 編譯:深潮TechFlow

嘉賓:Jensen Huang,NVIDIA 創始人兼 CEO
主持人:Dwarkesh Patel
播客源:Dwarkesh Patel
原標題:Jensen Huang – Will Nvidia’s moat persist?
播出日期:2026年4月16日
要點總結
本文通過與 Nvidia CEO Jensen Huang 的對話,探討了關於 TPU(張量處理單元)對 Nvidia 在 AI 計算領域主導地位的潛在影響、公司對先進芯片供應鏈的把控、是否應向中國出售 AI 芯片、為何 Nvidia 不直接成為超大規模雲服務商 (hyperscaler)、以及該公司在芯片架構和投資策略上的選擇等問題。

精彩觀點摘要
關於英偉達的本質與護城河
- “歸根結底,總有什麼東西要把電子轉化成 token,這個轉化過程以及讓 token 隨時間變得越來越有價值,不是那麼容易被商品化的。我們的工作就是做盡可能多的必要事情、儘可能少的不必要事情,來實現這個轉化。”
- “為什麼他們(供應鏈)願意為我投資,而不為別人?因為他們知道英偉達有能力消化他們的供應量,並且通過我們的下游銷售出去。英偉達的下游供應鏈和需求規模如此巨大,他們才願意在上游押注。”
- “所有瓶頸持續時間都不超過兩三年,一個也不例外。 我擔心的是我們下游的事情——比如阻礙能源發展的政策。沒有能源,你沒法建立一個產業;沒有能源,你沒法推進再工業化。”
關於 CUDA 與專用芯片(ASIC)的博弈
- “英偉達做的是加速計算,不是張量處理單元。加速計算的覆蓋面寬泛得多……我們是唯一一家加速各種應用的公司,擁有龐大的生態系統。”
- “英偉達的 GPU 是加速器,更像 F1 賽車。一般人開到時速一百公里沒問題,但要把它推到極限,需要相當深厚的功力。我們大量使用 AI 來生成我們自己的 kernel。”
- “英偉達的計算棧是世界上性價比最好的,沒有例外。 沒有任何一個平臺能向我證明,它在今天有更好的性能/總擁有成本比。”
關於公司哲學與投資
- “我們應該做盡可能多的必要事情,儘可能少的不必要事情。這意味著:我們在構建計算平臺上做的工作,如果我們不做,我真的相信沒有人會做。 但是,世界上不缺雲服務——如果不是我們做,有人會出來做。”
- “我的失誤在於,我沒有深刻認識到他們根本沒有別的選擇——風險投資永遠不會向一家 AI 實驗室投入 $50$ 到 $100$ 億美元。這是我的盲區。如果能倒帶,如果英偉達那時候就有今天這樣的規模,我會很樂意那樣做。”
關於中國市場與地緣政治(最受關注部分)
- “創造一個安全世界的最佳方式是什麼?把他們打成受害者、變成敵人,很可能不是最好的答案。他們是對手,我們希望美國贏,但我認為保持對話、保持研究交流,可能是最安全的做法。”
- “這種失敗者心態,這種失敗者前提,對我毫無意義。 基於你所描述的前提就放棄一個市場,我無法接受這種想法。這沒有意義,因為我不認為美國是失敗者,我們的行業也不是失敗者。”
- “當你有充足的能源,它可以彌補芯片的不足。 如果你的瓦數是完全充裕、近乎免費的,你在乎每瓦性能做什麼?你只管用舊芯片堆就行了。7nm 芯片本質上就相當於 Hopper 這一代,完全夠用。”
- “DeepSeek 第一天在華為芯片上發佈的那天,對我們國家來說是一個糟糕的結果……如果所有 AI 模型在別人的技術棧上跑得最好,那你得解釋一下,你真的要說那對美國是好事嗎?”
關於軟件、Agent 與未來
- “今天我們受限於工程師的數量,明天這些工程師將被一大批 agent 支持,我們將以前所未有的方式探索設計空間……工具使用會讓軟件公司的規模飛速增長,這還沒發生的原因是 agent 還不夠擅長使用工具。”
- “你可以依賴英偉達的一件事是:今年 Vera Rubin 會很出色,明年 Vera Rubin Ultra 會來,後年 Feynman 會來。每年你都可以像信鐘錶一樣信我們。”
關於架構與工作負載
- “我們可以這樣做(研發多種架構),只是我們沒有更好的想法。我們在模擬器裡全都跑過了,結果是更差,所以我們不會那樣做。”
- “以前,高吞吐量總是更好。但我們認為,可能存在一個世界,有非常高單價的 token,即使工廠吞吐量更低,高單價也能彌補這個差距。這是我們決定擴展帕累託邊界的原因。”
Nvidia 的供應鏈優勢是否是其最大的護城河?
主持人 Dwarkesh:我們看到一大批軟件公司的估值在崩跌,原因是市場預期 AI 會讓軟件商品化。有一種看似簡單的邏輯是這樣的:英偉達把 GDS2 文件發給臺積電,臺積電生產邏輯芯片和交換機,再和海力士、美光、三星的 HBM 封裝在一起,然後發給臺灣的 ODM 完成整機組裝。從這個角度看,英偉達本質上是一家軟件公司,只是別人在幫它製造——如果軟件被商品化了,英偉達會不會也被商品化?
Jensen Huang:
歸根結底,總有什麼東西要把電子轉化成 token,這個轉化過程以及讓 token 隨時間變得越來越有價值,不是那麼容易被商品化的。讓一個 token 比另一個更有價值,就像讓一個分子比另一個更有價值——其中涉及的藝術、工程、科學和發明,我們正在親眼見證這一切發生。製造一個 token 所需的轉化、加工、以及背後的科學,遠未被深刻理解,這段旅程也遠未結束。我不認為它會被商品化。你描述的那種框架,其實就是我自己對公司的心智模型:輸入是電子,輸出是 token,中間是英偉達。我們的工作就是做盡可能多的必要事情、儘可能少的不必要事情,來實現這個轉化。"儘可能少"的意思是,凡是我不需要親自做的,就拉一個合作伙伴進來,讓它成為我生態的一部分。如果你今天看英偉達,我們大概擁有全球最大的合作伙伴生態,上游供應鏈、下游所有計算機廠商、應用開發者、模型廠商,全都在裡面。
AI 是一個五層蛋糕(應用、模型、基建、芯片、能源),我們在每一層都有生態系統。我們儘量少做事,但我們必須做的那一部分,偏偏是極其艱難的。我不認為這會被商品化,實際上我也不認為企業軟件公司和工具廠商會被商品化。今天大多數軟件公司本質上是工具製造商,但我看到的是和大多數人相反的東西:AI agent 的數量將會指數級增長,工具的使用者也會指數級增長。Synopsys Design Compiler 的實例數量很可能要暴漲,使用佈局工具、設計規則檢查器的 agent 數量也會暴漲。今天我們受限於工程師的數量,明天這些工程師將被一大批 agent 支持,我們將以前所未有的方式探索設計空間,並且用的就是今天這些工具。工具使用會讓軟件公司的規模飛速增長,這還沒發生的原因是 agent 還不夠擅長使用工具。要麼這些公司自己去構建 agent,要麼 agent 變得足夠強大來使用這些工具,我認為兩者都會發生。
主持人 Dwarkesh:你在最新的財報裡有將近一千億美元的採購承諾,涉及代工廠、內存和封裝。SemiAnalysis 報告說這個數字可能高達 2500 億美元。有一種解讀是:英偉達真正的護城河其實是鎖住了多年的稀缺產能——別人可能也有加速器,但他們能拿到內存嗎?能拿到邏輯芯片嗎?這是不是英偉達未來幾年最大的護城河?
Jensen Huang:
這是我們能做而別人很難做到的事情之一。我們在上游做出了巨大承諾,有一些是你提到的顯性承諾,有一些是隱性的。比如,上游很多投資是由我們的供應鏈夥伴主動做出的,因為我跟他們的 CEO 說:"讓我告訴你這個行業會有多大,讓我來給你解釋為什麼,讓我帶你一起推演,讓我給你看我看到的東西。"通過這個不斷告知、啟發、協同 CEO 們的過程,他們才願意做投資。為什麼他們願意為我投資,而不為別人?因為他們知道英偉達有能力消化他們的供應量,並且通過我們的下游銷售出去。英偉達的下游供應鏈和需求規模如此巨大,他們才願意在上游押注。你看 GTC,人們驚歎於它的規模和參與者的層次——整個 AI 宇宙都在那裡,360 度全覆蓋,因為他們彼此需要見面。我把他們聚在一起,讓下游看到上游,讓上游看到下游,讓所有人看到 AI 的最新進展。重要的是,他們都能親眼見到 AI 原生公司和 AI 初創企業正在做什麼,驗證我一直告訴他們的東西。我花了大量時間直接或間接地讓供應鏈、合作伙伴和生態理解我們面前的機遇。
我們的主題演講裡總有一部分會讓人覺得有點沉重,像是在上課——沒錯,這正是我的想法。我需要確保上游和下游的整個供應鏈都能理解什麼要來了、為什麼會來、什麼時候來、規模有多大,並且能像我一樣系統地推演。關於你說的護城河,我們能夠為未來而建設。如果未來幾年的行業規模是萬億美元量級,我們有供應鏈能夠承接。沒有我們的覆蓋範圍,我們業務的速度——就像現金流一樣,供應鏈也有流量和週轉——沒有人會為一個週轉率低的架構去搭建供應鏈。我們能維持這種規模,只因為我們的下游需求如此強勁,他們看到了,聽到了,一切都在眼前。
主持人 Dwarkesh:我想更具體地瞭解上游產能夠不夠。多年來你們一年翻一倍,算力供給一年超過三倍,在這個規模上翻倍真的很驚人。你是 TSMC N3 節點最大的客戶,也是 N2 的大客戶之一。今年 AI 整體要佔到 N3 的 60%,明年根據 SemiAnalysis 的預測是 86%。當你已經佔多數時,怎麼翻倍?而且要年復一年地做到?
Jensen Huang:
在某種程度上,全球順勢需求大於上下游的供應。你想要的行業就是這樣的,瞬時需求大於全行業總供給,反過來顯然不好,如果差距太大,某個特定環節供應極度不足,整個行業就會蜂擁而上解決它。比如,你現在聽到的關於 CoWoS 的討論少了很多,原因是過去兩年我們猛攻這個瓶頸,翻了好幾個番。現在 TSMC 明白了:CoWoS 產能必須跟上邏輯和內存的需求節奏,他們正在以和邏輯同等的速度擴充 CoWoS 和未來封裝技術。很長一段時間裡,CoWoS 和 HBM 被視為特種產品,但現在它們不再是特種產品了——人們意識到這是主流計算技術,當然我們現在能夠影響更大範圍的供應鏈。AI 革命剛開始時,我今天說的這些話,五年前我就說了。有些人相信並投入,比如 Sanjay 和美光團隊——我還清楚地記得那次會議,我清晰地說明了將會發生什麼、為什麼會發生、以及我的預測,他們真的押注了,我們在 LPDDR 和 HBM 內存上深度合作,他們大力投入,結果對他們來說非常好。有些人來得晚一點,但現在他們都到位了。每一個瓶頸都受到大量關注,而現在我們在提前幾年預判瓶頸。比如,過去幾年我們與 Lumentum、Coherent 以及整個硅光子生態系統的合作,徹底重塑了供應鏈。我們在 TSMC 周圍建立起整套供應鏈,在 COUPE 上與他們合作,發明了一整套技術,並將專利授權給供應鏈,讓整個生態保持開放。我們通過發明新技術、新工作流程、雙面探針等新測試設備、投資公司,幫助他們擴大產能,來準備供應鏈迎接規模化的挑戰。
如果我們勸阻人們不要去做軟件工程師,我們就會面臨軟件工程師短缺的問題。同樣的預言十年前發生過。有些末日預言者當時說:"無論如何,別去當放射科醫生。"你可能現在還能在網上找到那些視頻,說放射科將是第一個消失的職業,世界不再需要放射科醫生。猜猜我們現在短缺什麼?放射科醫生。
主持人 Dwarkesh:你們是怎麼做到每年 2 倍的邏輯製造量的?最終內存和邏輯都受制於 EUV。
Jensen Huang:
這些都不是短期內無法快速擴充的。兩三年內都可以解決,只需要一個需求信號,這些東西不難複製。至於我要深入到供應鏈多遠——有些要直接去談,有些間接,有些則是:只要我能說服 TSMC,ASML 自然會跟進。我們需要考慮關鍵節點,但如果 TSMC 被說服了,幾年內你就會有足夠多的 EUV 機器。要點是:所有瓶頸持續時間都不超過兩三年,一個也不例外。與此同時,我們每一代的計算效率提升 10 到 20 倍,Hopper 到 Blackwell 是 30 到 50 倍。我們用 CUDA 的靈活性不斷髮明新算法,推進效率提升,同時擴充產能。這些我都不擔心。我擔心的是我們下游的事情——比如阻礙能源發展的政策。沒有能源,你沒法建立一個產業;沒有能源,你沒法推進再工業化,沒法把芯片製造、計算機制造、封裝帶回美國,沒法造 EV 和機器人,沒法建 AI 工廠。更多芯片產能,是兩三年的問題;更多 CoWoS 產能,也是兩三年的問題。
TPU 是否會打破 Nvidia 在 AI 計算領域的主導地位?
主持人 Dwarkesh:如果看 TPU,有一種觀點認為,全球前三的模型裡有兩個——Claude 和 Gemini——是在 TPU 上訓練的。這對英偉達意味著什麼?
Jensen Huang:
我們做的是完全不同的東西。英偉達做的是加速計算,不是張量處理單元。加速計算被用於各種領域:分子動力學、量子色動力學、數據處理、數據框、結構化數據、非結構化數據,還有流體動力學和粒子物理學,此外也用於 AI。加速計算的覆蓋面寬泛得多,雖然今天大家談的都是 AI,AI 也確實非常重要,但計算的範圍遠遠超過 AI。英偉達重新定義了計算的方式,從通用計算轉向加速計算。我們的市場覆蓋遠超任何 TPU 或 ASIC 的可能。你看我們的市場地位——我們是唯一一家加速各種應用的公司,擁有龐大的生態系統,各種框架和算法都跑在英偉達上。因為我們的計算機是設計給外部運營商用的,任何運營商都可以購買我們的系統。大多數自研系統必須自己運營,因為它們從未被設計成足夠靈活讓別人來運營。正因為任何人都可以運營我們的系統,我們出現在每一朵雲上,包括 Google、Amazon、Azure 和 OCI。如果你想靠出租賺錢,你最好有來自各行各業的大量客戶生態。如果你想自用,我們也有能力幫助你,就像我們幫助 Elon 的 xAI 那樣。而且因為我們可以讓任何公司、任何行業的運營商部署,你可以用它為 Lilly 的科學研究和藥物發現搭建超算,幫助他們運營自己的超算,用於整個藥物發現和生物科學領域的多樣化需求。有太多 TPU 無法覆蓋的應用場景。英偉達把 CUDA 打造成了一個很棒的張量處理單元,同時它還能處理數據生命週期的每一個環節——處理、計算、AI,全都有。我們的市場機會更大,覆蓋範圍更廣。因為我們支持世界上所有的應用,你在任何地方搭建英偉達系統,都知道會有客戶用它,這是完全不同的事情。
主持人 Dwarkesh:這是個很長的問題。你有著驚人的營收,每季度 600 億美元,但這不是來自醫藥或量子計算的,而是因為 AI 是一項前所未有的技術,以前所未有的速度增長。問題是,對於 AI 本身,什麼才是最優的?
我和我的 AI 研究員朋友交流,他們說,當他們使用 TPU 時,那是一個專門為矩陣乘法優化的巨大脈動陣列;而 GPU 很靈活,適合有大量分支或不規則內存訪問的場景。但 AI 是什麼?就是一遍又一遍極其可預測的矩陣乘法。TPU 不需要為 warp 調度器或線程與內存 bank 之間的切換犧牲芯片面積,專門為當前算力增長的主體用例做了深度優化。你怎麼看?
Jensen Huang:
矩陣乘法是 AI 的重要組成部分,但不是全部。如果你想發明新的 attention 機制,以不同方式做分片,或者從頭設計一種全新架構——比如混合 SSM——你需要的是一個通用可編程的架構。如果你想創建一個融合擴散和自迴歸技術的模型,你同樣需要通用可編程架構。我們能跑你能想到的一切,這是我們的優勢。可編程性讓新算法的發明變得容易得多,而發明新算法才是 AI 進步那麼快的根本原因。TPU 和所有其他東西一樣受摩爾定律影響——摩爾定律每年大概提升 25%。要真正實現 10 倍、100 倍的飛躍,唯一的方式是每年都從根本上改變算法和計算方式。這才是英偉達的核心優勢。當我最初宣佈 Blackwell 的能效將比 Hopper 高 35 倍時,沒人相信。然後 Dylan 寫了一篇文章說我低報了,實際上是 50 倍,純靠摩爾定律做不到這一步。我們的解決方案是新的模型設計——比如 MoE,跨計算系統並行化、分片化、分佈式部署。沒有 CUDA 來生成新的 kernel,我根本不知道從哪裡下手。這是可編程架構與英偉達極致協同設計能力的結合。我們可以把部分計算卸載到 NVLink 的 fabric 上,或者卸載到 Spectrum-X 的網絡層。我們可以同時在處理器、系統、fabric、庫和算法多個層面推進變革。沒有 CUDA,我不知道從何開始。
主持人 Dwarkesh:你 60% 的營收來自五大超大規模雲廠商,在不同的客戶時代——比如跑實驗的教授——他們需要 CUDA,沒辦法用其他加速器,必須用 PyTorch 和 CUDA。但這些超大規模廠商有資源寫自己的 kernel,事實上他們也必須這樣做,才能在特定架構上榨出最後 5% 的性能。Anthropic 和 Google 大部分跑自己的加速器或 TPU 和 Trainium,OpenAI 即便用 GPU 也有 Triton,因為他們需要自己的 kernel,一路下到 CUDA C++,繞過 cuBLAS 和 NCCL 自己搭了一套棧,而且還能編譯到其他加速器。
如果你大多數客戶都能在某種程度上替代 CUDA,CUDA 還真的是讓前沿 AI 發生在英偉達上的那個決定性因素嗎?
Jensen Huang:
CUDA 是一個極其豐富的生態系統。如果你想先在任何架構上構建,先在 CUDA 上構建是非常明智的選擇,因為生態系統非常豐富,我們支持每一種框架。如果你想創建自定義 kernel,我們對 Triton 做出了巨大貢獻——Triton 的後端有大量英偉達技術。我們很樂意幫助每一個框架變得儘可能出色。有很多框架:Triton、vLLM、SGLang,以及現在爆炸式增長的後訓練和強化學習框架,比如 verl 和 NeMo RL。在後訓練和強化學習這整個領域,一切都在爆發式擴張。所以如果你想在某個架構上構建,選 CUDA 是最明智的,因為你知道生態豐富,當出問題時,更可能是你的代碼有問題,而不是底層那座代碼山有問題。出問題時,是你的問題還是機器的問題?你希望永遠是你的問題,希望能信任那臺機器。當然我們自己也還有很多 bug,但我們的系統已經被打磨得足夠好,你至少可以在這個基礎上構建。其次,作為一個在任何地方構建軟件的開發者,最重要的事情是:你要有一個龐大的裝機基數,讓你寫的軟件能跑在大量其他機器上。你不是為自己寫軟件,而是為你的整個機群,或者所有別人的機群寫軟件,因為你是框架構建者,英偉達 CUDA 生態系統是真正的核心寶藏。我們現在有幾億個 GPU 分佈在外面,從 A10、A100、H100、H200,到 L 系列、P 系列,各種尺寸和形態。如果你是一家機器人公司,你希望那套 CUDA 技術棧直接跑在機器人本身裡,我們無處不在。龐大的裝機基數意味著,一旦你開發出軟件或模型,它在任何地方都有用。這種價值是無可替代的。最後,我們出現在每一朵雲上這個事實讓我們真正獨一無二。如果你是 AI 公司或開發者,你不確定會選哪家雲服務商,或者想在哪裡跑。我們到處都能跑,包括你自己的私有部署。生態系統的豐富性、裝機基數的廣泛性、以及我們落地的多樣性,三者結合讓 CUDA 極具價值。
主持人 Dwarkesh:但我好奇的是這些優勢對你的主要客戶是否同樣重要?大客戶中有很多人能夠自己搭建軟件棧。尤其是當 AI 在有嚴格驗證閉環的領域變得越來越強大,這個問題就是——所有超大規模廠商都可以自己寫 kernel 嗎?英偉達在性價比上依然很好,他們可能還是會傾向於英偉達,但問題是,這會不會變成一個單純看誰的規格最好、每一美元能買到多少算力和內存帶寬的競爭?歷史上英偉達的毛利率超過 70%,這正是因為 CUDA 護城河。如果大多數客戶實際上能夠替代 CUDA,這個毛利率還能維持嗎?
Jensen Huang:
我們給這些 AI 實驗室分配的工程師數量大到驚人,專門和他們合作、優化他們的技術棧。原因很簡單:沒有人比我們更瞭解自己的架構。這些架構不像 CPU 那樣通用——CPU 就像凱迪拉克,平穩的豪華轎車,速度不快,但人人都能開,有定速巡航,一切都很順手。英偉達的 GPU,是加速器,更像 F1 賽車。一般人開到時速一百公里沒問題,但要把它推到極限,需要相當深厚的功力。我們大量使用 AI 來生成我們自己的 kernel。我相當確信,在相當長一段時間內,我們依然是不可或缺的。我們的專業知識幫助我們的 AI 實驗室夥伴從他們的技術棧裡再擠出 2 倍的效能——而且往往非常輕鬆。我們優化完一個特定 kernel,或者完成對他們整個棧的優化,他們的模型加速 2 倍、3 倍、50% 是非常正常的事情。這是個巨大的數字,尤其當你談的是他們已經有的大量 Hopper 和 Blackwell 的裝機基數時——如果效率翻倍,那直接對應翻倍的營收。英偉達的計算棧是世界上性價比最好的,沒有例外。沒有任何一個平臺能向我證明,它在今天有更好的性能/總擁有成本比。沒有一家。InferenceMAX 基準就放在那裡,歡迎所有人跑,TPU 不來,Trainium 不來。我歡迎他們用 InferenceMAX 展示他們聲稱的 40% 成本優勢,沒人想來。其次,你說 60% 的客戶是前五大,但那其中大部分都是對外業務——AWS 上的大量英偉達是給外部客戶的,不是 AWS 自用;Azure 上的客戶全是外部客戶;OCI 也是。他們之所以偏好我們,是因為我們的覆蓋範圍極廣,我們能帶來各行各業的頂級客戶。這些客戶都建在英偉達上,因為我們的覆蓋範圍和靈活性無可比擬。飛輪就是:裝機基數、架構可編程性、生態豐富性,加上全球有數萬家 AI 公司。如果你是其中一個 AI 初創企業,你會選哪種架構?最豐富的那個。最大裝機基數的那個。生態最豐富的那個。這就是飛輪運轉的方式,加上最高的單位算力收益和最高的每瓦性能——如果你的合作伙伴建了一個 GW 的數據中心,那個數據中心要能產出最多的 token 和最大的營收,我們是全球最高 token 每瓦的架構。如果你的目標是出租基礎設施,我們有全球最多的客戶。這就是飛輪能轉的原因。
主持人 Dwarkesh:Anthropic 剛剛宣佈了一個多 GW 級別、與 Broadcom 和 Google 合作的 TPU 大單,而且他們大多數算力都來自 TPU。如果我看這些大型 AI 公司,似乎有一大塊算力正在從英偉達轉移出去。如何解釋這個現象?
Jensen Huang:
Anthropic 是一個特例,不是一種趨勢。沒有 Anthropic,TPU 增長從何而來?那是 100% 來自 Anthropic 的。沒有 Anthropic,Trainium 的增長從何而來?同樣是 100% 來自 Anthropic。這一點相當廣為人知,大家基本都理解。這不是說有一大堆 ASIC 機會湧現,只有一個 Anthropic。
我不會因為別人用了其他東西、在嘗試新方向而感到不快。如果他們不去試試其他東西,怎麼知道我們有多好?有時候需要一個參照點來提醒自己。我們必須持續贏得我們的市場地位。總有各種大話,看看被取消了多少個 ASIC 項目。要建出比英偉達更好的東西,不是那麼容易的事情。英偉達哪裡出了問題,大家才會覺得這說得通?因為我們的規模,我們的迭代速度,我們是全球唯一一家每年都在大跨步前進的公司。
ASIC 的利潤率相當高,英偉達是 70%,ASIC 是 65%。ASIC 的毛利率從我能看到的情況來說很不錯,他們自己也這樣認為,對自己不錯的 ASIC 毛利率頗為自豪。所以,你問為什麼會這樣。很久以前,我們根本沒有能力這樣做。當時我沒有深刻理解,建立像 OpenAI 和 Anthropic 這樣的基礎 AI 實驗室有多困難,以及他們需要來自供應商本身的鉅額投資。我們當時沒有能力向 Anthropic 做數十億美元的投資來換取他們用我們的算力。Google 和 AWS 有這個能力,他們在初期大力投資 Anthropic,Anthropic 因此使用了他們的算力。我當時沒有這個條件。我的失誤在於,我沒有深刻認識到他們根本沒有別的選擇——風險投資永遠不會向一家 AI 實驗室投入 50 到 100 億美元,並期待它變成今天的 Anthropic。這是我的盲區。但即使我當時理解了,我們也不見得有那個條件,但我不會再犯同樣的錯誤了。我很高興投資 OpenAI,很高興幫助他們擴大規模,我認為這是必須做的事情。當我們有能力時,當 Anthropic 來找我們,我很高興成為投資人,很高興幫助他們擴大規模。只是當初沒能做到。如果能倒帶,如果英偉達那時候就有今天這樣的規模,我會很樂意那樣做。
為什麼 Nvidia 不直接成為超大規模雲服務商?
主持人 Dwarkesh:多年來英偉達一直是 AI 領域賺錢的那個,賺了很多很多錢。現在你們開始投資了,據報道你向 OpenAI 投了 300 億美元,向 Anthropic 投了 100 億美元。他們的估值已經大漲,而且肯定會繼續漲。在那麼多年裡,你一直在給他們提供算力,你看到了方向,他們的價值在一年前還只有今天的十分之一——而那時你就有大量現金。
有一個設想是:要麼英偉達自己成立一個基礎模型實驗室,要麼以低得多的估值做現在這樣的投資。你有那個現金,為什麼不早點做?
Jensen Huang:
我們在能做的時候做了。如果我能早一點,我會做的。當時 Anthropic 需要我們行動的那一刻,我們確實沒有那個條件,也還沒有那樣的認知和思維模式。
是投資規模的問題。我們那時候從未在公司外部做過投資,而且沒投過那麼大的金額。我們沒有意識到需要那樣做。我一直以為他們可以像所有公司一樣去找 VC 融資。但他們想做的事,不可能靠 VC 完成。OpenAI 想做的事,也不可能靠 VC 完成。這就是他們的高明之處,那也是他們的聰明所在——他們當時就意識到必須走一條不同的路。我很高興他們這樣做了。即使因為我們的缺席,Anthropic 不得不轉向別人,我仍然很高興這一切發生了。Anthropic 的存在對世界是好事,我為此感到高興。
主持人 Dwarkesh:你仍然在賺大錢,而且季度接著季度賺得更多。現在的問題是,英偉達現在應該用這些錢做什麼?有一種答案是:現在有一整套中間商生態系統,把 CapEx 轉化成 OpEx,提供給這些實驗室出租算力——因為芯片很貴,但隨著 AI 模型越來越好,它們在生命週期內能產生的價值越來越大。英偉達有錢做 CapEx,據報道你在 CoreWeave 背書了高達 63 億美元並投資了 20 億美元。為什麼英偉達不自己做雲服務,自己做超大規模廠商,把這些算力出租出去?你有足夠的現金。
Jensen Huang:
這是公司的哲學問題,而且我認為它是明智的。我們應該做盡可能多的必要事情,儘可能少的不必要事情。這意味著:我們在構建計算平臺上做的工作,如果我們不做,我真的相信沒有人會做。如果我們不承擔我們承擔的風險——如果我們沒有以我們的方式構建 NVLink,沒有搭建整個技術棧,沒有以我們的方式培育生態,沒有專注於 CUDA 長達 20 年且大部分時間都在虧損——如果不是我們做,沒有人會做。如果我們沒有創建所有那些 CUDA-X 領域專屬庫,無論是光線追蹤、圖像生成,還是早期 AI 的種種工作,無論是數據處理、結構化數據處理還是向量數據處理,如果不是我們做,沒有人會做。比如我們為計算光刻學創建了 cuLitho——如果不是我們,沒有人會。
所以加速計算不會以它今天的方式發展,如果不是我們在做這件事。所以我們應該做。應該全力以赴,把所有力量集中到做這件事上。但是,世界上不缺雲服務——如果不是我們做,有人會出來做。按照"做盡可能多的必要、儘可能少的不必要"這個哲學來看,如果不支持 CoreWeave 存在,這些新興 AI 雲就不會出現。如果沒有幫助 CoreWeave,他們就不會存在。如果沒有支持 Nscale,他們不會有今天。如果沒有支持 Nebius,他們不會有今天。現在他們都發展得很好。這是一種商業模式嗎——我們應該做盡可能多的必要,儘可能少的不必要。所以我們在生態系統中投資,因為我希望我們的生態系統蓬勃發展。我希望這個架構和 AI 能與儘可能多的行業、儘可能多的國家連接,讓全球能夠建立在 AI 之上,建立在美國科技棧之上,這就是我們正在追求的願景。
英偉達最初成立時,有 60 家三維圖形公司,我們是最不可能存活下來的那一家。英偉達當時的圖形架構恰恰是錯的,不是差一點,是截然相反的方向,開發者根本沒法支持。從良好的第一性原理出發,我們推導出了一個錯誤的答案,任何人都會把我們劃掉。但我們現在就在這裡,所以我有足夠的謙遜去認識到這一點:不要押注贏家。要麼讓他們自己決勝,要麼給所有人機會。
主持人 Dwarkesh:但你列舉了一堆沒有英偉達就不會存在的新興雲,這和"不挑贏家"怎麼兼容?
Jensen Huang:
首先,他們要想存在,要主動找來求助。當他們想存在、有商業計劃、有專業能力和熱情的時候——當然,他們本身也必須具備一定實力。但如果在最後,他們需要一些投資來起步,我們會在那裡支持他們。一旦他們的飛輪轉起來,我們希望他們儘快獨立。你的問題是"我們是否想做融資業務"——答案是不。有專門做融資的公司,我們更願意和所有這些融資方合作,而不是自己去做融資商。我們的目標是專注於我們做的事,把商業模式保持儘可能簡單,並支持我們的生態。當像 OpenAI 這樣的公司,在 IPO 之前需要 300 億美元規模的投資,而我們深信他們將成為一家了不起的公司——他們今天已經是了,他們未來會是一家令人難以置信的公司,世界需要他們存在,世界希望他們存在,我希望他們存在,他們的風正在吹——支持他們,讓他們成長。這樣的投資我們會做,因為他們需要我們去做。但我們不是要做盡可能多的事情,我們是要做盡可能少。
主持人 Dwarkesh:GPU 分配這個話題——我們一直處於 GPU 短缺狀態。英偉達據說按照一套非單純競價的方式分配稀缺產能,比如保證 CoreWeave、Crusoe、Lambda 這樣的新興雲能拿到一些。為什麼這對英偉達是好事?首先,你認同這個“劃分市場份額”的描述嗎?
Jensen Huang:
不是,你的前提是錯的,我們對這些事情考慮得非常周到。首先,如果你不下采購訂單(PO),說多少話都沒用。沒有 PO 之前,我們能做什麼?所以第一件事,我們非常努力地和所有人一起做預測,因為這些東西需要很長時間來建造,數據中心也需要很長時間來建造。我們通過預測來協調供需——這是第一要務。其次,我們儘可能和更多人一起做預測,但最終還是得下訂單。
或許因為某些原因,你沒有及時下單,那我能怎麼辦?先到先得。如果你還沒準備好——數據中心沒準備好,或者某些配件還沒到位導致無法上線——我們可能會決定先服務另一個客戶,這只是為了最大化自己工廠的產出效率,會做一些這樣的調整。除此之外,優先原則就是先來先得,得下 PO 才算數。關於 Larry 和 Elon 跟我吃飯苦苦求 GPU 的那些故事,那是完全不存在的。我們確實吃了飯,那是一頓很棒的晚餐,但他們從來沒有求 GPU,他們只是需要去下訂單。一旦下了訂單,我們就盡全力爭取產能。我們不復雜。
主持人 Dwarkesh:所以有一個隊列,根據你的數據中心是否準備好、你何時下了採購訂單來決定你拿到貨的時間。但聽起來也不是完全按出價最高的來。為什麼不這樣做?
Jensen Huang:
我們從不這樣做,也永遠不會。這是一種不好的商業實踐,你定好價格,人們決定買還是不買。我瞭解芯片行業裡有其他公司會在需求高漲時調價,但我們不這樣做。這從來不是我們的做法。你可以依賴我們。我更傾向於做一個可以依賴的行業基礎設施。不需要猜測——我報給你一個價格,就是那個價格,需求再旺盛也是那個價格。英偉達和臺積電的關係也是這樣,雙方沒有法律合同,有時我佔便宜,有時我吃虧,但整體來說這段關係非常好,我完全信任他們,完全依賴他們。你可以依賴英偉達的一件事是:今年 Vera Rubin 會很出色,明年 Vera Rubin Ultra 會來,後年 Feynman 會來。每年你都可以依賴我們。你去全球找任何一個 ASIC 團隊,看能不能說出"我可以把我整個生意都押在你身上,保證你每年都會在這裡陪著我,token 成本每年降一個數量級,我可以像信鐘錶一樣信你"——對於其他鑄造廠你絕對無法說這句話。但對於英偉達,今天你可以說。如果你想買價值 10 億美元的 AI 工廠算力,沒問題;1 億美元,沒問題;1000 萬美元,一個機櫃,一張顯卡,都沒問題;1000 億美元的訂單,也沒問題——我們是全球唯一一家能讓你這麼說的公司。我們和臺積電也是如此:買一臺還是買 10 億臺,都沒問題,只要走完計劃流程、做好所有成熟的事情就可以。英偉達成為全球 AI 行業基礎設施的這個地位,花了幾十年才到達,需要巨大的承諾和奉獻,需要公司的穩定性和一致性。
我們是否應該向中國出售 AI 芯片?
主持人 Dwarkesh:Anthropic 幾天前剛剛發佈了 Claude Mythos 預覽版,這個模型他們甚至不公開發布,因為他們說它具有如此強大的網絡攻擊能力,在修補完那些零日漏洞之前,世界還沒做好準備。他們說它在每個主要操作系統和每個瀏覽器中發現了數以千計的高危漏洞,甚至在 OpenBSD 中發現了一個——那是專門設計來沒有零日漏洞的操作系統——找到了一個存在了 27 年的漏洞。
如果中國的公司、實驗室和政府擁有 AI 芯片來訓練出像 Claude Mythos 這樣具備網絡攻擊能力的模型,並運行數百萬個實例,那是對美國公司和國家安全的威脅嗎?
Jensen Huang:
首先,Mythos 是在相當普通的算力上、用相當普通的規模訓練出來的,來自一家非凡的公司。中國的計算能力和訓練所需的計算資源都非常充足,所以你首先要認識到:芯片在中國是存在的,他們製造了全球 60% 甚至更多的主流芯片,這對他們來說是一個非常大的產業。他們有一些世界上最出色的計算機科學家,而且這些 AI 實驗室裡大多數 AI 研究員都是華裔,他們擁有全球 50% 的 AI 研究員。所以問題是:考慮到他們已經擁有的這些資產——充足的能源、充足的芯片、大量 AI 研究員——如果你擔心他們,創造一個安全世界的最佳方式是什麼?把他們打成受害者、變成敵人,很可能不是最好的答案。他們是對手,我們希望美國贏,但我認為保持對話、保持研究交流,可能是最安全的做法。這是一個因為我們目前對中國作為對手的態度而嚴重缺失的領域。AI 研究員之間的交流是必須保持的,我們必須嘗試共同商定 AI 不能被用於哪些用途。至於發現軟件漏洞,那當然就是 AI 應該做的事情。AI 會發現很多軟件中的 bug 嗎?當然會,因為有很多很多 bug,AI 軟件本身裡就有大量 bug。這正是 AI 本來就應該做的事情,我很高興 AI 已經達到了這種能力水平。
一個被低估的方面是圍繞網絡安全的整個生態,包括 AI 網絡安全、AI 安全和 AI 隱私。有一大批 AI 初創公司正在為我們打造這樣的未來:一個能力驚人的 AI agent,周圍有成千上萬個 AI agent 守護著它,保障它的安全性和安全運行。這個未來必然會到來。一個 AI agent 四處亂跑、沒有任何監控的想法本來就很瘋狂。我們非常清楚這個生態系統需要蓬勃發展。而這個生態需要開源,需要開放模型,需要開放的技術棧,這樣所有這些 AI 研究員和優秀的計算機科學家才能去構建能保障 AI 安全的 AI 系統。因此我們需要確保的一件事,是保持開源生態的活力。這一點不能被忽視,而大量的開源貢獻來自中國。我們當然希望美國擁有儘可能多的算力,我們受限於能源,但有很多人在解決這個問題,我們不能讓能源成為我們國家的瓶頸,但我們同時也希望全球所有 AI 開發者都在美國科技棧上開發,讓 AI 的進步——尤其是開源的進步——對美國生態系統可及。如果搞出兩個生態系統——開源生態只跑在外國技術棧上,封閉生態跑在美國技術棧上——那對美國來說是一個糟糕的結果,我絕不這樣做。
主持人 Dwarkesh:那麼這個擔憂的核心,回到算力差距和黑客問題上是:有估計認為,因為他們在 7nm、沒有 EUV——出口管制限制了光刻機——他們能生產的算力,只有美國的十分之一。那麼他們最終能訓練出像 Mythos 這樣的模型嗎?能。但因為我們有更多算力,美國實驗室能先做到這一點。因為 Anthropic 先做到了,他們說"我們先保留一個月,讓所有美國公司來修復漏洞,然後再發布"。而且即便他們也訓練出了這樣的模型,大規模部署的能力也很重要——如果你有一個網絡黑客,有一百萬個比有一千個危險得多。所以推理算力非常關鍵。事實上,他們擁有那麼多如此出色的 AI 研究員,這正是讓人擔憂的地方,是算力讓這些工程師研究員更有效率。
如果你和美國任何一家 AI 實驗室交流,他們都說瓶頸是算力。那麼,難道不是美國公司因為有更多算力、先於中國達到 Mythos 這個能力水平,讓社會有時間準備,這樣不是更好嗎?
Jensen Huang:
我們應該永遠是第一,我們應該永遠擁有更多。但為了實現你所描述的結果,你必須走向極端——他們必須完全沒有算力。如果他們有一些算力,問題就是需要多少。中國擁有的算力是巨大的,你在談的是全球第二大計算市場。如果他們想匯聚算力,他們有充足的算力可以匯聚。
AI 是一個並行計算問題,對吧?那為什麼他們不能簡單地把 4 倍、10 倍的芯片連在一起,他們有大量能源。他們有完全空置的數據中心、電已經通好了,中國有鬼城,他們也有廢棄的數據中心,他們有大量基礎設施容量。如果他們想,他們只需要把更多芯片堆在一起,哪怕是 7nm 的。他們製造芯片的能力是全球最大之一,整個半導體行業都清楚他們壟斷了主流芯片,他們的產能是過剩的、太多了,所以中國沒有 AI 芯片這個想法完全是無稽之談。
當然如果你問我,如果全世界都沒有算力,美國會不會走得更遠?但那根本不是一個可能發生的結果,那根本不是真實的場景,他們已經有充足的算力了。你所擔心的那個門檻,他們已經跨過了,而且超過了。所以我認為你誤解了 AI 是一個五層蛋糕,而最底層是能源,當你有充足的能源,它可以彌補芯片的不足。如果你有充足的芯片,它可以彌補能源的不足。比如,美國的能源是稀缺的,這正是為什麼英偉達必須不斷推進我們的架構,做這種極致的協同設計,讓我們交付的每一批芯片——因為能源如此有限——每瓦的吞吐量都極其出色。但如果你的瓦數是完全充裕、近乎免費的,你在乎每瓦性能做什麼?你只管用舊芯片堆就行了。7nm 芯片本質上就相當於 Hopper 這一代。今天的模型大部分都是用 Hopper 這代訓練的,7nm 芯片完全夠用。豐富的能源是他們的優勢。但如果他們能製造出足夠多的芯片呢——華為剛剛經歷了公司歷史上單年規模最大的一年,出貨了幾百萬顆,幾百萬顆比 Anthropic 擁有的多得多。有人質疑 SMIC 能生產多少邏輯,以及內存——我在告訴你現實:他們有充足的邏輯,他們有充足的 HBM2 內存。
主持人 Dwarkesh:但是訓練和推理這些模型的瓶頸往往是內存帶寬。如果他們用的是 HBM2,和你們最新的產品相比,可能有將近一個數量級的內存帶寬差距,這是巨大的差距。
Jensen Huang:
華為是一家網絡公司,而且你不需要 EUV 來做最先進的 HBM——這根本不對。你可以把它們連在一起,就像我們用 NVL72 把它們連在一起一樣。他們已經展示了用硅光子把所有算力連成一臺巨型超算。事實是,他們的 AI 發展進展相當順利。世界上最好的 AI 研究員,因為算力受限,所以想出了極其聰明的算法。記住我剛才說的:摩爾定律每年提升約 25%,但通過優秀的計算機科學,算法性能還能再提升 10 倍。
優秀的計算機科學才是真正的槓桿。MoE 是一個偉大的發明,毫無疑問。各種出色的 attention 機制減少了計算量。我們必須承認 AI 的大多數進步來自算法的進步,而不只是原始硬件。現在如果大多數進步來自算法和計算機科學與編程,那你告訴我,他們那支 AI 研究員大軍難道不是他們最根本的優勢?我們已經看到了,DeepSeek 不是一個可以忽視的進展。DeepSeek 第一天在華為芯片上發佈的那一天,對我們國家來說是一個糟糕的結果。
主持人 Dwarkesh:目前 DeepSeek 可以在任何加速器上運行,因為它是開源的。為什麼這種情況在未來不會延續?
Jensen Huang:
如果它針對華為架構做了優化,我們的架構就會處於劣勢。你描述了一種我認為是好消息的情況——一家公司開發了軟件、開發了 AI 模型,而它在美國技術棧上跑得最好,那是好消息,你把它作為壞消息的前提,我給你壞消息的版本:全球 AI 模型都在被開發,而且跑在非美國硬件上效果最好,那對我們來說是壞消息。
你拿一個針對英偉達優化的模型,試著在其他顯卡上去跑,它們跑得沒有更好。英偉達的成功本身就是最好的證明。AI 模型在我們的技術棧上創建、在我們的技術棧上跑得最好——這有什麼難理解的?去全球南方,去中東看看,開箱即用,如果所有 AI 模型在別人的技術棧上跑得最好,那你得解釋一下,你真的要說那對美國是好事嗎?
主持人 Dwarkesh:假設中國公司先於美國達到下一個 Mythos,他們先發現了美國軟件的所有安全漏洞,但他們是在英偉達芯片上做到的,然後把模型發佈到全球南方。跑在英偉達芯片上——這有什麼好的?
Jensen Huang:
這不好,確實不好,所以我們不能讓這發生。
主持人 Dwarkesh:為什麼你認為,如果我們不向他們賣芯片,華為就會精確地填補這個空缺?他們在芯片上是落後的,對吧?
Jensen Huang:
證據就在眼前,他們的芯片產業是巨大的,他們可以用兩倍數量的芯片,他們有大量隨時可用的能源,需要填滿芯片,而且他們擅長製造。我相信他們最終能超產所有人。如果有這麼幾個關鍵的年份,那在這幾年裡,我們必須確保全球所有 AI 模型都建立在美國技術棧上。
你為什麼要讓 AI 行業的某一層因此失去整個市場,來換取另一層的利益?五層都需要成功,每一層都很重要。
主持人 Dwarkesh:退一步來講,中國現在被卡在 7nm,而你會繼續前進到 3nm、2nm、1.6nm 的 Feynman。當你到了 1.6nm,他們還在 7nm,即便過幾年也一樣。你認為,你越來越多的算力加上他們的豐富能源,相當於他們在不斷獲得更多算力。
Jensen Huang:
我們應該永遠是第一,應該永遠擁有更多。但為了實現你描述的那種結果,他們必須沒有任何算力。如果他們有一些算力,問題就是需要多少。
美國擁有的算力比世界上任何地方多 100 倍,美國應該領先。英偉達確保美國實驗室總是第一個聽到新進展、第一個有機會購買。如果他們沒有足夠的錢,我們甚至投資他們。美國應該領先,我們盡一切努力確保美國領先——這是第一要點,你同意嗎?我們正在做一切能做的事情。但如果向中國賣芯片讓他們在算力上擺脫瓶頸,這如何幫助美國保持領先?
我們為美國準備了 Vera Rubin。第一,為什麼我們不提出一個更平衡的監管方案,讓英偉達能在全球獲勝,而不是拱手相讓整個世界?為什麼你希望美國放棄全球市場?芯片行業是美國生態系統的一部分,是美國技術領導力的一部分,是 AI 生態系統的一部分,是 AI 領導力的一部分。為什麼你的政策思路會導致美國放棄全球大部分市場?
主持人 Dwarkesh:如果那些算力可以運行一個能對美國軟件做零日漏洞攻擊的模型,那怎麼能說那不是一種武器?
Jensen Huang:
首先,解決這個問題的方式是與研究員對話,與中國對話,與所有國家對話,確保人們不會以那種方式使用技術。這個對話必須發生。第二,我們還需要確保美國領先,Vera Rubin、Blackwell 在美國大量供應,堆積如山。美國有出色的 AI 研究員,狀態很好,我們應該保持領先。但是我們也必須認識到 AI 不只是一個模型,AI 是一個五層蛋糕,行業的每一層都很重要,我們希望美國在每一層都獲勝,包括芯片層。放棄整個市場,不會讓美國在技術競爭中長期獲勝,在芯片層、在計算棧層都不會。這是事實。
主持人 Dwarkesh:那麼,向他們賣芯片如何幫助我們長期獲勝?特斯拉很長時間向中國賣非常好的電動車,iPhone 也在中國賣,但都沒有造成鎖定效應,中國的 EV 現在占主導地位,他們的智能手機也在占主導地位。
Jensen Huang:
當我們開始今天的對話時,你用了"護城河"這個詞來描述英偉達的地位。對我們公司而言,最重要的單一因素是我們生態系統的豐富性,而這關乎開發者。50% 的 AI 開發者在中國,美國不應該放棄這些人。
我們必須繼續創新,我們的市場份額在增長,而不是下降。即便我們在中國市場競爭,也會把那個市場讓給別人——這種假設,你不是在跟一個認為自己是失敗者的人對話。那種失敗者心態,那種失敗者前提,對我毫無意義。我們不是一輛汽車,不是汽車這種今天買這個品牌、明天換另一個品牌、輕而易舉的東西。計算不是那樣的,x86 的存在是有原因的,ARM 如此難以替代是有原因的。這些生態系統很難被取代,需要大量的時間和精力,而大多數人根本不想這樣做。所以我們的工作是繼續培育那個生態,持續推進技術,在市場上保持競爭力。基於你所描述的前提就放棄一個市場,我無法接受這種想法。這沒有意義,因為我不認為美國是失敗者,我們的行業也不是失敗者,那種失敗心態對我毫無意義。
如果那些芯片上運行的 AI 模型具備網絡攻擊能力,或者那些芯片正在訓練具有網絡攻擊能力的模型並運行更多實例,它不是核武器,但它確實能啟用一種武器。你的邏輯,用同樣的道理也可以套用在微處理器和 DRAM 上,乃至電力上。事實上,我們對中國有大量出口管制,涵蓋各種芯片製造技術,但我們還是向中國出售大量 DRAM 和 CPU,而且我認為這是對的。
主持人 Dwarkesh:我猜這又回到了 AI 是否不同的根本問題。如果 AI 具備找到軟件零日漏洞的能力,我們是否希望儘量減少中國的能力,讓他們最後達到那一步,並且無法大規模部署?
Jensen Huang:
我們希望美國領先,我們能做到這一點。如果芯片已經在那裡,他們用它訓練了這個模型,我們怎麼控制這個情況?我們有大量算力,有大量 AI 研究員,我們在盡全力快速奔跑。
主持人 Dwarkesh:但他們有理由從你這裡購買,我們有中國公司創始人說他們的算力是瓶頸。
Jensen Huang:
因為我們的芯片更好。總體上來說,我們的芯片更好,這毫無疑問。在沒有我們的芯片的情況下——你能承認華為經歷了創紀錄的一年嗎?能承認大量芯片公司上市了嗎?能承認嗎?能承認我們曾經在那個市場有很大份額,而現在沒有了嗎?我們還可以承認中國是全球科技行業的約 40%。為了一家公司的利益,就把這個市場拱手相讓,是對美國的一種損害,是對國家安全的損害,是對技術領導力的損害,對我毫無意義。
主持人 Dwarkesh:我困惑的是你好像在說兩件不同的事。一是,如果我們被允許競爭,我們會在與華為的競爭中獲勝,因為我們的芯片會好得多。二是,沒有我們,他們也會做同樣的事情。這兩件事怎麼能同時成立?
Jensen Huang:
這顯然是成立的。在沒有更好的選擇時,你會選你唯一有的選擇。這有什麼不合邏輯的?邏輯完全正確。他們想要英偉達芯片的原因是它更好。更好有多種含義——更容易編程,更好的生態系統。當然,不管"更好"意味著什麼,我們肯定會向他們賣算力,那又怎樣?事實是,我們能從中受益。別忘了我們得到了美國技術領導力的好處,我們得到了在美國技術棧上工作的開發者的貢獻,我們得到的好處是那些 AI 模型擴散到世界其他地方,美國技術棧因此是最好的。我們可以繼續推進和擴散美國技術,這是正向的,這是美國技術領導力非常重要的一部分。你倡導的政策導致了美國電信行業基本上被從全世界趕出去,到現在我們甚至不掌控自己的電信了。我不認為那是聰明的做法,有點短視,而且帶來了我現在跟你描述的、你似乎很難理解的非預期後果。好,讓我們退一步。
主持人 Dwarkesh:問題的核心是:有潛在的好處,也有潛在的代價,我們要判斷代價是否值得付。算力是訓練強大模型的輸入,強大模型確實有強大的攻擊能力。Anthropic 先拿到 Mythos 級別能力這件事是好的,他們現在會保留這個能力一段時間,讓美國公司和政府修補漏洞,在發佈之前先做好防禦。如果中國有更多或者彙集更多算力,能更早訓練出 Mythos 級別的模型並大規模部署,那將是非常糟糕的。美國有更多算力、有像英偉達這樣的公司,正是我們沒有出現那種情況的原因之一。這就是向中國出售芯片的代價。所以先把好處放一邊,你承認這是一個潛在的代價嗎?
Jensen Huang:
我同樣會告訴你潛在的代價是:我們讓 AI 技術棧中最重要的層之一——芯片層——丟失了整個市場,全球第二大市場,這樣他們就能發展出規模,發展出自己的生態系統,讓未來的 AI 模型以和美國技術棧截然不同的方式做優化。隨著 AI 擴散到世界其他地方,他們的標準、他們的技術棧將因為他們的模型是開放的而超越我們的。美國應該贏得那個五層蛋糕的每一層,包括芯片層。所有五層都很重要,我們應該贏得全部。
主持人 Dwarkesh:但中國是全球開源軟件最大的貢獻者、開放模型最大的貢獻者,而且今天都建立在美國技術棧、英偉達上。
Jensen Huang:
正確。今天建立在美國技術棧上,但如果我們被迫離開中國,首先這是一個政策錯誤,顯然已經產生了反作用,並且已經導致了我現在描述給你的這些情況——加速了他們的芯片行業,迫使他們整個 AI 生態系統把注意力集中在內部架構上。現在還不算太晚,但這些事情已經發生了。未來幾年,你會看到他們不會停留在 7nm——他們擅長製造,他們會繼續從 7nm 繼續推進。5nm 和 7nm 之間有 10 倍的差距嗎?答案是沒有。架構重要,網絡重要,能源重要。所有這些都很重要,不是你試圖簡化的那種樣子。如果你把它簡化成"是否把計算等同於核武器",那你就把整個問題引到了錯誤的地方。
AI 不是核武器,AI 不能被等同於各種類型的武器,這會讓每個人都害怕 AI,這對美國有什麼好處?如果我們嚇走所有想成為軟件工程師的人,說 AI 會幹掉所有軟件工程師,那我們就會面臨軟件工程師短缺。所以我要說的是,當你構建瞭如此極端的前提,把一切都從零變到無窮大,你最終是在以一種根本不真實的方式嚇唬人們。生活不是那樣的。我們希望美國是第一嗎?當然。我們需要在那個技術棧的每一層都領先嗎?當然。
今天我們談 Mythos 是因為它很重要,但再過幾年,當我們希望美國技術棧擴散到全球——擴散到印度、中東、非洲、東南亞——當我們國家希望出口技術、出口我們的標準,在那一天,我希望你和我再進行一次同樣的對話。我會告訴你今天的對話,告訴你你的政策和你的想象,是如何字字句句地讓美國拱手相讓了全球第二大市場,我們不應該拱手相讓。我們為什麼要主動放棄?現在沒有人主張非此即彼——沒有人主張隨時隨地無限制地向中國賣任何東西。我們應該永遠在美國擁有最好的技術,永遠在美國擁有最多的技術,而且要是第一個。但我們也應該嘗試在全球競爭並獲勝,這兩件事可以同時發生,需要一些細緻、一些成熟,而不是走極端。世界不是非黑即白的。
為什麼 Nvidia 不開發多種不同的芯片架構?
主持人 Dwarkesh:我們之前討論了臺積電 N3 的產能瓶頸,如果你已經佔了 N3 的多數,而且某個時點你會成為 N2 的多數——你有沒有可能利用舊節點 N7 的富餘產能,用今天所有關於數值類型等方面的認知,重新做一個 Hopper 或 Ampere 級別的產品?這種可能在 2030 年之前發生嗎?
Jensen Huang:
沒有這個必要。原因是每一代架構不只是關於晶體管的縮小,還有大量的工程創新和封裝設計、芯片堆疊、數值類型,以及整體系統架構。要退回去用另一個節點做這種級別的研發,成本之高沒有人能負擔,至少不是"退回去"的方向——我們能負擔的是繼續向前衝。除非有一天,如果世界宣佈永遠不會再有更多產能。那一天,我會毫不猶豫地回去用 7nm 嗎?當然,想都不用想。
主持人 Dwarkesh:我和一些人聊過,他們的問題是:為什麼英偉達不同時推進多個完全不同架構的芯片項目?比如 Cerebras 那種晶圓級架構,Dojo 那種超大封裝,或者一個沒有 CUDA 的方向。你有資源和工程人才可以並行推進這些,為什麼要把雞蛋放在一個籃子裡?AI 可能走向我們未知的方向,架構可能走向我們未知的方向。
Jensen Huang:
我們可以這樣做,只是我們沒有更好的想法。我們完全可以做所有這些,只是它們都不是更好的。我們在模擬器裡全都跑過了,結果是更差,所以我們不會那樣做。我們正在做我們想做的那些項目,如果工作負載發生了顯著變化——我說的不是算法變化,而是真正的工作負載形態的變化,這取決於市場的結構——我們可能會決定增加其他加速器。
在幾年前,token 要麼是免費的,要麼幾乎是零成本的。但現在你可以為不同的客戶提供不同定價的 token。有一些客戶願意為它付出更高的價格——比如我們的軟件工程師,如果我能給他們更快速響應的 token,讓他們比今天更高效,我願意為此付錢。但這個市場只是最近才出現的。所以我現在有能力對同一個模型,基於響應時間,做出不同的細分市場。這就是我們決定擴展帕累託邊界、創造更快響應時間的推理細分市場的原因,即使吞吐量更低。以前,高吞吐量總是更好。我們認為,可能存在一個世界,有非常高單價的 token,即使工廠吞吐量更低,高單價也能彌補這個差距。這就是我們這樣做的原因。但從架構角度來看,如果我有更多錢,我會把更多資源押在英偉達的架構上。我認為極致高價 token 和推理市場的細分化,是非常有趣的方向。
主持人 Dwarkesh:最後一個問題。假設深度學習革命沒有發生,英偉達會在做什麼?
Jensen Huang:
加速計算,和我們一直做的一樣。我們公司的核心前提是,摩爾定律對很多計算任務來說已經不夠用了,通用計算固然好用,但對很多計算來說並不理想。所以我們把 GPU 和 CUDA 的架構與 CPU 結合,能夠加速工作負載——把代碼的不同 kernel 或算法卸載到我們的 GPU 上,結果是把應用速度提升 100 倍、200 倍。這能用在哪裡?工程、科學和物理、數據處理、計算機圖形、圖像生成,各種各樣的東西。即使 AI 今天根本不存在,英偉達也會非常、非常龐大。原因是相當根本性的:通用計算繼續擴展的能力基本上已經走到了盡頭,而出路就是領域專屬加速。
我們最初切入的領域是計算機圖形,但還有很多其他領域——粒子物理、流體動力學、結構化數據處理,以及各種各樣能從 CUDA 獲益的算法。我們的使命一直是把加速計算帶給全世界,推動通用計算無法完成的應用類型,擴展到那些能突破某些科學領域瓶頸的能力級別。一些早期的應用就是分子動力學、地震處理用於能源勘探、圖像處理,這些都是通用計算效率太低無法處理的領域。
如果沒有 AI,我會很難過,但因為我們在計算上取得的進步,我們讓深度學習走向了民主化,讓任何研究員、任何科學家、任何地方、任何學生都能用一臺 PC 或一張 GeForce 顯卡做出令人驚歎的科學。這個根本承諾從未改變,一點都沒有。如果你看 GTC,有很大一部分開頭都不是 AI,那部分——計算光刻,量子化學工作,數據處理工作——全都和 AI 無關,而且依然非常重要。
歡迎加入深潮 TechFlow 官方社群
Telegram 訂閱群:https://t.me/TechFlowDaily
Twitter 官方帳號:https://x.com/TechFlowPost
Twitter 英文帳號:https://x.com/BlockFlow_News













