
AI 的下一場地震:為什麼真正的危險不是 SaaS 殺手,而是算力革命?
TechFlow Selected深潮精選

AI 的下一場地震:為什麼真正的危險不是 SaaS 殺手,而是算力革命?
這場革命,可能讓 AI 的賣鏟人精心舉辦的這場盛大派對,比所有人想象的都更早結束。
撰文:Bruce
最近,整個科技圈和投資界都緊盯著同一件事:AI 應用正在如何「殺死」傳統的 SaaS。自從 @AnthropicAI 的 Claude Cowork 展示了它能如何輕鬆地幫你寫郵件、做 PPT、分析 Excel 表格後,一場關於「軟件已死」的恐慌就開始蔓延。這確實很嚇人,但如果你的目光只停留在這裡,那你可能錯過了真正的大地震。
這就像我們所有人都抬頭看著天上的無人機空戰,卻沒人注意到,我們腳下的整片大陸板塊正在悄然移動。真正的風暴,藏在水面之下,一個大多數人看不見的角落:支撐整個 AI 世界的算力根基,正在發生一場「寂靜的革命」。
而這場革命,可能讓 AI 的賣鏟人:英偉達 @nvidia,精心舉辦的這場盛大派對,比所有人想象的都更早結束。
兩條正在交匯的革命之路
這場革命並非單一事件,而是由兩條看似獨立的技術路線交織而成。它們像兩支正在合圍的軍隊,對英偉達的 GPU 霸權形成了鉗形攻勢。
第一條路,是算法的瘦身革命。
你有沒有想過,一個超級大腦在思考問題時,真的需要調動所有腦細胞嗎?顯然不需要。DeepSeek 就想明白了這件事,他們搞出 MoE(混合專家模型)的架構。
你可以把它想象成一個公司,裡面養了幾百個不同領域的專家。但每次開會解決問題時,你只需要請最相關的兩三個人,而不是讓所有人一起頭腦風暴。這就是 MoE 的聰明之處:它讓一個龐大的模型,在每次計算時只激活一小部分「專家」,從而極大地節省了算力。
結果會如何呢?DeepSeek-V2 模型,名義上有 2360 億「專家」(參數),但每次幹活,只需要激活其中的 210 億,連總數的 9% 都不到。而它的表現,卻能和那個需要 100% 全力運轉的 GPT-4 相媲美。這意味著什麼?AI 的能力,和它消耗的算力,脫鉤了!
過去,我們都默認 AI 越強,燒的卡越多。現在,DeepSeek 告訴我們,通過聰明的算法,可以用十分之一的成本,達到同樣的效果。這就等於直接把英偉達 GPU 的剛需屬性,打上了一個巨大的問號。
第二條路,是硬件的「換道」革命。
AI 幹活分為訓練和推理兩個階段。訓練就像上學,需要讀萬卷書,這時候 GPU 這種「大力出奇跡」的並行計算卡確實好用。但推理就像我們日常使用 AI,更看重反應速度。
GPU 在推理時有個天生缺陷:它的內存(HBM)是外掛的,數據一來一回有延遲。這就像一個廚師,食材都放在隔壁房間的冰箱裡,每次炒菜都得跑過去拿,再快也快不到哪去。而 Cerebras、Groq 這些公司就另起爐灶,設計了專用的推理芯片,把內存(SRAM)直接焊在芯片上,食材就放在手邊,實現了「零延遲」訪問。
市場已經用真金白銀投票了。OpenAI 一邊抱怨英偉達的 GPU 推理不行,一邊扭頭就和 Cerebras 簽了個 100 億美元的大單,專門租用他們的推理服務。英偉達自己也慌了,反手就花了 200 億美元把 Groq 給收了,為的就是不在這條新賽道上掉隊。
當兩條路交匯:成本雪崩
好了,現在我們把這兩件事放在一起:用一個算法上「瘦過身」的 DeepSeek 模型,跑在一個硬件上「零延遲」的 Cerebras 芯片上。
會發生什麼?
一場成本的雪崩。
首先,瘦身後的模型很小,可以一次性全部裝進芯片自帶的內存裡。其次,沒有了外部內存的瓶頸,AI 的反應速度會快得驚人。最終的結果是:訓練成本因 MoE 架構下降了 90%,推理成本因專用硬件和稀疏計算再下降一個數量級。算下來,擁有和運行一個世界級 AI 的總成本,可能只有傳統 GPU 方案的 10%-15%。
這不是改良,這是範式轉移。
英偉達的王座,正在被悄悄抽掉地毯
現在你應該明白,為什麼這比「Cowork 恐慌」更致命了。
英偉達今天幾萬億的市值,建立在一個簡單的故事上:AI 是未來,而 AI 的未來必須靠我的 GPU。但現在,這個故事的根基正在被動搖。
在訓練市場,就算英偉達繼續壟斷,但如果客戶用十分之一的卡就能幹活,那這個市場的總體規模也可能大幅縮水。
在推理市場,這個比訓練大十倍的蛋糕上,英偉達不僅沒有絕對優勢,還面臨著 Google、Cerebras 等各路神仙的圍剿。連它最大的客戶 OpenAI 都在叛逃。
一旦華爾街意識到,英偉達的「鏟子」不再是唯一的、甚至是最好的選擇時,建立在「永久壟斷」預期上的估值,會發生什麼?我想大家都很清楚。
所以,未來半年最大的黑天鵝,可能不是哪個 AI 應用又幹掉了誰,而是一則看似不起眼的技術新聞:比如一篇關於 MoE 算法效率的新論文,或者一份顯示專用推理芯片市場份額大增的報告,悄悄宣告了算力戰爭進入新階段。
當「賣鏟人」的鏟子不再是唯一選擇時,屬於他的黃金時代,可能也就結束了。
歡迎加入深潮 TechFlow 官方社群
Telegram 訂閱群:https://t.me/TechFlowDaily
Twitter 官方帳號:https://x.com/TechFlowPost
Twitter 英文帳號:https://x.com/BlockFlow_News













