
Anthropic 的三重時刻:代碼洩露、政府對峙與武器化
TechFlow Selected深潮精選

Anthropic 的三重時刻:代碼洩露、政府對峙與武器化
這家以"安全"為賣點的公司,正把安全敘事變成商業護城河,而他們真正要搶的是微軟們手裡的用戶數據。
作者:Ben Thompson
編譯:深潮 TechFlow
深潮導讀:Anthropic 新模型 Fable 發佈僅兩月就被美國政府緊急叫停,表面是"安全洩露",實則暴露了 AI 實驗室與政府、與軟件業的雙重戰爭。這家以"安全"為賣點的公司,正把安全敘事變成商業護城河,而他們真正要搶的是微軟們手裡的用戶數據。
我理解那些嘲諷者的立場,他們總認為 Anthropic 的公開聲明——特別是發佈模型時的說辭——是為了營銷而散播恐慌。兩個月前 Anthropic 宣佈推出 Mythos Preview,聲稱這個模型太危險不能公開,特別是它強大的網絡安全能力。然後兩個月後,公司公開發布了 Fable,即加了各種安全護欄的 Mythos 版本。
就我有限的使用體驗而言,Fable 確實是個非常出色的模型。現在除了編程性能之外,已經很難客觀評估模型了,但主觀感受還是有的,我發現與 Fable 的互動體驗極其出色;它讓其他模型,包括 GPT 5.5 和 Opus 4.8,都顯得又小又蠢。我之前只有兩次這種感覺,一次是 GPT-4,一次是 Grok 4,這兩個都代表了基礎模型規模和複雜度的新一代;我覺得 Fable 源自一個新的預訓練,是新一代的第一個。
因此,我完全能接受 Fable/Mythos 在識別和利用安全問題方面確實更強,Anthropic 謹慎推出是有道理的。但公開發布模型的問題在於,護欄可以被越獄,顯然發佈後不久就發生了這種事。
Anthropic 再次對峙美國政府
接下來發生的事情有些不清楚。Anthropic 在博客文章中寫道:
美國政府援引國家安全權力,發佈出口管制指令,暫停所有外國公民對 Fable 5 和 Mythos 5 的訪問,無論在美國境內還是境外,包括 Anthropic 的外籍員工。這份命令的實際效果是,我們必須突然對所有客戶禁用 Fable 5 和 Mythos 5 以確保合規。所有其他 Anthropic 模型的訪問不受影響。
我們今天美東時間下午 5:21 收到了政府的指令。信中沒有提供國家安全擔憂的具體細節。我們理解政府認為已經發現了繞過或"越獄"Fable 5 的方法。我們審查了使用這種特定技術識別少量已知小漏洞的演示。這些漏洞看起來都相對簡單,我們發現其他公開可用的模型也能夠發現它們而不需要繞過。
Anthropic 接著論證非通用越獄是不可避免且範圍有限的,沒有證據表明存在通用越獄;而被發現的越獄似乎是亞馬遜報告的,這值得注意,因為亞馬遜既是 Anthropic 的投資者,也是公司推理服務的主要提供商。在我寫這篇文章時,Anthropic 的高管正在華盛頓特區,試圖解決他們堅稱是誤解、而白宮官員暗示是公司領導層對合法國家安全擔憂漠不關心的問題。
鑑於有太多事實存在爭議,我對當前衝突其實沒什麼可補充的;但我對沖突正在發生並不感到意外:我已經在《Anthropic 與對齊》一文中解釋過,美國政府與 Anthropic 之間的衝突是不可避免的。就此而言,那些認為 Mythos 還不夠強大到值得政府採取激烈行動的人錯過了重點:如果現在還不夠強大,下一個會是,或者再下一個,特別是現在模型在創建後繼者方面越來越有用。
然而,這引出了另一個問題——一個似乎證實嘲諷者觀點的問題:如果 Mythos 如此危險,為什麼一開始要發佈 Fable,為什麼要和政府對著幹做你聲稱想要的事?事實上,我認為 Anthropic 的行為是完全可以理解的;公司的獨特之處在於它如何為這些行為辯護,正是這些辯護既給了嘲諷者燃料,也給了 Anthropic 魔力。
經濟必然性
在 AI 的頭幾年,最多的經濟價值流向了算力,原因顯而易見:我們沒有足夠的供應滿足需求,這意味著價格飆升;最大的受益者是英偉達、臺積電和內存製造商(海力士、三星和美光)。與此同時,Anthropic 和 OpenAI 合計虧損了數百億美元來構建前沿模型,而這些模型一旦發佈,就被開源模型蒸餾和商品化,主要來自中國。
這代表了實驗室的悲觀情況——它們永遠無法覆蓋成本,因為它們的差異化是短暫的,而免費替代品變得"足夠好"——我認為這是合理的。在一個模型可互換的世界裡,模型就是商品,而大部分價值流向其他地方。現在是算力,但隨著時間推移,當我們有足夠算力時,價值鏈中最有價值的位置將是一直以來最有價值的地方:擁有用戶觸點。
因此,前沿實驗室有經濟必然性要更接近用戶,這對我來說一直很清楚。如果你擁有用戶觸點,那麼你就有有意義的鎖定,而擁有用戶觸點的最佳方式是成為他們需要做的一切的畫布。這進而意味著前沿實驗室正與軟件公司走向衝突:是軟件擁有用戶觸點,而前沿實驗室的長期利益不是簡單地成為軟件的商品輸入,而是直接取代軟件。
與此同時,軟件公司正在努力做相反的事。薩提亞·納德拉在 X 上的一篇文章中闡述了他對公司應如何在模型上構建的願景:
每家公司都必須建立我所說的人力資本和 token 資本。人力資本包括其員工的知識、判斷力、關係、獨創性和模式識別,而 token 資本是公司構建和擁有的 AI 能力。重要的是,隨著 token 資本的增長,人力資本不會變得不那麼有價值。它只會變得更有價值!我相信人類主動性將是 token 資本增長的驅動力。人類將設定雄心勃勃的目標,跨領域連接點,建立關係,並識別最重要的模式。沒有人類指導,你的算力就在空轉。
這意味著真正的機會不在於選擇最好的模型,而在於在模型之上構建學習循環,讓人力資本和 token 資本複利增長。你可以外包一項任務,甚至一份工作,但你永遠不能外包你的學習。公司的未來是能夠讓這種學習在人和 AI 之間複利增長。這需要一種新的架構方法,讓每家企業都能夠構建隨時間改進的智能體系統,同時仍保留對其知識產權的控制。公司應該能夠更換"通用"模型,而不會失去內置到其學習系統中的"公司老兵"專業知識。這是未來時代你控制權和主權的關鍵"測試"。
納德拉以警告開啟了這一願景:
我們都不希望看到的是一個每個行業的每家公司都將價值讓給少數幾個吞噬一切的模型的世界。如果所有價值都只被少數幾個模型獲取,政治經濟根本不會容忍它。對於一個掏空整個行業的 AI 未來,社會不會給予許可。
想想全球化第一階段發生了什麼,整個工業經濟體被外包掏空。表面上 GDP 數字看起來不錯,但流離失所是真實的,後果至今仍在感受。讓我們不要把這種動態帶入 AI 時代,讓少數 AI 系統捕獲所有經濟回報,而整個行業發現他們的知識就在他們眼皮底下被商品化了。
這個類比的問題在於:全球化確實發生了,工業經濟體確實被掏空了。這有可能不是警告而是預言;難怪納德拉在拉響警報,因為微軟可能是受害者之一。同樣,模型製造商的經濟必然性正是要實現這一點。
數據必然性
這些模型——甚至 Mythos——還沒有到那一步。它們需要的,除了更多算力,還有更多更好的數據。模型改進越來越多地來自強化學習;其中一些可以合成生成,但對前沿實驗室來說最強大的槓桿是真實世界的使用。
我認為這是 OpenAI 和 Anthropic 都提供大幅補貼訂閱計劃的主要原因。SemiAnalysis 最近估計,200 美元的計劃能讓你獲得價值 8000 美元的 Claude token 和 14000 美元的 Codex token。當然兩者都在爭奪用戶和開發者心智份額,但他們也在爭奪實際使用數據的訪問權以改進模型。
Anthropic 在 Fable 上大幅加碼,宣佈他們將保留所有使用的數據 30 天,即使對於之前承諾零數據保留的企業計劃也是如此。公司表示不會用這些數據訓練,但他們沒有設置任何保障措施來保證未來不會這樣做(比如將數據存儲在第三方)。如果這項政策變化(當 Fable 恢復時)沒有導致大量客戶流失,我懷疑他們開始使用數據只是時間問題:對他們的最終目標來說,這太有價值了。
還要注意與向上移動到用戶觸點的良性循環:直接用 Claude 或 Codex 完成的工作流越多,每家公司獲得的可以反饋到訓練中的數據就越多,這使他們的產品更強大更有用,擴大了他們可以服務的工作流數量,擴大了他們對數據的訪問。
納德拉在文章中強調了這些數據的重要性,但自然認為它應該獨立於模型:
公司需要將工作流、領域知識和積累的判斷轉化為隨每次使用而改進的 AI 系統。私有評估應該捕捉模型是否真正在對業務重要的結果上改進(不僅僅是外部基準!). 私有強化學習環境應該讓模型在組織內部的真實軌跡上變得更強。其知識庫使機構記憶可查詢,token 使用更高效。
這個循環成為公司的新知識產權。我把它看作爬山機器。與大多數資產不同,它是複利的。每個改進的工作流都會生成更好的訓練信號,這加速了公司獨有的隱性知識的積累。早期構建這一點的公司將擁有難以複製的優勢,無論任何新的單個模型能力如何。
這個循環成為公司的新 IP。我把它看作一臺爬山機器。與大多數資產不同,它能複利增長。每一個改進的工作流程都會產生更好的訓練信號,加速公司獨有的隱性知識積累。早期建立這一能力的公司將擁有難以複製的優勢,無論未來單個模型的能力如何提升。
然而,如果那些服從 Anthropic 數據政策的公司現在就能獲得更好的結果呢?或者如果現有公司抵制,為新公司——或者模型製造商自己——留下了在市場上擊敗它們的機會呢?Anthropic 確實在考驗 Nadella 所呼籲的決心。
權力訴求
圍繞 Fable/Mythos 的數據保留政策,竟然還不是發佈中最具爭議的部分。相反,Anthropic 在發佈時表示,如果 Fable 被用於 LLM 開發,將悄悄降低其性能;系統卡片中寫道:
我們還增加了與前沿 LLM 開發相關的防護措施。正如我們 2026 年 2 月風險報告第 6.1 節所討論的,我們擔心加速整體 AI 發展步伐的風險,儘管我們對這些風險的嚴重程度仍不確定。特別是,我們的擔憂在於——正如我們當時所寫——"加速其他 AI 開發者構建與我們的系統具有類似風險的強大 AI 系統——而未必具有相應的防護措施。"
鑑於最近模型具備加速自身開發的能力,我們實施了新的干預措施,限制 Claude 在針對前沿 LLM 開發請求(例如構建預訓練管線、分佈式訓練基礎設施或 ML 加速器設計)時的有效性。使用 Claude 開發競爭模型本已違反我們的服務條款,但通過防護措施強制執行這一限制,可以避免加速那些最願意違反這些條款的行為者。
與我們在網絡安全、生物化學和蒸餾嘗試方面的干預不同,這些防護措施對用戶不可見。Fable 5 不會回退到另一個模型。相反,防護措施將通過提示詞修改、引導向量或參數高效微調(PEFT)等方法限制有效性。這些干預不會影響絕大多數編程工作。我們估計它們將影響約 0.03%的流量,集中在不到 0.1%的組織中。當這些干預生效時,我們預計除了限制其開發前沿 LLM 的有效性外,它們對模型行為的影響微乎其微。Claude 仍會對用戶請求做出有幫助的回應。我們將在這個模型發佈後繼續提高檢測方法的精確度。
Anthropic 撤回了這一變更——Fable 將把 LLM 相關請求移交給 Opus 4.8,並向用戶披露這種移交——但我認為最初的政策非常具有啟發性。一方面,我其實不怪 Anthropic 不想幫助競爭對手;另一方面,應該非常清楚的是,Anthropic 認為除了他們之外,任何人都不應該製造前沿 LLM。
這一政策更加引人注目的是,它是在 Anthropic 與戰爭部發生爭執僅兩個月後頒佈的:後者希望將 Claude 用於任何合法用途,而前者希望對監控和自主武器實施更嚴格的控制。這種降級措施既代表了 Anthropic 悄悄改變其模型以實現其政策偏好的能力,也代表了其意願。換句話說,Anthropic 主動驗證了一些批評者關於其作為供應鏈風險的最大擔憂。
然而,從那次事件中得出的更廣泛結論是,Anthropic 認為他們應該對 Anthropic 的使用方式擁有最終決定權;鑑於他們認為只有他們應該開發前沿 AI,那麼他們實際上認為只有他們應該對 AI 總體擁有最終決定權。當你進一步將這一認識與該公司關於 AI 能夠進行所有經濟活動的聲明結合起來,你會意識到 Anthropic 的領導層實際上想要對一切和所有人擁有權力。
安全敘事
當然,Anthropic 永遠不會如此直白地表述;相反,故事是關於安全的:
我預計 Anthropic 將越來越多地通過越來越針對不同工作流程定製的端點向終端用戶公開其模型能力,即使他們開始限制 API。這種對軟件的替代和對訪問的限制將以安全的名義進行,即使 Anthropic 在履行其接近終端用戶的經濟訴求。
Anthropic 對其數據保留政策的重大變更的解釋是安全。具體來說,該公司聲稱保留所有用戶數據 30 天對於防止美國政府擔心的越獄行為是必要的。我當然可以想象一個未來,安全因素迫使他們也對這些數據進行訓練,以更好地防範惡意使用。
整個 Anthropic 的起源故事植根於創始人的信念,即 OpenAI 沒有足夠認真地對待安全;該公司認為只有他們能夠控制 AI,並且因為他們獨特地關心安全,所以他們有理由試圖控制其他所有人,包括美國政府。
關於這些安全理由,問題在於:我認為它們有效,是因為對 Anthropic 來說,它們不是理由。該公司真的相信他們是唯一相信超級智能的人,因此是唯一充分關注危險的人。這為一個又一個決策、一個又一個政策、一次又一次的對抗開脫,而對外界人士來說,這些看起來像是犬儒主義和天真的奇怪組合。
與 OpenAI 的對比巨大:我認為理解 OpenAI 如何以及為何失去領先地位的一種方式是,在 ChatGPT 發佈後的幾年裡,該公司在內部處於交戰狀態,曾經的研究實驗室突然被賦予成為意外的消費科技公司的重擔;在 OpenAI 解決這一衝突的過程中,它向 Anthropic 等公司流失了大量人才。
另一方面,Anthropic 在人才、使命和業務之間擁有完美的一致性。該公司可以向研究人員推銷創造機器神的願景,帶著關心危險並且足夠聰明代表人類應對危險的那種人的光環;而每一個由此產生的政策變更恰好對業務有利,這是世界上最美妙的巧合。
我既尊重這種一致性,也畏懼它。我尊重它是因為它顯然非常有效;最接近的類比可能是蘋果,該公司總是以為用戶做正確的事為幌子包裝每一個自私的行動——而且他們往往確實如此。Anthropic 也是如此。然而,我畏懼的是,讓那些確信自己最懂的人去構建一部我可以接受或拒絕的智能手機是一回事;讓他們構建有潛力匹敵或超越民族國家權力,或僅僅是大型企業的超級智能則令人擔憂得多。那些確信自己知道人類需要什麼的聰明人的歷史是骯髒的,正是因為他們說服了自己意圖是好的,為那些實際上並非如此的行動提供了理由。
歡迎加入深潮 TechFlow 官方社群
Telegram 訂閱群:https://t.me/TechFlowDaily
Twitter 官方帳號:https://x.com/TechFlowPost
Twitter 英文帳號:https://x.com/BlockFlow_News













