
Anthropic 聯合 12 家巨頭髮起「玻璃翼」計劃,用未發佈的最強模型 Mythos 修補全球軟件漏洞
TechFlow Selected深潮精選

Anthropic 聯合 12 家巨頭髮起「玻璃翼」計劃,用未發佈的最強模型 Mythos 修補全球軟件漏洞
Project Glasswing 是讓防禦者在即將到來的 AI 驅動網絡安全時代建立持久優勢的重要一步。
作者: Anthropic
編譯: 深潮 TechFlow
深潮導讀: Anthropic 發佈了一個尚未公開的前沿模型 Claude Mythos Preview,其代碼審計能力已超過絕大多數人類安全專家,能自主發現存在數十年的零日漏洞。
基於這一能力,Anthropic 聯合 AWS、蘋果、谷歌、微軟、英偉達等 12 家科技巨頭髮起 Project Glasswing 計劃,投入 1 億美元信用額度,目標是在攻擊者獲得同等能力之前,先把全球關鍵軟件的漏洞堵上。
引言
今天我們宣佈 Project Glasswing(玻璃翼計劃),一項彙集亞馬遜雲科技(AWS)、Anthropic、蘋果、博通、思科、CrowdStrike、谷歌、摩根大通、Linux 基金會、微軟、英偉達和 Palo Alto Networks 的新倡議,目標是保護全球最關鍵的軟件安全。
我們發起 Project Glasswing,是因為 Anthropic 訓練的一個新前沿模型展現出了我們認為可能重塑網絡安全格局的能力。Claude Mythos Preview 是一個通用的、尚未發佈的前沿模型,它揭示了一個殘酷事實:AI 模型的編碼能力已經達到了這樣的水平——在發現和利用軟件漏洞方面,它們可以超越除最頂尖專家之外的所有人。
Mythos Preview 已經發現了數千個高危漏洞,涵蓋每一個主流操作系統和每一個主流瀏覽器。按照 AI 的進步速度,這種能力在不遠的將來就會擴散,可能落入不負責任的使用者手中。對經濟、公共安全和國家安全的衝擊可能非常嚴重。Project Glasswing 是一次緊迫的嘗試,要把這些能力優先用於防禦。
作為 Project Glasswing 的一部分,上述合作伙伴將在其防禦性安全工作中使用 Mythos Preview;Anthropic 會分享所學經驗,讓整個行業受益。我們還向另外 40 多個構建或維護關鍵軟件基礎設施的組織開放了訪問權限,讓它們可以掃描和加固自有系統及開源系統。Anthropic 為此承諾投入最高 1 億美元的 Mythos Preview 使用額度,以及 400 萬美元直接捐贈給開源安全組織。
Project Glasswing 只是一個起點。沒有哪家機構能獨自解決網絡安全問題:前沿 AI 開發者、其他軟件公司、安全研究人員、開源維護者以及全球各國政府都有不可替代的角色。防禦全球網絡基礎設施可能需要數年時間;而前沿 AI 能力在未來幾個月內就可能大幅躍進。網絡防禦者要想佔據先機,必須現在就行動。
AI 時代的網絡安全
我們每天依賴的軟件——運行銀行系統、存儲醫療記錄、連接物流網絡、維持電網運轉——一直都有 bug。大多數無關緊要,但有些是嚴重的安全缺陷,一旦被發現,攻擊者就能劫持系統、癱瘓運營或竊取數據。
網絡攻擊對企業網絡、醫療系統、能源基礎設施、交通樞紐以及各國政府機構的破壞性後果已經有目共睹。在全球層面,來自中國、伊朗、朝鮮和俄羅斯的國家級攻擊已經威脅到了支撐民用生活和軍事準備的基礎設施。即使是針對單個醫院或學校的小規模攻擊,也能造成巨大經濟損失、暴露敏感數據,甚至危及生命。全球網絡犯罪的年度經濟損失難以精確估算,但可能在 5000 億美元左右。
過去,很多軟件缺陷多年不被發現,因為找到並利用它們需要極少數安全專家才具備的專業知識。但隨著最新前沿 AI 模型的出現,發現和利用軟件漏洞所需的成本、精力和專業門檻都大幅降低了。過去一年,AI 模型在代碼閱讀和推理方面越來越強,尤其在發現漏洞和構造利用方式方面表現驚人。Claude Mythos Preview 在這些網絡安全技能上實現了跨越式提升——它發現的一些漏洞在人類審查了幾十年、經歷了數百萬次自動化安全測試後依然存活,而它開發的利用代碼也越來越精巧。
在首屆 DARPA 網絡大挑戰賽十年後,前沿 AI 模型正在接近甚至追平最頂尖人類的漏洞發現和利用能力。如果沒有必要的安全措施,這些強大的網絡能力可能被用來利用全球最重要軟件中現存的大量缺陷。網絡攻擊會變得更頻繁、更具破壞力,也會讓美國及其盟友的對手獲得力量。這是民主國家必須重視的安全優先級。
好消息是:讓 AI 模型在錯誤的手中變得危險的那些能力,同樣使它們在發現和修復重要軟件缺陷方面極具價值——也能幫助生產出安全 bug 更少的新軟件。Project Glasswing 是讓防禦者在即將到來的 AI 驅動網絡安全時代建立持久優勢的重要一步。
Claude Mythos Preview 發現漏洞和利用方式的能力
過去幾周,我們使用 Claude Mythos Preview 在每一個主流操作系統、每一個主流瀏覽器以及一系列其他重要軟件中,發現了數千個零日漏洞(即此前軟件開發者完全不知道的缺陷),其中許多是高危級別。
在 Frontier Red Team 博客上,我們披露了其中一部分已被修復的漏洞的技術細節,以及 Mythos Preview 找到的利用方式。幾乎所有這些漏洞的發現(以及許多相關利用方式的開發),都是模型完全自主完成的,沒有任何人類引導。以下是三個例子:
- Mythos Preview 在 OpenBSD 中發現了一個存在 27 年的漏洞。OpenBSD 以極高的安全加固水準聞名,被廣泛用於防火牆和其他關鍵基礎設施。該漏洞允許攻擊者僅通過連接目標機器就能遠程使其崩潰。
- 它還在 FFmpeg 中發現了一個 16 年的漏洞。FFmpeg 被無數軟件用於視頻編解碼。問題出在一行代碼上,而自動化測試工具已經命中這行代碼 500 萬次,卻從未發現問題。
- 該模型自主發現並串聯了 Linux 內核中的數個漏洞(Linux 內核運行著全球大部分服務器),實現了從普通用戶權限到完全控制機器的提權攻擊。
上述漏洞我們已全部報告給相關軟件維護者,且均已修復。對於其他許多漏洞,我們今天提供了細節的加密哈希(見 Red Team 博客),待修復完成後再公開具體信息。
CyberGym 等評估基準也驗證了 Mythos Preview 與我們次強模型 Claude Opus 4.6 之間的顯著差距:
網絡安全漏洞復現 - CyberGym

除了我們自己的工作,許多合作伙伴也已使用 Claude Mythos Preview 數週。以下是他們的反饋:
「AI 能力已經跨過了一個門檻,從根本上改變了保護關鍵基礎設施免受網絡威脅所需的緊迫程度,而且不可逆轉。我們用這些模型的基礎工作表明,可以以前所未有的速度和規模識別和修復硬件與軟件中的安全漏洞。這是一個深刻的轉變,也是一個清晰的信號:舊的系統加固方式已經不夠了。技術提供商必須立即積極採用新方法,客戶也需要做好部署準備。這就是思科加入 Project Glasswing 的原因——這項工作太重要、太緊迫,不能單打獨鬥。」
—— Anthony Grieco,思科高級副總裁兼首席安全與信任官
「在 AWS,我們在威脅出現之前就構建防禦,從定製芯片到整個技術棧。安全不是某個階段的事,它是持續的,嵌入我們所做的一切。我們的團隊每天分析超過 400 萬億次網絡流量以檢測威脅,AI 是我們大規模防禦能力的核心。我們一直在自己的安全運營中測試 Claude Mythos Preview,將其應用於關鍵代碼庫,它已經在幫助我們加固代碼。我們正在為與 Anthropic 的合作注入深厚的安全專業知識,並幫助強化 Claude Mythos Preview,讓更多組織能以最高安全標準推進工作。」
—— Amy Herzog,亞馬遜雲科技副總裁兼首席信息安全官
「當網絡安全不再受限於純人力能力時,負責任地使用 AI 來大規模提升安全性和降低風險的機會是史無前例的。加入 Project Glasswing 並獲得 Claude Mythos Preview 的訪問權限,使我們能夠儘早識別和緩解風險,增強我們的安全和開發解決方案,從而更好地保護客戶和微軟。在我們的開源安全基準 CTI-REALM 上測試時,Claude Mythos Preview 相比之前的模型表現出了實質性提升。我們期待與 Anthropic 及更廣泛的行業合作,為所有人改善安全成果。」
—— Igor Tsyganskiy,微軟網絡安全與微軟研究執行副總裁
「漏洞從被發現到被攻擊者利用的窗口期已經坍塌——過去需要幾個月的事,現在用 AI 幾分鐘就能完成。Claude Mythos Preview 展示了防禦者大規模行動的可能性,而對手將不可避免地尋求利用同樣的能力。這不是放慢腳步的理由,而是一起加速前進的理由。要部署 AI,就必須有安全保障。這就是 CrowdStrike 從第一天就參與其中的原因。」
—— Elia Zaitsev,CrowdStrike 首席技術官
「過去,安全專業知識是擁有龐大安全團隊的組織才能享有的奢侈品。開源軟件維護者——他們的軟件支撐著全球大部分關鍵基礎設施——歷來只能自己想辦法解決安全問題。開源軟件構成了現代系統中絕大部分代碼,包括 AI 智能體用來編寫新軟件的系統本身。通過讓這些關鍵開源代碼庫的維護者獲得新一代 AI 模型的訪問權限——能夠大規模主動識別和修復漏洞——Project Glasswing 提供了一條切實的路徑來改變這一局面。這是 AI 增強安全如何從大團隊的專屬工具變成每個維護者的可靠助手的方式。」
—— Jim Zemlin,Linux 基金會 CEO
「促進金融體系的網絡安全和韌性是摩根大通使命的核心,我們相信當領先機構就共同挑戰攜手合作時,行業是最強大的。Project Glasswing 提供了一個獨特的早期機會,讓我們可以按自己的標準評估下一代 AI 工具在關鍵基礎設施防禦性網絡安全中的能力,同時與受尊重的技術領袖並肩作戰。我們將採取嚴謹、獨立的方式來確定如何推進以及如何提供幫助。Anthropic 的倡議體現了這一時刻所需要的前瞻性、協作性方法。」
—— Pat Opet,摩根大通首席信息安全官
「谷歌很高興看到這一跨行業網絡安全倡議的形成,並通過 Vertex AI 向參與者提供 Mythos Preview。行業在新興安全問題上的協作一直至關重要,無論是後量子密碼學、負責任的零日漏洞披露、開源軟件安全,還是防禦基於 AI 的攻擊。我們一直相信 AI 在網絡防禦中既帶來新挑戰也帶來新機遇,這就是我們構建 Big Sleep 和 CodeMender 等 AI 驅動工具來發現和修復關鍵軟件缺陷的原因。我們將繼續投資於領先的網絡安全平臺和以保護用戶、客戶、生態系統及國家安全為核心的文化。」
—— Heather Adkins,谷歌安全工程副總裁
「過去幾周,我們一直在使用 Claude Mythos Preview 模型,用它來識別前一代模型完全遺漏的複雜漏洞。這不僅改變了發現隱藏漏洞的遊戲規則,也意味著攻擊者很快就能比以往更快地發現更多零日漏洞並開發利用代碼。很明顯,這些模型需要交到開源項目所有者和所有防禦者手中,在攻擊者獲得訪問權限之前發現並修復漏洞。也許更重要的是:每個人都需要為 AI 輔助的攻擊者做好準備。攻擊會更多、更快、更復雜。現在是全面升級網絡安全體系的時候了。我們讚賞 Anthropic 與行業合作,確保這些強大能力優先服務於防禦。」
—— Lee Klarich,Palo Alto Networks 首席產品與技術官
Claude Mythos Preview 強大的網絡安全能力,源於其卓越的智能體編碼和推理能力。以下評估結果顯示,該模型在多項軟件編碼任務上取得了所有已知模型中的最高分。
智能體編碼

推理

智能體搜索與計算機使用

註釋:
- SWE-bench Verified、Pro 和 Multilingual:記憶化篩查標記了部分題目。排除可能存在記憶化的題目後,Mythos Preview 相對 Opus 4.6 的優勢幅度不變。
- SWE-bench Multimodal:使用內部實現,分數與公開排行榜不可直接比較。
- Terminal-Bench 2.0:使用 Terminus-2 框架,自適應思考模式下最大努力,每個任務總預算 100 萬 token,1 倍保證 / 3 倍上限資源配置,每任務 5 次嘗試取平均。將超時限制提高到 4 小時並使用 Terminal-Bench 2.1 更新後,Mythos Preview 得分 92.1%。
- BrowseComp:Claude Mythos Preview 得分高於 Opus 4.6,同時 token 消耗量僅為後者的 1/4.9。
- Humanity's Last Exam:Mythos 在低努力模式下仍表現良好,可能存在一定程度的記憶化。
更多關於該模型能力、安全屬性和基本特徵的信息,請參閱 Claude Mythos Preview 系統卡。
我們不計劃將 Claude Mythos Preview 面向公眾開放,但最終目標是讓用戶能夠安全地大規模部署 Mythos 級別的模型——不僅用於網絡安全,也用於這類高能力模型將帶來的眾多其他價值。為此,我們需要在開發網絡安全(及其他)安全防護措施方面取得進展,能夠檢測和阻止模型最危險的輸出。我們計劃在即將推出的 Claude Opus 模型中發佈新的安全防護措施,使我們能夠用一個不具備 Mythos Preview 同等風險水平的模型來改進和完善這些措施。
Project Glasswing 的下一步計劃
今天的發佈是一項長期努力的開端。要成功,需要技術行業內外的廣泛參與。
Project Glasswing 合作伙伴將獲得 Claude Mythos Preview 的訪問權限,用於發現和修復其基礎系統中的漏洞和弱點——這些系統佔全球共享網絡攻擊面的很大比例。預計工作重點包括本地漏洞檢測、二進制黑盒測試、端點加固和系統滲透測試。
Anthropic 為 Project Glasswing 及其他參與者承諾的 1 億美元模型使用額度,將覆蓋研究預覽期間的大量使用。之後,Claude Mythos Preview 將以每百萬輸入 / 輸出 token 25 美元 / 125 美元的價格向參與者提供(參與者可通過 Claude API、Amazon Bedrock、Google Cloud Vertex AI 和 Microsoft Foundry 訪問該模型)。
除了模型使用額度,我們還通過 Linux 基金會向 Alpha-Omega 和 OpenSSF 捐贈了 250 萬美元,向 Apache 軟件基金會捐贈了 150 萬美元,幫助開源軟件維護者應對這一變化的格局(有興趣的維護者可以通過 Claude for Open Source 計劃申請訪問)。
我們打算讓這項工作在範圍上持續擴展,持續數月,並儘可能多地分享經驗,讓其他組織也能將這些經驗應用於自身安全。合作伙伴將在條件允許的範圍內互相分享信息和最佳實踐;90 天內,Anthropic 將公開報告我們的發現,以及可以披露的已修復漏洞和改進措施。我們還將與領先安全組織合作,制定一套關於 AI 時代安全實踐演進的實用建議,可能涵蓋:漏洞披露流程、軟件更新流程、開源和供應鏈安全、軟件開發生命週期與安全設計實踐、受監管行業標準、分診擴展與自動化、以及補丁自動化。
Anthropic 還一直在與美國政府官員討論 Claude Mythos Preview 的攻防網絡安全能力。保護關鍵基礎設施是民主國家的首要國家安全優先事項——這些網絡安全能力的出現,再次說明了美國及其盟友必須在 AI 技術上保持決定性領先。政府在幫助維持這一領先地位、評估和緩解 AI 模型相關國家安全風險方面有不可或缺的作用。我們願與各級政府代表合作協助完成這些任務。
我們希望 Project Glasswing 能催生一個覆蓋產業界和公共部門的更大規模努力,各方共同應對強大模型對安全影響的最大問題。我們邀請其他 AI 行業成員加入,幫助制定行業標準。從中期來看,一個獨立的第三方機構——能夠彙集私營和公共部門組織——可能是承載這些大規模網絡安全項目後續工作的理想平臺。
附註
- 該項目以玻璃翼蝶(Greta oto)命名。這個隱喻有兩層含義:蝴蝶透明的翅膀讓它能隱於無形,就像本文討論的那些藏在代碼中的漏洞;透明的翅膀也幫助它躲避傷害,如同我們倡導的透明方法。
- Mythos 一詞源自古希臘語,意為「敘事」或「故事」:文明用來理解世界的故事體系。
- 合法工作受到這些安全防護措施影響的安全專業人士,可以申請即將推出的網絡安全驗證計劃(Cyber Verification Program)。
歡迎加入深潮 TechFlow 官方社群
Telegram 訂閱群:https://t.me/TechFlowDaily
Twitter 官方帳號:https://x.com/TechFlowPost
Twitter 英文帳號:https://x.com/BlockFlow_News













