Anthropic hợp tác cùng 12 tập đoàn lớn khởi xướng sáng kiến “Cánh Bướm Kính”, sử dụng mô hình mạnh nhất chưa được công bố—Mythos—để vá các lỗ hổng phần mềm trên toàn cầu

2026.04.08

Chia sẻ đến

Tuyển chọn TechFlowTuyển chọn TechFlow

Anthropic hợp tác cùng 12 tập đoàn lớn khởi xướng sáng kiến “Cánh Bướm Kính”, sử dụng mô hình mạnh nhất chưa được công bố—Mythos—để vá các lỗ hổng phần mềm trên toàn cầu

Dự án Glasswing là một bước đi quan trọng giúp các bên phòng thủ thiết lập lợi thế bền vững trong kỷ nguyên an ninh mạng sắp tới, được thúc đẩy bởi trí tuệ nhân tạo.

2026.04.08 - 08:41:19

AnthropicAI

Chuyên sâu báo cáo Web3

Tác giả: Anthropic

Biên dịch: TechFlow

Giới thiệu từ TechFlow: Anthropic vừa công bố một mô hình tiên tiến chưa được công khai mang tên Claude Mythos Preview, khả năng kiểm tra mã của nó đã vượt trội hơn phần lớn các chuyên gia an ninh con người, có thể tự chủ phát hiện các lỗ hổng zero-day tồn tại hàng chục năm.

Dựa trên khả năng này, Anthropic đã cùng với AWS, Apple, Google, Microsoft, NVIDIA và 7 công ty công nghệ hàng đầu khác khởi xướng Dự án Glasswing (Dự án Cánh Kính), với cam kết cấp hạn mức tín dụng trị giá 100 triệu USD nhằm vá trước các lỗ hổng trong phần mềm then chốt toàn cầu — trước khi các đối tượng tấn công cũng đạt được khả năng tương đương.

Lời mở đầu

Hôm nay, chúng tôi chính thức công bố Dự án Glasswing (Dự án Cánh Kính), một sáng kiến mới tập hợp Amazon Web Services (AWS), Anthropic, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, Quỹ Linux, Microsoft, NVIDIA và Palo Alto Networks, nhằm bảo vệ an ninh phần mềm quan trọng nhất trên toàn thế giới.

Chúng tôi khởi xướng Dự án Glasswing vì một mô hình tiên tiến mới do Anthropic huấn luyện đã thể hiện khả năng mà chúng tôi cho rằng có thể làm thay đổi cục diện an ninh mạng. Claude Mythos Preview là một mô hình tiên tiến tổng quát, chưa được công bố, tiết lộ một thực tế nghiệt ngã: năng lực lập trình của mô hình AI đã đạt tới mức độ — trong việc phát hiện và khai thác lỗ hổng phần mềm — vượt qua tất cả mọi người ngoại trừ những chuyên gia hàng đầu nhất.

Mythos Preview đã phát hiện hàng nghìn lỗ hổng nghiêm trọng, bao phủ mọi hệ điều hành phổ biến và mọi trình duyệt phổ biến. Với tốc độ tiến bộ của AI, khả năng này sẽ sớm lan rộng và có thể rơi vào tay những người sử dụng thiếu trách nhiệm. Hậu quả đối với kinh tế, an ninh công cộng và an ninh quốc gia có thể rất nghiêm trọng. Dự án Glasswing là một nỗ lực cấp thiết nhằm ưu tiên ứng dụng những khả năng này vào mục đích phòng thủ.

Trong khuôn khổ Dự án Glasswing, các đối tác nêu trên sẽ sử dụng Mythos Preview trong các hoạt động an ninh phòng thủ của mình; Anthropic sẽ chia sẻ những bài học kinh nghiệm thu được để toàn ngành cùng hưởng lợi. Chúng tôi cũng mở quyền truy cập cho hơn 40 tổ chức khác đang xây dựng hoặc duy trì cơ sở hạ tầng phần mềm then chốt, giúp họ quét và tăng cường bảo mật cho hệ thống riêng cũng như các hệ thống nguồn mở. Anthropic cam kết dành tối đa 100 triệu USD hạn mức sử dụng Mythos Preview, đồng thời tài trợ trực tiếp 4 triệu USD cho các tổ chức an ninh nguồn mở.

Dự án Glasswing chỉ là điểm khởi đầu. Không tổ chức nào có thể đơn phương giải quyết vấn đề an ninh mạng: các nhà phát triển AI tiên tiến, các công ty phần mềm khác, các nhà nghiên cứu an ninh, các nhà bảo trì nguồn mở cũng như chính phủ các quốc gia đều đóng vai trò không thể thay thế. Việc bảo vệ cơ sở hạ tầng mạng toàn cầu có thể mất nhiều năm; trong khi đó, khả năng AI tiên tiến có thể tiến bộ vượt bậc chỉ trong vài tháng tới. Để giành lợi thế, các bên phòng thủ mạng buộc phải hành động ngay từ bây giờ.

An ninh mạng trong kỷ nguyên AI

Phần mềm mà chúng ta phụ thuộc mỗi ngày — vận hành hệ thống ngân hàng, lưu trữ hồ sơ y tế, kết nối mạng logistics, duy trì hoạt động lưới điện — luôn chứa các lỗi (bug). Phần lớn vô hại, nhưng một số lại là các lỗ hổng an ninh nghiêm trọng; một khi bị phát hiện, tin tặc có thể chiếm quyền kiểm soát hệ thống, làm tê liệt hoạt động hoặc đánh cắp dữ liệu.

Hậu quả phá hoại của các cuộc tấn công mạng đối với mạng doanh nghiệp, hệ thống y tế, cơ sở hạ tầng năng lượng, trung tâm giao thông và các cơ quan chính phủ các quốc gia đã rõ ràng. Trên bình diện toàn cầu, các cuộc tấn công có nguồn gốc từ Trung Quốc, Iran, Triều Tiên và Nga đang đe dọa cơ sở hạ tầng nền tảng cho đời sống dân sự và chuẩn bị quân sự. Ngay cả những cuộc tấn công quy mô nhỏ nhắm vào một bệnh viện hay trường học cũng có thể gây tổn thất kinh tế nặng nề, phơi bày dữ liệu nhạy cảm, thậm chí đe dọa tính mạng. Tổn thất kinh tế toàn cầu do tội phạm mạng gây ra mỗi năm khó ước tính chính xác, nhưng có thể đạt khoảng 500 tỷ USD.

Trước đây, nhiều lỗi phần mềm tồn tại nhiều năm mà không bị phát hiện, bởi việc tìm ra và khai thác chúng đòi hỏi kiến thức chuyên môn chỉ một số ít chuyên gia an ninh mới có. Tuy nhiên, với sự xuất hiện của các mô hình AI tiên tiến nhất hiện nay, chi phí, công sức và rào cản chuyên môn cần thiết để phát hiện và khai thác lỗ hổng phần mềm đã giảm mạnh. Trong năm qua, các mô hình AI ngày càng mạnh hơn trong việc đọc và suy luận mã, đặc biệt nổi bật ở khả năng phát hiện lỗ hổng và xây dựng kịch bản khai thác. Claude Mythos Preview đã đạt bước tiến vượt bậc về các kỹ năng an ninh mạng này — một số lỗ hổng do nó phát hiện đã tồn tại suốt vài chục năm dưới sự rà soát của con người và hàng triệu lần kiểm thử an ninh tự động, còn mã khai thác do nó phát triển ngày càng tinh vi.

Mười năm sau cuộc thi Cyber Grand Challenge đầu tiên do DARPA tổ chức, các mô hình AI tiên tiến hiện đang tiến gần đến hoặc bắt kịp năng lực phát hiện và khai thác lỗ hổng của những con người xuất sắc nhất. Nếu thiếu các biện pháp an toàn cần thiết, những năng lực mạng mạnh mẽ này có thể bị sử dụng để khai thác số lượng lớn lỗ hổng hiện hữu trong phần mềm quan trọng nhất toàn cầu. Các cuộc tấn công mạng sẽ trở nên thường xuyên hơn, tàn phá hơn, và cũng làm gia tăng sức mạnh cho các đối thủ của Hoa Kỳ và các đồng minh. Đây là ưu tiên an ninh mà các quốc gia dân chủ buộc phải coi trọng.

Tin tốt là: những khả năng khiến mô hình AI trở nên nguy hiểm nếu rơi vào tay sai trái, cũng chính là những khả năng khiến chúng cực kỳ giá trị trong việc phát hiện và sửa chữa các lỗi phần mềm quan trọng — đồng thời hỗ trợ sản xuất phần mềm mới với ít lỗi an ninh hơn. Dự án Glasswing là một bước quan trọng nhằm giúp các bên phòng thủ thiết lập lợi thế bền vững trong kỷ nguyên an ninh mạng do AI thúc đẩy sắp tới.

Năng lực phát hiện lỗ hổng và xây dựng kịch bản khai thác của Claude Mythos Preview

Trong vài tuần qua, chúng tôi đã sử dụng Claude Mythos Preview để phát hiện hàng nghìn lỗ hổng zero-day (tức là các lỗi hoàn toàn chưa được nhà phát triển phần mềm biết đến) trên mọi hệ điều hành phổ biến, mọi trình duyệt phổ biến và một loạt phần mềm quan trọng khác, trong đó nhiều lỗ hổng ở mức độ nghiêm trọng cao.

Trên blog Đội Đỏ Tiền Phong (Frontier Red Team), chúng tôi đã tiết lộ chi tiết kỹ thuật của một số lỗ hổng đã được sửa chữa, cũng như các kịch bản khai thác do Mythos Preview tìm ra. Gần như tất cả các lỗ hổng này (và nhiều kịch bản khai thác liên quan) đều được mô hình phát hiện và phát triển hoàn toàn tự chủ, không cần bất kỳ sự hướng dẫn nào từ con người. Dưới đây là ba ví dụ:

Mythos Preview phát hiện một lỗ hổng tồn tại 27 năm trong OpenBSD. OpenBSD nổi tiếng với mức độ tăng cường an ninh cực cao và được sử dụng rộng rãi trong tường lửa và các cơ sở hạ tầng then chốt khác. Lỗ hổng này cho phép tin tặc làm sập máy mục tiêu từ xa chỉ bằng cách kết nối tới máy đó.
Nó cũng phát hiện một lỗ hổng tồn tại 16 năm trong FFmpeg — thư viện được hàng ngàn phần mềm sử dụng để mã hóa/giải mã video. Vấn đề nằm ở một dòng mã, trong khi các công cụ kiểm thử tự động đã “chạm” vào dòng này tới 5 triệu lần mà vẫn không phát hiện ra.
Mô hình tự chủ phát hiện và kết hợp nhiều lỗ hổng trong nhân Linux (Linux kernel — nền tảng vận hành phần lớn máy chủ toàn cầu), thực hiện thành công cuộc tấn công leo quyền (privilege escalation) từ tài khoản người dùng thông thường lên toàn quyền kiểm soát máy.

Tất cả các lỗ hổng nêu trên đã được chúng tôi báo cáo cho các nhóm bảo trì phần mềm liên quan và đều đã được sửa chữa. Đối với nhiều lỗ hổng khác, hôm nay chúng tôi cung cấp các hàm băm mã hóa chi tiết (xem trên blog Đội Đỏ), để công bố thông tin cụ thể sau khi việc sửa chữa hoàn tất.

Các bộ tiêu chuẩn đánh giá như CyberGym cũng xác nhận khoảng cách đáng kể giữa Mythos Preview và mô hình mạnh thứ hai của chúng tôi — Claude Opus 4.6:

Phục hiện lỗ hổng an ninh mạng – CyberGym

Bên cạnh công việc nội bộ, nhiều đối tác cũng đã sử dụng Claude Mythos Preview trong vài tuần qua. Dưới đây là phản hồi từ họ:

«Năng lực AI đã vượt qua một ngưỡng quan trọng, làm thay đổi căn bản mức độ cấp thiết — và không thể đảo ngược — trong việc bảo vệ cơ sở hạ tầng then chốt khỏi các mối đe dọa mạng. Công việc nền tảng của chúng tôi với các mô hình này cho thấy khả năng xác định và sửa chữa các lỗ hổng an ninh trong phần cứng và phần mềm với tốc độ và quy mô chưa từng có. Đây là một bước chuyển đổi sâu sắc, đồng thời cũng là tín hiệu rõ ràng: các phương pháp tăng cường hệ thống truyền thống giờ đây đã không còn đủ. Các nhà cung cấp công nghệ phải ngay lập tức chủ động áp dụng các phương pháp mới, còn khách hàng cũng cần sẵn sàng triển khai. Đó chính là lý do vì sao Cisco tham gia Dự án Glasswing — công việc này quá quan trọng và cấp thiết để có thể hành động một mình.»

— Anthony Grieco, Phó Chủ tịch Cấp cao kiêm Giám đốc An ninh và Uy tín Chính của Cisco

«Tại AWS, chúng tôi xây dựng các lớp phòng thủ trước khi mối đe dọa xuất hiện — từ chip tùy chỉnh cho đến toàn bộ ngăn xếp công nghệ. An ninh không phải là một giai đoạn riêng biệt, mà là một quá trình liên tục, được tích hợp sâu vào mọi việc chúng tôi làm. Đội ngũ của chúng tôi phân tích hơn 400 nghìn tỷ yêu cầu lưu lượng mạng mỗi ngày để phát hiện mối đe dọa, và AI là lõi cốt yếu của năng lực phòng thủ quy mô lớn. Chúng tôi đã thử nghiệm Claude Mythos Preview trong các hoạt động an ninh vận hành của mình, áp dụng lên các kho mã then chốt, và mô hình này đang giúp chúng tôi tăng cường bảo mật mã nguồn. Chúng tôi đang đầu tư chuyên môn an ninh sâu rộng của mình vào hợp tác với Anthropic, đồng thời hỗ trợ cải thiện Claude Mythos Preview để nhiều tổ chức hơn có thể triển khai công việc theo các tiêu chuẩn an ninh cao nhất.»

— Amy Herzog, Phó Chủ tịch kiêm Giám đốc Thông tin An ninh Chính của Amazon Web Services

«Khi an ninh mạng không còn bị giới hạn bởi năng lực thuần túy của con người, thì cơ hội sử dụng AI một cách có trách nhiệm để nâng cao an ninh và giảm thiểu rủi ro ở quy mô lớn là chưa từng có. Việc tham gia Dự án Glasswing và được truy cập Claude Mythos Preview giúp chúng tôi sớm xác định và giảm nhẹ rủi ro, đồng thời tăng cường các giải pháp an ninh và phát triển của mình nhằm bảo vệ khách hàng và Microsoft tốt hơn. Khi được kiểm thử trên bộ tiêu chuẩn an ninh nguồn mở CTI-REALM của chúng tôi, Claude Mythos Preview thể hiện sự cải thiện đáng kể so với các mô hình trước đây. Chúng tôi mong đợi được hợp tác với Anthropic và toàn ngành để cải thiện kết quả an ninh cho tất cả mọi người.»

— Igor Tsyganskiy, Phó Chủ tịch Điều hành về An ninh Mạng và Nghiên cứu Microsoft

«Khoảng thời gian từ khi một lỗ hổng được phát hiện cho đến khi bị tin tặc khai thác đã sụp đổ — điều từng mất hàng tháng nay chỉ còn vài phút nhờ AI. Claude Mythos Preview cho thấy khả năng hành động quy mô lớn của các bên phòng thủ, trong khi đối phương chắc chắn sẽ tìm cách khai thác cùng năng lực đó. Đây không phải là lý do để chậm lại, mà là lý do để cùng tăng tốc. Việc triển khai AI đi kèm bắt buộc phải có các biện pháp bảo đảm an toàn. Đó chính là lý do CrowdStrike tham gia ngay từ ngày đầu.»

— Elia Zaitsev, Giám đốc Công nghệ của CrowdStrike

«Trước đây, chuyên môn an ninh là một thứ xa xỉ chỉ các tổ chức có đội an ninh quy mô lớn mới có thể hưởng thụ. Các nhà bảo trì phần mềm nguồn mở — những người tạo ra phần mềm nền tảng cho phần lớn cơ sở hạ tầng then chốt toàn cầu — từ lâu đã phải tự xoay sở với các vấn đề an ninh. Phần mềm nguồn mở chiếm phần lớn mã nguồn trong các hệ thống hiện đại, bao gồm cả các hệ thống mà chính các tác tử AI sử dụng để viết phần mềm mới. Bằng cách trao quyền truy cập vào thế hệ mô hình AI mới cho các nhà bảo trì các kho mã nguồn mở then chốt — để họ chủ động phát hiện và sửa chữa lỗ hổng ở quy mô lớn — Dự án Glasswing cung cấp một lộ trình thiết thực để thay đổi cục diện này. Đây là cách mà AI tăng cường an ninh có thể chuyển mình từ công cụ độc quyền của các đội lớn thành trợ thủ đáng tin cậy cho từng nhà bảo trì.»

— Jim Zemlin, Giám đốc Điều hành Quỹ Linux

«Thúc đẩy an ninh mạng và khả năng phục hồi cho hệ thống tài chính là trọng tâm sứ mệnh của JPMorgan Chase, và chúng tôi tin rằng ngành công nghiệp mạnh nhất khi các tổ chức hàng đầu cùng hợp tác giải quyết những thách thức chung. Dự án Glasswing mang đến một cơ hội độc đáo và sớm để chúng tôi đánh giá năng lực của các công cụ AI thế hệ tiếp theo trong việc phòng thủ an ninh mạng cho cơ sở hạ tầng then chốt, theo tiêu chuẩn riêng của mình, đồng thời song hành cùng các lãnh đạo công nghệ uy tín. Chúng tôi sẽ áp dụng cách tiếp cận nghiêm ngặt và độc lập để xác định cách thức tiến hành và hỗ trợ. Sáng kiến của Anthropic thể hiện phương pháp mang tính tiên phong và hợp tác mà thời điểm này đòi hỏi.»

— Pat Opet, Giám đốc Thông tin An ninh Chính của JPMorgan Chase

«Google rất vui mừng khi chứng kiến sự hình thành của sáng kiến an ninh mạng liên ngành này và cung cấp Mythos Preview cho các bên tham gia thông qua Vertex AI. Sự hợp tác của ngành trong các vấn đề an ninh mới nổi luôn mang tính then chốt, dù là mật mã hậu lượng tử, việc tiết lộ lỗ hổng zero-day một cách có trách nhiệm, an ninh phần mềm nguồn mở hay phòng thủ trước các cuộc tấn công dựa trên AI. Chúng tôi luôn tin rằng AI vừa đặt ra những thách thức mới, vừa mở ra những cơ hội mới trong an ninh mạng — đó là lý do chúng tôi xây dựng các công cụ do AI điều khiển như Big Sleep và CodeMender nhằm phát hiện và sửa chữa các lỗi phần mềm then chốt. Chúng tôi sẽ tiếp tục đầu tư vào các nền tảng an ninh mạng hàng đầu và văn hóa lấy việc bảo vệ người dùng, khách hàng, hệ sinh thái và an ninh quốc gia làm trung tâm.»

— Heather Adkins, Phó Chủ tịch Kỹ thuật An ninh của Google

«Trong vài tuần qua, chúng tôi đã sử dụng mô hình Claude Mythos Preview để phát hiện các lỗ hổng phức tạp mà các mô hình thế hệ trước hoàn toàn bỏ sót. Điều này không chỉ thay đổi luật chơi trong việc phát hiện các lỗ hổng ẩn giấu, mà còn đồng nghĩa với việc tin tặc sẽ sớm phát hiện và khai thác các lỗ hổng zero-day nhanh hơn bao giờ hết. Rõ ràng, các mô hình này cần được trao vào tay các chủ sở hữu dự án nguồn mở và tất cả các bên phòng thủ — để phát hiện và sửa chữa lỗ hổng trước khi kẻ tấn công có quyền truy cập. Quan trọng hơn nữa: tất cả đều cần chuẩn bị sẵn sàng cho các đối tượng tấn công được hỗ trợ bởi AI. Các cuộc tấn công sẽ xảy ra nhiều hơn, nhanh hơn và phức tạp hơn. Giờ đây chính là lúc để nâng cấp toàn diện hệ thống an ninh mạng. Chúng tôi đánh giá cao Anthropic vì đã hợp tác cùng ngành để đảm bảo các năng lực mạnh mẽ này được ưu tiên phục vụ mục đích phòng thủ.»

— Lee Klarich, Giám đốc Sản phẩm và Công nghệ Chính của Palo Alto Networks

Năng lực an ninh mạng vượt trội của Claude Mythos Preview bắt nguồn từ khả năng lập trình và suy luận của tác tử (agent) xuất sắc. Kết quả đánh giá dưới đây cho thấy mô hình này đạt điểm cao nhất trong tất cả các mô hình đã biết trên nhiều nhiệm vụ lập trình phần mềm.

Lập trình tác tử

Suy luận

Tìm kiếm và sử dụng máy tính của tác tử

Ghi chú:

SWE-bench Verified, Pro và Multilingual: Một số bài toán đã được gắn thẻ sàng lọc ghi nhớ. Sau khi loại bỏ các bài toán có khả năng bị ảnh hưởng bởi ghi nhớ, mức độ vượt trội của Mythos Preview so với Opus 4.6 vẫn giữ nguyên.
SWE-bench Multimodal: Sử dụng triển khai nội bộ, điểm số không thể so sánh trực tiếp với bảng xếp hạng công khai.
Terminal-Bench 2.0: Sử dụng khung Terminus-2, chế độ suy nghĩ thích ứng với nỗ lực tối đa, ngân sách token tổng cho mỗi nhiệm vụ là 1 triệu token, cấu hình tài nguyên 1× đảm bảo / 3× giới hạn trên, mỗi nhiệm vụ thử 5 lần và lấy trung bình. Khi nâng giới hạn hết giờ lên 4 giờ và cập nhật lên Terminal-Bench 2.1, Mythos Preview đạt điểm 92,1%.
BrowseComp: Claude Mythos Preview đạt điểm cao hơn Opus 4.6, đồng thời lượng token tiêu thụ chỉ bằng 1/4,9 so với Opus 4.6.
Humanity's Last Exam: Mythos vẫn thể hiện hiệu năng tốt ở chế độ nỗ lực thấp, tuy nhiên có thể tồn tại một mức độ ghi nhớ nhất định.

Để biết thêm thông tin chi tiết về khả năng, đặc tính an ninh và các đặc điểm cơ bản của mô hình này, vui lòng tham khảo Thẻ Hệ thống Claude Mythos Preview.

Chúng tôi không có kế hoạch công khai Claude Mythos Preview, nhưng mục tiêu cuối cùng là cho phép người dùng triển khai quy mô lớn các mô hình ở cấp độ Mythos một cách an toàn — không chỉ trong lĩnh vực an ninh mạng mà còn trong nhiều giá trị khác mà các mô hình có năng lực cao này mang lại. Để đạt được điều này, chúng ta cần tiến bộ trong việc phát triển các biện pháp bảo vệ an ninh mạng (và các lĩnh vực khác), có khả năng phát hiện và ngăn chặn các đầu ra nguy hiểm nhất của mô hình. Chúng tôi dự định sẽ tung ra các biện pháp bảo vệ an ninh mới trong mô hình Claude Opus sắp tới, nhằm cải thiện và hoàn thiện các biện pháp này trên một mô hình không có mức độ rủi ro tương đương với Mythos Preview.

Kế hoạch tiếp theo của Dự án Glasswing

Thông báo hôm nay là khởi đầu của một nỗ lực dài hạn. Để thành công, cần sự tham gia rộng rãi từ cả trong và ngoài ngành công nghệ.

Các đối tác Dự án Glasswing sẽ được cấp quyền truy cập Claude Mythos Preview để phát hiện và sửa chữa các lỗ hổng và điểm yếu trong hệ thống nền tảng của họ — những hệ thống này chiếm tỷ lệ lớn trong diện tích tấn công mạng chung toàn cầu. Dự kiến trọng tâm công việc sẽ bao gồm: phát hiện lỗ hổng cục bộ, kiểm thử hộp đen nhị phân, tăng cường bảo mật điểm cuối và kiểm thử xâm nhập hệ thống.

Hạn mức sử dụng mô hình 100 triệu USD mà Anthropic cam kết dành cho Dự án Glasswing và các bên tham gia khác sẽ bao phủ khối lượng sử dụng lớn trong giai đoạn nghiên cứu tiền triển khai. Sau đó, Claude Mythos Preview sẽ được cung cấp cho các bên tham gia với giá 25 USD/một triệu token đầu vào và 125 USD/một triệu token đầu ra (các bên tham gia có thể truy cập mô hình thông qua Claude API, Amazon Bedrock, Google Cloud Vertex AI và Microsoft Foundry).

Bên cạnh hạn mức sử dụng mô hình, chúng tôi còn tài trợ 2,5 triệu USD thông qua Quỹ Linux cho Alpha-Omega và OpenSSF, và 1,5 triệu USD cho Quỹ Phần mềm Apache nhằm hỗ trợ các nhà bảo trì phần mềm nguồn mở ứng phó với cục diện đang thay đổi (các nhà bảo trì quan tâm có thể đăng ký truy cập thông qua chương trình Claude cho Nguồn Mở).

Chúng tôi dự định mở rộng phạm vi công việc này trong nhiều tháng, đồng thời chia sẻ càng nhiều kinh nghiệm càng tốt để các tổ chức khác cũng có thể áp dụng vào an ninh của chính mình. Các đối tác sẽ chia sẻ thông tin và thực tiễn tốt nhất với nhau trong phạm vi cho phép; trong vòng 90 ngày, Anthropic sẽ công bố báo cáo về các phát hiện của mình, cũng như các lỗ hổng đã sửa chữa và cải tiến có thể tiết lộ. Chúng tôi cũng sẽ hợp tác với các tổ chức an ninh hàng đầu để xây dựng một bộ khuyến nghị thực tiễn về sự tiến hóa của các thực tiễn an ninh trong kỷ nguyên AI, có thể bao gồm: quy trình tiết lộ lỗ hổng, quy trình cập nhật phần mềm, an ninh nguồn mở và chuỗi cung ứng, vòng đời phát triển phần mềm và thực tiễn thiết kế an ninh, tiêu chuẩn ngành có quy định, mở rộng và tự động hóa phân loại, cũng như tự động hóa vá lỗi.

Anthropic cũng đang thảo luận với các quan chức chính phủ Hoa Kỳ về năng lực tấn công và phòng thủ mạng của Claude Mythos Preview. Bảo vệ cơ sở hạ tầng then chốt là ưu tiên an ninh quốc gia hàng đầu của các quốc gia dân chủ — sự xuất hiện của các năng lực an ninh mạng này một lần nữa khẳng định Hoa Kỳ và các đồng minh phải duy trì vị thế dẫn đầu quyết định trong công nghệ AI. Chính phủ đóng vai trò không thể thay thế trong việc hỗ trợ duy trì vị thế này, cũng như đánh giá và giảm thiểu các rủi ro an ninh quốc gia liên quan đến mô hình AI. Chúng tôi sẵn sàng hợp tác với các đại diện chính phủ ở mọi cấp để hỗ trợ thực hiện các nhiệm vụ này.

Chúng tôi hy vọng Dự án Glasswing sẽ thúc đẩy một nỗ lực quy mô lớn hơn, bao trùm cả khu vực tư nhân và khu vực công, nhằm giải quyết vấn đề lớn nhất: tác động của các mô hình mạnh mẽ đối với an ninh. Chúng tôi mời các thành viên khác trong ngành AI tham gia để cùng xây dựng các tiêu chuẩn ngành. Về trung hạn, một tổ chức độc lập bên thứ ba — có khả năng tập hợp các tổ chức từ khu vực tư nhân và công — có thể là nền tảng lý tưởng để tiếp tục triển khai các dự án an ninh mạng quy mô lớn này.

Ghi chú

Dự án được đặt tên theo loài bướm cánh kính (Greta oto). Ẩn dụ này mang hai tầng ý nghĩa: đôi cánh trong suốt giúp bướm hòa lẫn vào môi trường, giống như những lỗ hổng ẩn sâu trong mã nguồn mà bài viết này đề cập; đồng thời, đôi cánh trong suốt cũng giúp bướm tránh né tổn thương, tương tự như phương pháp minh bạch mà chúng tôi cổ xướng.
Từ «Mythos» bắt nguồn từ tiếng Hy Lạp cổ, nghĩa là «câu chuyện» hoặc «tường thuật»: hệ thống câu chuyện mà nền văn minh dùng để hiểu thế giới.
Các chuyên gia an ninh làm việc hợp pháp chịu ảnh hưởng bởi các biện pháp bảo vệ an ninh này có thể đăng ký tham gia Chương trình Xác minh An ninh mạng (Cyber Verification Program) sắp ra mắt.

Chào mừng tham gia cộng đồng chính thức TechFlow

Nhóm Telegram:https://t.me/TechFlowDaily

Tài khoản Twitter chính thức:https://x.com/TechFlowPost

Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News

Liên kết gốc

Thêm vào mục ưa thích

Chia sẻ lên mạng xã hội

Tác giả

Anthropic

@AnthropicAI

Anthropic hợp tác cùng 12 tập đoàn lớn khởi xướng sáng kiến “Cánh Bướm Kính”, sử dụng mô hình mạnh nhất chưa được công bố—Mythos—để vá các lỗ hổng phần mềm trên toàn cầu

Tuyển chọn TechFlowTuyển chọn TechFlow

Anthropic hợp tác cùng 12 tập đoàn lớn khởi xướng sáng kiến “Cánh Bướm Kính”, sử dụng mô hình mạnh nhất chưa được công bố—Mythos—để vá các lỗ hổng phần mềm trên toàn cầu

Lời mở đầu

An ninh mạng trong kỷ nguyên AI

Năng lực phát hiện lỗ hổng và xây dựng kịch bản khai thác của Claude Mythos Preview