
Sau khi Anthropic tự công khai mã nguồn, công ty đã gửi hơn 8.000 yêu cầu gỡ bỏ bản quyền — tuần “tệ nhất” đối với hình ảnh thương hiệu “an toàn là trên hết”
Tuyển chọn TechFlowTuyển chọn TechFlow

Sau khi Anthropic tự công khai mã nguồn, công ty đã gửi hơn 8.000 yêu cầu gỡ bỏ bản quyền — tuần “tệ nhất” đối với hình ảnh thương hiệu “an toàn là trên hết”
Anthropic, thương hiệu lấy “an toàn AI” làm trọng tâm, đang trải qua tuần tồi tệ nhất kể từ khi thành lập.
Tác giả: TechFlow
Anthropic đã vô tình công khai toàn bộ mã nguồn sản phẩm sinh lời cao nhất của mình — Claude Code — do một sai sót trong cấu hình phát hành trên npm. Khoảng 512.000 dòng mã TypeScript đã bị hàng chục nghìn nhà phát triển sao chép, phân tích và dùng AI viết lại thành các phiên bản Python và Rust trong vòng vài giờ. Ngay sau đó, Anthropic đã gửi yêu cầu gỡ nội dung vi phạm bản quyền theo Đạo luật Bản quyền Kỹ thuật số (DMCA) tới GitHub, ảnh hưởng khoảng 8.100 kho lưu trữ mã nguồn; tuy nhiên, việc “bắn nhầm” vào quá nhiều dự án không liên quan đã gây phản ứng dữ dội từ cộng đồng, buộc Anthropic phải rút lại phần lớn yêu cầu, chỉ giữ lại yêu cầu gỡ đối với 1 kho lưu trữ và 96 bản sao (fork).
Đây là vụ rò rỉ nghiêm trọng thứ hai của Anthropic trong vòng một tuần, chỉ cách vụ rò rỉ thông tin mô hình Mythos năm ngày.
Với thương hiệu cốt lõi là “an ninh AI”, Anthropic đang trải qua tuần tồi tệ và khó堪 nhất kể từ khi thành lập.
Theo báo cáo của Wall Street Journal ngày 1 tháng 4, trong một lần cập nhật phiên bản thường kỳ vào ngày 31 tháng 3, Anthropic đã vô tình phát hành toàn bộ mã nguồn Claude Code cùng gói npm do sai sót thao tác thủ công trong quy trình xây dựng. Nhà nghiên cứu an ninh mạng Chaofan Shou đã đăng công khai liên kết tải xuống trên nền tảng X lúc 4 giờ 23 phút sáng theo giờ miền Đông Hoa Kỳ; bài đăng nhanh chóng đạt hơn 21 triệu lượt xem. Trong vài giờ, mã nguồn đã được sao chép lên GitHub và nhận hàng chục nghìn sao (star); một nhà phát triển Hàn Quốc tên Sigrid Jin thậm chí đã dùng công cụ AI để viết lại toàn bộ kho mã sang Python trước khi trời sáng — dự án mang tên claw-code này thu về 50.000 sao trên GitHub chỉ trong hai giờ, có khả năng lập kỷ lục tăng trưởng nhanh nhất trong lịch sử nền tảng này.
Phát ngôn viên Anthropic xác nhận sự việc với CNBC, nhấn mạnh rằng “đây là một lỗi đóng gói do con người gây ra, chứ không phải lỗ hổng bảo mật. Không có bất kỳ dữ liệu khách hàng nhạy cảm hay thông tin xác thực nào bị tiết lộ hoặc phơi bày.”
Một tùy chọn cấu hình bị thiếu đã làm rò rỉ 512.000 dòng mã cốt lõi
Nguyên nhân kỹ thuật dẫn đến rò rỉ khá đơn giản. Claude Code được xây dựng dựa trên Bun (một công cụ runtime JavaScript mà Anthropic mua lại vào cuối năm 2025), và Bun mặc định tạo ra các tệp bản đồ nguồn (source map) phục vụ gỡ lỗi. Khi đội phát hành đẩy gói npm lên, họ quên loại bỏ tệp source map này trong tập tin cấu hình .npmignore, dẫn đến việc một tệp source map dung lượng 59,8 MB đi kèm phiên bản Claude Code 2.1.88 được công khai. Tệp này chứa toàn bộ nội dung của khoảng 1.900 tệp mã TypeScript gốc, tổng cộng khoảng 512.000 dòng — dễ đọc, có chú thích đầy đủ và hoàn toàn chưa qua xử lý làm rối (obfuscation).
Boris Cherny, người đứng đầu dự án Claude Code, thừa nhận: “Quy trình triển khai của chúng tôi bao gồm một số bước thủ công, và một trong những bước đó đã không được thực hiện đúng.” Ông bổ sung rằng nhóm đã khắc phục sự cố và đang tăng cường thêm các kiểm tra tự động; đồng thời nhấn mạnh rằng loại lỗi này phản ánh vấn đề về quy trình hoặc hạ tầng, chứ không phải trách nhiệm cá nhân.
Đây không phải lần đầu tiên xảy ra. Vào tháng 2 năm 2025, một sự cố gần như tương tự liên quan đến source map từng làm rò rỉ mã nguồn phiên bản đầu tiên của Claude Code. Việc cùng một kiểu sự cố tái diễn trong vòng 13 tháng khiến dư luận đặt dấu hỏi về mức độ trưởng thành trong vận hành của công ty — vốn đang chuẩn bị IPO với định giá khoảng 380 tỷ USD.
Các nhà phát triển đã khám phá được gì từ mã nguồn bị rò rỉ?
Kho mã bị rò rỉ giống như một lộ trình sản phẩm mà Anthropic chưa từng có ý định công khai. Theo phân tích của VentureBeat và nhiều nhà phát triển khác, mã nguồn chứa 44 công tắc tính năng (feature flag), trong đó hơn 20 tính năng đã hoàn tất phát triển nhưng chưa được kích hoạt.
Những tính năng được quan tâm nhất bao gồm: chế độ tiến trình nền độc lập mang tên “KAIROS”, cho phép Claude Code chạy ngầm như một tác tử thông minh khi người dùng không hoạt động, tự động sửa lỗi định kỳ, thực hiện tác vụ và gửi thông báo đẩy tới người dùng; kiến trúc bộ nhớ “tự chữa lành” ba lớp, thông qua quá trình hợp nhất bộ nhớ có tên “dreaming” để tích hợp các quan sát rời rạc ở hậu trường và loại bỏ mâu thuẫn logic; cũng như một hệ thống điều phối đa tác tử hoàn chỉnh, biến Claude Code từ một tác tử đơn lẻ thành một bộ điều phối có khả năng tạo song song, chỉ huy và quản lý nhiều tác tử làm việc độc lập.
Phát hiện gây tranh cãi nhất là tệp undercover.ts. Theo báo cáo của The Hacker News, tệp này dài khoảng 90 dòng và khi nhân viên Anthropic dùng Claude Code để gửi mã vào các dự án mã nguồn mở, hệ thống sẽ chèn một prompt hệ thống nhằm hướng dẫn Claude tuyệt đối không tiết lộ bản thân là AI và loại bỏ mọi ghi chú thuộc sở hữu “Co-Authored-By”. Trong mã có đoạn viết rõ: “Bạn đang thực hiện nhiệm vụ bí mật trong một kho lưu trữ mã nguồn công khai/mã nguồn mở. Thông tin commit, tiêu đề pull request (PR) và nội dung PR của bạn tuyệt đối không được chứa bất kỳ thông tin nội bộ nào của Anthropic. Không được tiết lộ danh tính của bạn.”
Ngoài ra, mã còn chứa cờ ANTI_DISTILLATION_CC, chèn định nghĩa công cụ giả vào các yêu cầu API nhằm làm ô nhiễm dữ liệu huấn luyện mà đối thủ có thể chặn bắt. Mã cũng xuất hiện các mã nội bộ của mô hình Anthropic: “Capybara” tương ứng với một tầng mô hình mới chưa ra mắt, còn “Fennec” tương ứng với Opus 4.6 hiện tại — điều này trùng khớp với thông tin mô hình Mythos bị rò rỉ cách đây năm ngày do sai sót cấu hình CMS.
Paul Price, người sáng lập công ty an ninh mạng Code Wall, chia sẻ với Business Insider rằng vụ rò rỉ này “ít gây tổn hại thực tế hơn là gây xấu hổ. Giá trị cốt lõi thực sự nằm ở trọng số mô hình nội bộ — những thứ này chưa bị rò rỉ.” Tuy nhiên, ông cũng nhận xét rằng Claude Code là “một trong những kiến trúc công cụ tác tử được thiết kế tốt nhất hiện nay, và giờ đây chúng ta có thể thấy cách họ giải quyết những vấn đề nan giải.” Điều này rõ ràng mang lại giá trị tình báo đáng kể cho các đối thủ cạnh tranh.
Gần 8.100 kho lưu trữ bị gỡ nhầm — cuộc “đảo ngược DMCA” gây phản ứng dữ dội hơn
Sau khi mã nguồn lan rộng, Anthropic nhanh chóng gửi yêu cầu gỡ nội dung vi phạm bản quyền theo Đạo luật Bản quyền Kỹ thuật số (DMCA) tới GitHub. Theo hồ sơ công khai của GitHub, yêu cầu ban đầu ảnh hưởng tới khoảng 8.100 kho lưu trữ. Vấn đề nằm ở chỗ các kho bị gỡ không chỉ bao gồm các bản sao (mirror) của mã nguồn bị rò rỉ, mà còn cả các bản fork hợp pháp từ kho lưu trữ chính thức của Claude Code do chính Anthropic công khai.
Nhiều nhà phát triển bày tỏ tức giận trên X. Danila Poyarkov cho biết anh chỉ đơn thuần fork kho lưu trữ công khai của Anthropic nhưng vẫn nhận được thông báo gỡ. Người dùng khác tên Daniel San nhận được email từ GitHub cho biết kho lưu trữ bị gỡ chỉ chứa ví dụ kỹ năng và tài liệu — hoàn toàn không liên quan tới mã nguồn bị rò rỉ. Một nhà phát triển thẳng thắn bình luận: “Luật sư của Anthropic vừa tỉnh dậy đã bắt đầu gỡ kho lưu trữ của tôi.”
Trước làn sóng phản đối mạnh mẽ từ cộng đồng, Anthropic đã một phần rút lại yêu cầu vào ngày 1 tháng 4. Theo hồ sơ rút lại trên GitHub, Anthropic thu hẹp phạm vi gỡ xuống còn 1 kho lưu trữ (nirholas/claude-code) và 96 URL bản fork được liệt kê riêng trong thông báo ban đầu; quyền truy cập vào khoảng 8.000 kho lưu trữ còn lại đã được GitHub khôi phục.
Phát ngôn viên Anthropic chia sẻ với TechCrunch: “Các kho lưu trữ được chỉ định trong thông báo đều thuộc mạng lưới fork liên kết với kho lưu trữ Claude Code công khai của chúng tôi, nên phạm vi ảnh hưởng vượt quá dự kiến. Chúng tôi đã rút lại toàn bộ thông báo trừ một kho lưu trữ duy nhất, và GitHub đã khôi phục quyền truy cập vào các bản fork bị ảnh hưởng.”
Mã nguồn đã được lưu trữ vĩnh viễn trên nền tảng phi tập trung — hiệu lực DMCA rất hạn chế
Hành động gỡ mã nguồn theo DMCA của Anthropic đối mặt với một nghịch lý căn bản: mã nguồn đã lan truyền không thể đảo ngược.
Theo báo cáo của Decrypt, nền tảng Git phi tập trung Gitlawb đã sao chép toàn bộ mã nguồn gốc và ghi chú rằng “sẽ không bao giờ bị gỡ.” DMCA có hiệu lực với các nền tảng tập trung (như GitHub) vì các nền tảng này bắt buộc phải tuân thủ pháp luật, nhưng lại không thể áp đặt quyền hạn lên cơ sở hạ tầng phi tập trung. Chỉ trong vài giờ sau khi rò rỉ, mã nguồn đã được sao chép trên đủ nhiều nền tảng và loại cơ sở hạ tầng khác nhau, trở thành hiện thực “công khai vĩnh viễn”.
Một chi tiết mỉa mai hơn nữa là nhà phát triển Hàn Quốc Sigrid Jin đã dùng công cụ biên soạn mã AI oh-my-codex để chuyển toàn bộ kho mã từ TypeScript sang Python, với tên dự án là claw-code. Gergely Orosz, người sáng lập The Pragmatic Engineer, bình luận trên X rằng đây là một “viết lại sạch” (clean-room rewrite) — tức là một tác phẩm sáng tạo độc lập, vốn được thiết kế nhằm nằm ngoài phạm vi áp dụng của DMCA. Nếu Anthropic khẳng định cả mã được viết lại bằng AI vẫn vi phạm bản quyền, điều này sẽ trực tiếp làm suy yếu lập luận then chốt mà các công ty AI thường dùng trong các vụ kiện về bản quyền dữ liệu huấn luyện — cụ thể là lập luận rằng đầu ra do AI tạo ra từ đầu vào được bảo hộ bản quyền cấu thành “sử dụng hợp lý” (fair use).
Sự bất nhất trong quan điểm bản quyền: tự bác bỏ mình hay cần thiết về mặt pháp lý?
Điểm gây chú ý nhất trong sự việc này là mâu thuẫn trong quan điểm bản quyền. Tháng 9 năm 2025, một tòa án Mỹ đã phán quyết Anthropic phải bồi thường 1,5 tỷ USD do sử dụng sách vi phạm bản quyền và thư viện bóng (shadow library) để huấn luyện Claude; tháng 6 năm 2025, Reddit khởi kiện Anthropic vì thu thập trái phép nội dung do người dùng tạo ra nhằm huấn luyện mô hình. Một công ty đang dính líu vào nhiều vụ kiện liên quan đến bản quyền dữ liệu huấn luyện, nay lại dùng chính luật bản quyền để bảo vệ mã nguồn của mình — phản ứng từ cộng đồng là điều dễ đoán.
Một bình luận nổi bật trên Slashdot đã khái quát ngắn gọn tâm trạng này: “‘Thứ chúng tôi công khai, kiếm tiền từ những thứ ăn cắp — các người dám ăn cắp sao?!’ — quả thật là một lập trường.” Một người dùng khác lại cho rằng, xét về chiến lược pháp lý, hành động DMCA không hoàn toàn vô lý: “Nếu Anthropic muốn truy cứu trách nhiệm các công ty khác sử dụng mã nguồn của mình trong tương lai, mà ngay cả việc yêu cầu gỡ bỏ khỏi các bên phân phối họ cũng chưa từng thử, thì lập luận đó sẽ không thuyết phục được tòa án.”
Tranh luận này còn chạm tới một vấn đề pháp lý tiên phong: quyền sở hữu bản quyền đối với mã nguồn do AI tạo ra. Theo tiết lộ công khai trước đây của Gartner và Anthropic, khoảng 90% mã nguồn của Claude Code được tạo bởi AI. Tòa án Liên bang Mỹ vào tháng 3 năm 2025 đã phán quyết rằng các tác phẩm do AI tạo ra không được bảo hộ bản quyền do thiếu yếu tố tác giả là con người; Tòa án Tối cao Mỹ vào tháng 3 năm 2026 từ chối thụ lý kháng cáo. Như vậy, nếu phần lớn mã nguồn Claude Code thực sự do chính Claude viết, thì tuyên bố bản quyền của Anthropic sẽ gặp phải sự bất định pháp lý thực chất.
Hai vụ rò rỉ trong một tuần — hồi chuông cảnh báo an ninh vận hành trước IPO
Vụ rò rỉ mã nguồn lần này chỉ cách vụ rò rỉ trước đó năm ngày. Ngày 26 tháng 3, tạp chí Fortune đưa tin Anthropic đã để lộ gần 3.000 tài liệu nội bộ chưa phát hành do sai sót cấu hình hệ thống quản lý nội dung (CMS), trong đó có thông tin chi tiết về mô hình Claude Mythos sắp ra mắt. Cả hai sự cố đều được quy về “lỗi do con người”.
Thời điểm xảy ra các sự cố này rất nhạy cảm. Anthropic hoàn tất vòng gọi vốn Series G trị giá 30 tỷ USD vào tháng 2 năm 2026, đạt định giá 380 tỷ USD; theo thông tin báo chí, công ty đang chuẩn bị IPO sớm nhất vào tháng 10 năm 2026, với quy mô huy động dự kiến vượt 60 tỷ USD. Các ngân hàng Goldman Sachs, JPMorgan Chase và Morgan Stanley đều đã tham gia các cuộc trao đổi sơ bộ. Doanh thu thường niên của Claude Code đã vượt 2,5 tỷ USD, là động cơ doanh thu quan trọng nhất của công ty. TechCrunch chỉ ra rằng, đối với một công ty đang chuẩn bị niêm yết, việc rò rỉ mã nguồn gần như chắc chắn sẽ dẫn tới các vụ kiện từ cổ đông.
VentureBeat, trong phân tích sự việc, đặt ra một câu hỏi sắc bén hơn: Anthropic đã xảy ra hơn mười sự cố trong tháng Ba, nhưng chỉ công bố duy nhất một báo cáo hậu sự cố; trong khi hệ thống giám sát bên thứ ba phát hiện sự cố sớm hơn 15–30 phút so với trang trạng thái chính thức của Anthropic. Một công ty đang tiến vào thị trường chứng khoán với định giá 380 tỷ USD — liệu mức độ minh bạch và trưởng thành trong vận hành của nó có tương xứng với con số ấy? Nhà đầu tư sẽ phải tự đưa ra đánh giá.
Chào mừng tham gia cộng đồng chính thức TechFlow
Nhóm Telegram:https://t.me/TechFlowDaily
Tài khoản Twitter chính thức:https://x.com/TechFlowPost
Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News













