TechFlow đưa tin, ngày 14 tháng 6, ông David Sacks – người phụ trách các vấn đề trí tuệ nhân tạo (AI) và tiền mã hóa tại Nhà Trắng – cho biết mô hình thương mại Mythos Fable do Anthropic ra mắt trong tuần này, dù đã thiết lập các rào cản an ninh, vẫn có thể bị người dùng vượt qua bằng các phương pháp “thoát khỏi kiểm soát” (jailbreak) cụ thể để tiếp cận khả năng tấn công mạng nâng cao mà Mythos sở hữu.
Ông Sacks nêu rõ một đối tác được cả Anthropic lẫn chính phủ Hoa Kỳ tin tưởng đã phát hiện lỗ hổng nói trên trong quá trình thử nghiệm. Sau đó, chính phủ Hoa Kỳ yêu cầu CEO của Anthropic – ông Dario Amodei – khắc phục lỗ hổng hoặc tạm gỡ mô hình khỏi hoạt động, nhưng yêu cầu này đã bị từ chối.
Anthropic cho rằng lỗ hổng này không nghiêm trọng đến mức ảnh hưởng tới hoạt động bình thường của sản phẩm. Tuy nhiên, chính phủ Hoa Kỳ và đối tác liên quan lại có quan điểm khác biệt.
Theo ông Sacks, Anthropic lâu nay luôn nhấn mạnh nguyên tắc “an toàn AI là ưu tiên hàng đầu”, thế nhưng lần này lại ưu tiên duy trì dịch vụ mô hình dành cho người tiêu dùng. Để đáp lại, chính phủ Hoa Kỳ đã áp dụng các biện pháp kiểm soát xuất khẩu đối với Anthropic và tuyên bố sẽ xem xét dỡ bỏ các hạn chế này sau khi các vấn đề liên quan được giải quyết.



