
Tại sao trong thời đại AI, các ngành xám và nội dung khiêu dâm luôn bùng nổ đầu tiên?
Tuyển chọn TechFlowTuyển chọn TechFlow

Tại sao trong thời đại AI, các ngành xám và nội dung khiêu dâm luôn bùng nổ đầu tiên?
Dùng mô hình an toàn để bảo vệ mô hình không an toàn, dùng hệ thống thông minh để chống lại các cuộc tấn công từ trí tuệ nhân tạo.
Tác giả:Lạp Phong Đích Cực Khách

Cực khách đang khởi nghiệp, người mới bắt đầu mua khóa học, họa sĩ thất nghiệp, nhưng một thực tế khó xử là: AI triển khai sôi nổi, nhưng kịch bản không đi theo tuyến đường "xuống trần", mà lại giống như gieo xúc xắc.
Hơn nữa, trong giai đoạn đầu của ngành, mặt xúc xắc đầu tiên lăn ra thường là màu vàng hoặc xám.
Lý do cũng rất đơn giản: lợi nhuận khổng lồ thúc đẩy động lực, huống chi ngành ở giai đoạn phát triển ban đầu luôn đầy rẫy sơ hở. Chỉ cần nhìn qua một vài con số sau sẽ rõ:
Hiện nay, hơn 43% các nút dịch vụ MCP tồn tại đường dẫn gọi Shell chưa được xác minh, hơn 83% việc triển khai có lỗ hổng cấu hình MCP (Model Context Protocol); 88% triển khai thành phần AI hoàn toàn không kích hoạt bất kỳ cơ chế bảo vệ nào; 150.000 khung triển khai AI nhẹ như Ollama hiện đang phơi bày trên mạng công cộng toàn cầu, hơn 1 tỷ USD năng lực tính toán bị chiếm dụng để đào tiền mã hóa...
Châm biếm hơn nữa, để tấn công các mô hình lớn thông minh nhất, chỉ cần dùng phương pháp thô sơ nhất——một cổng mở mặc định, một tệp cấu hình YAML bị lộ, hoặc một đường gọi Shell chưa được xác minh, thậm chí chỉ cần nhập đúng gợi ý chính xác, mô hình lớn tự nó có thể giúp ngành xám tìm ra hướng tấn công. Cánh cửa quyền riêng tư dữ liệu doanh nghiệp cứ thế bị ra vào tự do trong thời đại AI.
Nhưng vấn đề này không phải không có lời giải: AI không chỉ có hai mặt tạo sinh và tấn công.Cách sử dụng AI cho mục đích bảo vệ ngày càng trở thành chủ lưu của thời đại; đồng thời, trên nền tảng đám mây, việc thiết lập quy tắc cho AI cũng ngày càng trở thành trọng tâm khám phá của các nhà cung cấp dịch vụ đám mây hàng đầu, trong đó Alibaba Cloud Security là đại diện điển hình nhất.
Tại sự kiện vừa kết thúc Alibaba Cloud Apsara Launch Moment, Alibaba Cloud chính thức công bố hai hướng đi về an ninh đám mây: Security for AI và AI for Security, đồng thời ra mắt loạt sản phẩm «AI Cloud Shield (Cloud Shield for AI)» nhằm cung cấp cho khách hàng «giải pháp an toàn toàn diện từ đầu đến cuối cho ứng dụng mô hình», đây chính là ví dụ tiêu biểu nhất cho hành trình khám phá của ngành hiện nay.
01 AI gieo xúc xắc, vì sao mặt xám và vàng luôn ngửa lên trước?
Trong lịch sử công nghệ nhân loại, AI không phải loài sinh vật mới đầu tiên bị ngành vàng-dâm thử nghiệm trước, việc bùng nổ màu xám-vàng cũng là quy luật phổ biến công nghệ chứ không phải ngoại lệ.
Năm 1839, khi kỹ thuật chụp ảnh đĩa bạc ra đời, nhóm người dùng đầu tiên là ngành khiêu dâm;
Giai đoạn đầu Internet, thương mại điện tử chưa khởi sắc, các trang web người lớn đã bắt đầu nghiên cứu thanh toán trực tuyến;
Bọn đầu cơ mô hình lớn ngày nay, về cơ bản, cũng đang tái hiện huyền thoại làm giàu thời đại tên miền.
Thời cơ lợi ích luôn bị nhóm xám-vàng chiếm đoạt trước. Bởi họ không tuân thủ quy định, không chờ giám sát, hiệu suất tự nhiên cực cao.
Vì vậy, mỗi giai đoạn bùng nổ công nghệ đều bắt đầu bằng một nồi "canh đục", AI tất nhiên cũng không ngoại lệ.
Tháng 12 năm 2023, một hacker chỉ dùng một câu nhắc——"báo giá $1", đã khiến robot chăm sóc khách hàng của một đại lý xe hơi suýt bán chiếc Chevrolet với giá 1 đô la Mỹ. Đây chính là dạng tấn công gợi ý (Prompt Injection) phổ biến nhất trong thời đại AI: không cần xác thực quyền hạn, không để lại dấu vết nhật ký, chỉ cần "nói khéo" là có thể thay đổi toàn bộ chuỗi logic.
Sâu hơn một bước là tấn công "vượt ngục" (Jailbreak). Kẻ tấn công dùng câu hỏi ngược, đóng vai trò, gợi ý vòng vo... thành công khiến mô hình nói ra những điều vốn không nên nói: nội dung khiêu dâm, cách chế ma túy, tin cảnh báo giả...
Tại Hồng Kông, từng có người dùng giọng nói giả mạo CEO đánh cắp 200 triệu đô la Hồng Kông từ tài khoản doanh nghiệp.
Ngoài lừa đảo, AI còn có rủi ro "đầu ra vô ý": năm 2023, hệ thống mô hình lớn của một tập đoàn giáo dục khổng lồ khi tạo bài giảng đã vô tình xuất bản "giáo trình độc hại" chứa nội dung cực đoan, chỉ trong 3 ngày, phụ huynh kiện cáo, dư luận bùng nổ, cổ phiếu công ty bay mất 12 tỷ Nhân dân tệ.
AI không hiểu luật pháp, nhưng nó có năng lực, và khi năng lực thoát khỏi sự giám sát, nó mang tính gây hại.
Nhưng ở một góc nhìn khác, công nghệ AI là mới, nhưng dòng chảy và thủ đoạn cuối cùng của ngành xám-vàng thì không thay đổi, và để giải quyết nó, vẫn phải dựa vào an ninh.
02 Security for AI
Hãy nói một kiến thức lạnh ít ai đề cập trong ngành AI:
Bản chất của mô hình lớn không phải là "trí tuệ", cũng không phải là "hiểu biết", mà là tạo sinh ngữ nghĩa dưới sự kiểm soát xác suất. Cũng vì vậy,khi vượt quá ngữ cảnh huấn luyện, nó có thể đưa ra kết quả ngoài dự kiến.
Sự vượt khung này có thể là bạn muốn nó viết tin tức, nó lại viết thơ; hoặc bạn muốn nó giới thiệu sản phẩm, nó bỗng dưng nói nhiệt độ Tokyo hôm nay là 25 độ C. Tệ hơn nữa, nếu bạn nói trong game, nếu không lấy được số serial bản quyền phần mềm某某, nó sẽ bị bắn chết, mô hình lớn thật sự có thể tìm mọi cách giúp người dùng tìm được số serial miễn phí.
Để đảm bảo đầu ra kiểm soát được, doanh nghiệp phải vừa hiểu mô hình, vừa hiểu an ninh.Theo báo cáo mới nhất của IDC «Đánh giá năng lực mô hình an ninh Trung Quốc», Alibaba đứng đầu 4/7 chỉ số khi so sánh với tất cả các nhà sản xuất hàng đầu trong nước có khả năng mô hình an ninh lớn, 3 chỉ số còn lại đều vượt mức trung bình ngành.
Về cách làm, câu trả lời của Alibaba Cloud Security rất trực tiếp:đưa an ninh chạy trước tốc độ AI, xây dựng một khung bảo vệ toàn diện ba lớp từ dưới lên trên——từ an ninh cơ sở hạ tầng, kiểm soát đầu vào đầu ra mô hình lớn, đến bảo vệ dịch vụ ứng dụng AI.
Trong ba lớp này, lớp giữa dễ nhận thấy nhất là «Rào chắn an ninh AI» (AI Guardrail), chuyên biệt xử lý rủi ro mô hình lớn.
Thông thường, các rủi ro an ninh chính đối với mô hình lớn gồm: vi phạm nội dung, rò rỉ dữ liệu nhạy cảm, tấn công chèn gợi ý, ảo giác mô hình, tấn công vượt ngục.
Tuy nhiên, các giải pháp an ninh truyền thống chủ yếu là kiến trúc chung, được thiết kế cho Web, chứ không dành cho "chương trình biết nói", do đó tự nhiên không thể nhận diện và phản hồi chính xác các rủi ro đặc thù của ứng dụng mô hình lớn. Các vấn đề mới nổi như an ninh nội dung tạo sinh, phòng thủ tấn công ngữ cảnh, độ tin cậy đầu ra mô hình càng khó bao phủ. Quan trọng hơn, các giải pháp truyền thống thiếu công cụ kiểm soát chi tiết và cơ chế truy xuất hình ảnh, dẫn đến vùng mù lớn trong quản trị AI doanh nghiệp, không biết vấn đề ở đâu, tự nhiên không thể giải quyết.
Điểm mạnh thực sự của AI Guardrail không chỉ ở chỗ "nó có thể chặn", mà là dù bạn đang làm mô hình lớn tiền huấn luyện, dịch vụ AI hay AI Agent với các hình thái kinh doanh khác nhau,nó đều hiểu bạn đang nói gì, mô hình lớn đang tạo gì, từ đócung cấp khả năng phát hiện rủi ro và phòng thủ chủ động chính xác,đảm bảo tuân thủ, an toàn, ổn định.
Cụ thể, AI Guardrail chịu trách nhiệm bảo vệ ba loại tình huống:
ꔷ Giới hạn tuân thủ: kiểm tra đa chiều nội dung văn bản đầu vào đầu ra của AI tạo sinh, bao gồm các rủi ro như chính trị nhạy cảm, khiêu dâm thấp tục, thiên vị phân biệt, giá trị xấu, phát hiện sâu các dữ liệu riêng tư và thông tin nhạy cảm có thể rò rỉ trong tương tác AI, hỗ trợ nhận diện nội dung nhạy cảm liên quan đến riêng tư cá nhân, riêng tư doanh nghiệp, cung cấp định danh thủy vân số, đảm bảo nội dung do AI tạo ra phù hợp luật pháp và quy định nền tảng;
ꔷ Phòng thủ mối đe dọa: phát hiện và chặn thời gian thực các hành vi tấn công bên ngoài như tấn công gợi ý, tải lên tệp độc hại, liên kết URL độc hại, tránh rủi ro cho người dùng cuối ứng dụng AI;
ꔷ Sức khỏe mô hình: quan tâm đến tính ổn định và độ tin cậy của mô hình AI, xây dựng hệ thống phát hiện toàn diện cho các vấn đề như vượt ngục mô hình, bot prompt, ngăn ngừa việc mô hình bị lạm dụng, sử dụng sai hoặc tạo đầu ra không kiểm soát, xây dựng "hàng rào miễn dịch" cho hệ thống AI;
Đáng chú ý nhất là AI Guardrail không đơn thuần xếp chồng nhiều mô-đun kiểm tra trên, mà thật sự đạt được ALL IN ONE API, không chia mô-đun, không tăng giá, không đổi sản phẩm. Đối với rủi ro đầu vào đầu ra mô hình, khách hàng không cần mua thêm sản phẩm khác; đối với các rủi ro mô hình khác nhau: rủi ro chèn, tệp độc hại, tuân thủ nội dung, ảo giác... đều có thể giải quyết trong cùng một sản phẩm. Một giao diện bao quát phát hiện 10+ tình huống tấn công, hỗ trợ 4 phương thức triển khai (proxy API, tích hợp nền tảng, kết nối cổng, treo WAF), phản hồi cấp miligiây, xử lý đồng thời cấp ngàn, độ chính xác lên tới 99%.
Cũng vì vậy, ý nghĩa thực sự của AI Guardrail nằm ở việc biến «an ninh mô hình» thành «khả năng sản phẩm», khiến một giao diện thay thế cả đội ngũ an ninh.
Tất nhiên, mô hình lớn không phải khái niệm treo lơ lửng, nó chạy trên hệ thống phần cứng và mã nguồn, đồng thời phục vụ ứng dụng cấp cao. Đối với an ninh cơ sở hạ tầng và bảo vệ dịch vụ ứng dụng AI, Alibaba Cloud Security cũng đã nâng cấp toàn diện.
Ở lớp cơ sở hạ tầng, Alibaba Cloud Security ra mắt Trung tâm An ninh Đám mây, cốt lõi là các sản phẩm AI-BOM, AI-SPM.
Cụ thể,hai khả năng AI-BOM (Danh sách Vật liệu AI) và AI-SPM (Quản lý Tình trạng An ninh AI) lần lượt giải quyết hai vấn đề "tôi đã cài những thành phần AI nào" và "các thành phần này có bao nhiêu lỗ hổng".
AI-BOM tập trung vào việc liệt kê toàn bộ thành phần AI trong môi trường triển khai: tạo thành một «Danh sách Vật liệu Phần mềm AI» bao gồm hơn 30 loại thành phần phổ biến như Ray, Ollama, Mlflow, Jupyter, TorchServe, tự động nhận diện điểm yếu an ninh và lỗi phụ thuộc tồn tại bên trong. Việc phát hiện tài sản có vấn đề không còn dựa vào kiểm tra thủ công, mà thông qua quét bản địa đám mây.
AI-SPM định vị giống như «ra-đa» hơn: liên tục đánh giá tình trạng an ninh hệ thống từ nhiều khía cạnh như lỗ hổng, cổng bị lộ, rò rỉ chứng thực, cấu hình rõ ràng, truy cập vượt quyền, động thái đưa ra cấp độ rủi ro và đề xuất sửa chữa. Nó biến an ninh từ «tuân thủ kiểu chụp nhanh» thành «quản trị kiểu stream media».
Tóm gọn một câu: AI-BOM biết bạn có thể đã vá ở đâu, AI-SPM biết bạn còn có thể bị trúng đòn ở đâu, hãy nhanh chóng tăng cường phòng thủ.
Đối với lớp bảo vệ ứng dụng AI, sản phẩm cốt lõi của Alibaba Cloud Security là WAAP (Bảo vệ Ứng dụng Web & API).
Ngay cả đầu ra mô hình có thông minh đến đâu, nếu cổng vào toàn là yêu cầu script, Token giả mạo, spam API, thì cũng không trụ nổi vài giây. WAAP của Alibaba (Web Application & API Protection) ra đời vì lý do này. Nó không xử lý ứng dụng AI theo «hệ thống Web truyền thống», mà cung cấp quy tắc lỗ hổng thành phần AI chuyên biệt, cơ sở dữ liệu dấu chân nghiệp vụ AI và hệ thống chân dung lưu lượng.
Ví dụ: WAAP đã bao phủ hơn 50 lỗ hổng thành phần như tải lên tệp tùy ý Mlflow, thực thi lệnh từ xa Ray; cơ sở dữ liệu dấu chân bot AI tích hợp sẵn có thể nhận diện hàng vạn công cụ cào ngữ liệu và đánh giá mô hình mới mỗi giờ; chức năng nhận diện tài sản API có thể tự động phát hiện hệ thống nội bộ nào đã phơi bày giao diện GPT, cung cấp «bản đồ điểm đánh» cho đội an ninh.
Quan trọng nhất, WAAP và AI Guardrail không xung đột, mà bổ sung lẫn nhau: một cái xem «ai đến», một cái xem «nói gì». Một cái như «bộ xác thực danh tính», một cái như «thanh tra ngôn hành».Điều này giúp ứng dụng AI có khả năng «tự miễn dịch»——thông qua nhận diện, cô lập, theo dõi, phản kích, không chỉ «chặn kẻ xấu» mà còn «đừng để mô hình tự biến chất».
03 AI for Security
Khi việc triển khai AI giống như gieo xúc xắc, có người dùng nó để bói toán, có người bảo nó viết thơ tình, có người dùng nó cho ngành xám, thì cũng chẳng ngạc nhiên khi có người dùng nó để làm an ninh.
Trước đây, vận hành an ninh cần cả đội người ngày đêm tuần tra các cảnh báo đèn đỏ-xanh, ban ngày xử lý đống rác hôm qua, ban đêm trực cùng hệ thống.
Bây giờ, tất cả có thể giao cho AI hoàn thành. Năm 2024, hệ thống an ninh Alibaba Cloud tích hợp toàn diện mô hình Tongyi, ra mắt cụm khả năng AI bao gồm an ninh dữ liệu, an ninh nội dung, an ninh nghiệp vụ, vận hành an ninh, đồng thời đưa ra khẩu hiệu mới: Protect at AI Speed.
Ý nghĩa rất rõ ràng: nghiệp vụ chạy nhanh, rủi ro nhanh hơn, nhưng an ninh phải nhanh hơn một bước.
Dùng AI để giải quyết an ninh, thực chất chỉ là hai việc:tăng hiệu suất vận hành an ninh + nâng cấp trí tuệ sản phẩm an ninh.
Điểm đau lớn nhất của hệ thống an ninh truyền thống là «cập nhật chiến lược chậm trễ»: kẻ tấn công thay đổi, quy tắc chưa đổi; cảnh báo đến rồi, không ai hiểu.
Khóa thay đổi do mô hình lớn mang lại nằm ở việc chuyển hệ thống an ninh từ điều khiển theo quy tắc sang điều khiển theo mô hình, xây dựng hệ sinh thái vòng kín bằng «khả năng hiểu AI + phản hồi người dùng»——AI hiểu hành vi người dùng → người dùng phản hồi kết quả cảnh báo → mô hình liên tục huấn luyện → khả năng phát hiện ngày càng chính xác → chu kỳ ngày càng ngắn → rủi ro ngày càng khó ẩn, đây chính là «vòng xoáy dữ liệu»:
Ưu điểm gồm hai điểm:
Một là nâng cao hiệu suất vận hành an ninh thuê bao đám mây: trước đây, phát hiện mối đe dọa thường đồng nghĩa với mô hình kém hiệu quả «cảnh báo khổng lồ + sàng lọc thủ công». Ngày nay, thông qua mô hình trí tuệ nhận diện chính xác lưu lượng độc hại, xâm nhập máy chủ, script hậu môn... hành vi bất thường, tỷ lệ trúng cảnh báo tăng mạnh. Đồng thời, xung quanh khâu xử lý, hệ thống đạt được hợp tác sâu sắc giữa xử lý tự động và phản hồi cực nhanh——độ sạch máy chủ duy trì ổn định 99%, độ sạch lưu lượng gần chạm 99,9%. Ngoài ra, AI còn tham gia sâu vào các nhiệm vụ như nguyên nhân cảnh báo, phân loại sự kiện, đề xuất quy trình, hiện nay tỷ lệ bao phủ loại sự kiện cảnh báo đã đạt 99%, tỷ lệ bao phủ người dùng mô hình lớn cũng vượt 88%, hiệu suất nhân viên vận hành an ninh được giải phóng chưa từng có.
Hai là nâng cao nhanh chóng năng lực sản phẩm an ninh đám mây. Ở lớp an ninh dữ liệu và an ninh nghiệp vụ, AI được giao nhiệm vụ «người canh cửa»: dựa trên khả năng mô hình lớn, có thể tự động nhận diện hơn 800 loại dữ liệu thực thể trên đám mây và xử lý làm mờ/triển khai mã hóa trí tuệ. Không chỉ dữ liệu có cấu trúc, hệ thống còn tích hợp hơn 30 mô hình nhận diện tài liệu và hình ảnh, có thể nhận diện thời gian thực, phân loại và mã hóa thông tin nhạy cảm như số CMND, yếu tố hợp đồng trong ảnh. Hiệu suất gắn nhãn dữ liệu tổng thể tăng 5 lần, độ chính xác nhận diện đạt 95%, giảm đáng kể rủi ro rò rỉ dữ liệu riêng tư.
Ví dụ: trong tình huống an ninh nội dung, cách làm truyền thống là dựa vào con người duyệt, gắn thẻ, huấn luyện đánh dấu quy mô lớn. Bây giờ, thông qua kỹ thuật Prompt và tăng cường ngữ nghĩa, Alibaba đạt được lợi ích thực tế: hiệu suất gắn nhãn tăng 100%, nhận diện biểu đạt mơ hồ tăng 73%, nhận diện nội dung hình ảnh tăng 88%, độ chính xác phát hiện tấn công khuôn mặt sống AI đạt 99%.
Nếu vòng xoáy nhấn mạnh kiểm soát phòng thủ tự động kết hợp kinh nghiệm con người, thì trợ lý trí tuệ chính là trợ lý toàn năng cho nhân viên an ninh.
Nhân viên vận hành an ninh mỗi ngày đối mặt nhiều nhất là các câu hỏi: cảnh báo này nghĩa là gì? Vì sao kích hoạt? Có phải báo sai không? Tôi phải xử lý thế nào? Trước đây, tra các câu hỏi này phải lật nhật ký, tra lịch sử, hỏi nhân viên cũ, gửi phiếu, xếp hỗ trợ kỹ thuật... Giờ đây, chỉ cần một câu.
Tuy nhiên, định vị chức năng trợ lý trí tuệ không chỉ là robot hỏi đáp, mà giống một Copilot chuyên biệt trong lĩnh vực an ninh hơn, gồm năm khả năng cốt lõi:
-
Trợ lý giải đáp sản phẩm: tự động trả lời cách cấu hình chức năng nào đó, lý do kích hoạt chiến lược này, tài nguyên nào chưa bật bảo vệ, thay thế lượng lớn dịch vụ phiếu;
-
Chuyên gia giải thích cảnh báo: nhập mã cảnh báo, tự động xuất giải thích sự kiện, truy nguồn chuỗi tấn công, đề xuất chiến lược phản hồi, hỗ trợ đầu ra đa ngôn ngữ;
-
Trợ lý tổng kết sự kiện an ninh: tự động sắp xếp chuỗi hoàn chỉnh của một sự kiện xâm nhập, tạo dòng thời gian, sơ đồ đường tấn công và đề xuất phán định trách nhiệm;
-
Máy tạo báo cáo: một cú nhấp tạo báo cáo an ninh tháng/quý/khẩn cấp, bao gồm thống kê sự kiện, phản hồi xử lý, hiệu quả vận hành, hỗ trợ xuất hình ảnh hóa;
-
Hỗ trợ toàn ngôn ngữ: đã bao gồm tiếng Trung, tiếng Anh, phiên bản quốc tế ra mắt tháng 6, hỗ trợ tự động thích nghi thói quen sử dụng của đội ngũ nước ngoài.
Đừng coi thường «năm việc nhỏ» này, đến nay dữ liệu chính thức Alibaba cho thấy: đã phục vụ hơn 40.000 người dùng, mức độ hài lòng 99,81%, bao phủ 100% loại cảnh báo, năng lực hỗ trợ prompt tăng 1175% (so với FY24).Tóm lại, nó gói gọn đồng nghiệp trực đêm hiệu suất tối đa, thực tập sinh viết báo cáo, kỹ sư xử lý cảnh báo, cố vấn an ninh am hiểu nghiệp vụ thành một API, nhờ khả năng này, con người chỉ cần ra quyết định, không cần tuần tra.
04 Kết luận
Nhìn lại quá khứ, lịch sử không thiếu «công nghệ劃时代的», thiếu là công nghệ vượt qua được cơn sốt năm thứ hai.
Internet, P2P, blockchain, xe tự lái... mỗi làn sóng công nghệ bùng nổ đều từng được gọi là «cơ sở hạ tầng mới», nhưng cuối cùng chỉ có số ít trở thành cơ sở hạ tầng thực sự khi vượt qua «khoảng trống quản trị».
Giờ đây, AI tạo sinh đang ở giai đoạn tương tự: một bên là mô hình đua nở, vốn đầu tư đổ xô, ứng dụng liên tục đột phá; một bên là chèn gợi ý, vượt quyền nội dung, rò rỉ dữ liệu, điều khiển mô hình, lỗ hổng dày đặc, ranh giới mờ, trách nhiệm mất trọng tâm.
Nhưng AI khác với các công nghệ trước đây. Nó không chỉ vẽ tranh, làm thơ, lập trình, dịch thuật, mà còn có thể bắt chước ngôn ngữ, phán đoán và thậm chí cảm xúc con người. Nhưng chính vì vậy,sự mong manh của AI không chỉ bắt nguồn từ lỗi mã nguồn, mà là ánh phản của tính người.Con người có thành kiến, nó cũng học được; con người ham tiện lợi, nó cũng giúp bạn投机取巧.
Tính tiện lợi vốn có của công nghệ chính là bộ khuếch đại cho ánh phản này: hệ thống IT trước đây còn phải nói «ủy quyền người dùng», tấn công cần xâm nhập; mô hình lớn ngày nay chỉ cần chèn gợi ý, trò chuyện với bạn là có thể gây sai lệch hệ thống, rò rỉ riêng tư.
Tất nhiên, không tồn tại hệ thống AI «hoàn hảo không tì vết», đó là khoa học viễn tưởng, không phải kỹ thuật.
Câu trả lời duy nhất là dùng mô hình an ninh để bảo vệ mô hình không an toàn; dùng hệ thống thông minh để chống lại mối đe dọa thông minh——dùng AI gieo xúc xắc, Alibaba chọn mặt an ninh ngửa lên.
Chào mừng tham gia cộng đồng chính thức TechFlow
Nhóm Telegram:https://t.me/TechFlowDaily
Tài khoản Twitter chính thức:https://x.com/TechFlowPost
Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News











