
«Hacker AI» tấn công, Agentic AI làm thế nào trở thành người bảo vệ mới?
Tuyển chọn TechFlowTuyển chọn TechFlow

«Hacker AI» tấn công, Agentic AI làm thế nào trở thành người bảo vệ mới?
Bằng矛 AI, tấn công khiên AI.
Tác giả:Lạp Phong Đích Cực Khách

01 AI Trỗi dậy: Cuộc chiến an ninh ẩn dưới lưỡi dao kép công nghệ
Khi công nghệ AI phát triển nhanh chóng, các mối đe dọa an ninh mạng ngày càng trở nên phức tạp, phương thức tấn công không chỉ hiệu quả và tinh vi hơn mà còn thúc đẩy sự xuất hiện của dạng "tin tặc AI" mới, từ đó gây ra nhiều cuộc khủng hoảng an ninh mạng kiểu mới.
Đầu tiên là AI tạo sinh đang tái cấu trúc độ "chính xác" trong gian lận mạng.
Nói đơn giản, chính là biến hình thức tấn công phishing truyền thống thành thông minh hơn. Ví dụ, trong các tình huống cụ thể, kẻ tấn công sử dụng dữ liệu xã hội công khai để huấn luyện mô hình AI, tự động tạo hàng loạt email phishing cá nhân hóa, bắt chước phong cách viết hoặc thói quen ngôn ngữ của người dùng cụ thể, thực hiện gian lận "đo ni đóng giày", vượt qua bộ lọc thư rác truyền thống, nâng cao đáng kể tỷ lệ thành công của cuộc tấn công.
Tiếp theo là Deepfake (giả mạo sâu) và chiếm đoạt danh tính – điều mà đại chúng biết rõ nhất. Trước khi công nghệ AI trưởng thành, hình thức tấn công "đổi mặt" truyền thống, còn gọi là BEC (Business Email Compromise), tức là kẻ tấn công giả mạo người gửi email thành lãnh đạo, đồng nghiệp hoặc đối tác kinh doanh của bạn nhằm lừa lấy thông tin thương mại, tiền bạc hoặc tài liệu quan trọng khác.
Ngày nay, việc "đổi mặt" đã thật sự xảy ra. Công nghệ thay đổi khuôn mặt và giọng nói bằng AI có thể giả mạo danh tính của người nổi tiếng hoặc người thân, dùng để lừa đảo, thao túng dư luận thậm chí can thiệp chính trị. Cách đây hai tháng, giám đốc tài chính một doanh nghiệp tại Thượng Hải nhận được lời mời họp video từ "chủ tịch", bên kia sử dụng kỹ thuật Deepfake để giả mạo yêu cầu chuyển khoản khẩn cấp “tiền bảo đảm hợp tác nước ngoài”. Giám đốc này đã chuyển 3,8 triệu Nhân dân tệ vào tài khoản chỉ định theo hướng dẫn, sau đó mới phát hiện đây là vụ án do nhóm tội phạm nước ngoài sử dụng công nghệ Deepfake thực hiện.
Thứ ba là tấn công tự động và khai thác lỗ hổng. Sự tiến bộ của công nghệ AI khiến nhiều lĩnh vực chuyển sang tự động hóa và thông minh hóa, các cuộc tấn công mạng cũng vậy. Tin tặc có thể dùng AI tự động quét lỗ hổng hệ thống, tạo mã tấn công động và tiến hành tấn công nhanh chóng, vô phân biệt mục tiêu. Ví dụ, các cuộc tấn công "zero-day" do AI điều khiển sẽ lập tức viết và thực thi chương trình độc hại ngay sau khi phát hiện lỗ hổng, khiến hệ thống phòng thủ truyền thống khó phản ứng kịp thời.
Vào dịp Tết Nguyên đán năm nay, trang web chính thức của DeepSeek bị tấn công DDoS quy mô siêu lớn lên tới 3.2 Tbps. Tin tặc đồng thời xâm nhập qua API, tiêm các mẫu đối kháng, làm sai lệch trọng số mô hình khiến dịch vụ cốt lõi tê liệt suốt 48 giờ, thiệt hại kinh tế trực tiếp vượt hàng chục triệu USD. Kết quả điều tra sau đó cho thấy dấu vết thâm nhập lâu dài của NSA Mỹ.
Nhiễm dữ liệu và lỗ hổng mô hình cũng là mối đe dọa mới. Kẻ tấn công có thể cài thông tin giả vào dữ liệu huấn luyện AI (tức đầu độc dữ liệu), hoặc lợi dụng những điểm yếu vốn có của mô hình, dụ cho AI đưa ra kết quả sai lệch — điều này gây ra mối đe dọa an ninh trực tiếp cho các lĩnh vực then chốt, thậm chí có thể dẫn đến hậu quả thảm họa dây chuyền, ví dụ như hệ thống xe tự lái vì mẫu đối kháng nhầm biển báo “cấm đi” thành “giới hạn tốc độ”, hay AI y tế chẩn đoán khối u lành tính thành ác tính.
02 AI cần được trị bởi AI
Trước những mối đe dọa an ninh mạng mới do AI thúc đẩy, các mô hình bảo vệ truyền thống đã tỏ ra bất lực. Vậy ta có những biện pháp ứng phó nào?
Không khó để nhận ra rằng hiện nay cộng đồng ngành đã đồng thuận về giải pháp "dùng AI chống lại AI" — đây không chỉ là nâng cấp kỹ thuật mà còn là sự thay đổi toàn diện trong mô hình an ninh.
Các nỗ lực hiện tại chủ yếu chia làm ba loại: công nghệ bảo vệ an toàn mô hình AI, ứng dụng phòng thủ ở cấp ngành và hợp tác giữa chính phủ cùng quốc tế ở tầm vĩ mô hơn.
Mấu chốt của công nghệ bảo vệ an toàn mô hình AI nằm ở việc tăng cường nội tại an toàn của mô hình.
Lấy ví dụ về lỗ hổng "vượt ngục" (jailbreak) của mô hình ngôn ngữ lớn (LLM), cơ chế bảo vệ thường thất bại trước các chiến lược gợi ý vượt ngục mang tính tổng quát — kẻ tấn công hệ thống hóa việc bỏ qua lớp bảo vệ tích hợp sẵn trong mô hình để dụ AI tạo ra nội dung bạo lực, phân biệt hoặc bất hợp pháp. Để ngăn chặn việc "vượt ngục" LLM, các công ty mô hình đều đã thử nghiệm, ví dụ như Anthropic đã phát hành "Bộ phân loại Hiến pháp" vào tháng Hai năm nay.
"Hiến pháp" ở đây đề cập đến các quy tắc ngôn ngữ tự nhiên không thể vi phạm, là một biện pháp bảo đảm được huấn luyện trên dữ liệu tổng hợp, thông qua việc quy định nội dung cho phép và giới hạn, giám sát thời gian thực nội dung đầu vào và đầu ra. Trong bài kiểm tra chuẩn, mô hình Claude3.5 khi có bộ phân loại bảo vệ đã nâng tỷ lệ ngăn chặn thành công các nỗ lực vượt ngục cấp cao từ 14% lên 95%, giảm đáng kể rủi ro "vượt ngục" của AI.
Bên cạnh các biện pháp phòng thủ dựa trên mô hình và phổ quát hơn, các ứng dụng phòng thủ ở cấp ngành cũng rất đáng chú ý, với các giải pháp bảo vệ theo ngữ cảnh chuyên biệt đang trở thành điểm đột phá then chốt: ngành tài chính xây dựng hàng rào chống gian lận nhờ mô hình kiểm soát rủi ro AI và phân tích dữ liệu đa phương thức; hệ sinh thái mã nguồn mở tận dụng công nghệ săn tìm lỗ hổng thông minh để phản ứng nhanh trước các mối đe dọa zero-day; còn bảo vệ thông tin nhạy cảm doanh nghiệp thì dựa vào hệ thống kiểm soát động do AI điều khiển.
Ví dụ, giải pháp do Cisco trình diễn tại Tuần lễ An ninh mạng Quốc tế Singapore có thể chặn ngay lập tức yêu cầu truy vấn dữ liệu nhạy cảm của nhân viên gửi tới ChatGPT, đồng thời tự động tạo báo cáo kiểm toán tuân thủ để tối ưu hóa vòng quản lý.
Ở cấp độ vĩ mô, sự hợp tác xuyên khu vực giữa chính phủ và quốc tế cũng đang được đẩy mạnh. Cơ quan An ninh mạng Singapore ban hành "Hướng dẫn An toàn Hệ thống Trí tuệ Nhân tạo", buộc triển khai cục bộ và cơ chế mã hóa dữ liệu để kiềm chế việc lạm dụng AI tạo sinh, đặc biệt thiết lập tiêu chuẩn phòng vệ riêng cho việc nhận diện danh tính giả mạo bằng AI trong các cuộc tấn công phishing. Ba nước Mỹ, Anh, Canada đồng thời khởi động "Kế hoạch Đại lý Mạng AI", tập trung vào nghiên cứu phát triển hệ thống đáng tin cậy và đánh giá thời gian thực các cuộc tấn công APT, tăng cường năng lực phòng thủ tập thể thông qua hệ thống chứng nhận an ninh liên hợp.
Vậy phương pháp nào có thể tối đa hóa việc dùng AI để ứng phó thách thức an ninh mạng thời đại AI?
"Tương lai cần một trung tâm trí tuệ an ninh AI và xây dựng hệ thống mới xung quanh trung tâm này." Tại Diễn đàn Sáng tạo An ninh mạng Vũ Hán lần thứ hai, Trương Phúc, người sáng lập QingTeng Cloud Security, nhấn mạnh rằng dùng AI chống lại AI chính là cốt lõi của hệ thống phòng thủ an ninh mạng tương lai: "Trong 3 năm tới, AI sẽ lật đổ toàn bộ ngành an ninh hiện tại, cũng như mọi ngành B2B. Các sản phẩm sẽ được xây dựng lại, đạt được mức hiệu quả và năng lực chưa từng có. Sản phẩm tương lai là dành cho AI dùng, chứ không phải cho con người."
Trong số các giải pháp, mô hình Security Copilot rõ ràng là minh chứng tốt cho quan điểm "sản phẩm tương lai là dành cho AI": cách đây một năm, Microsoft ra mắt trợ lý thông minh Microsoft Security Copilot giúp đội an ninh phát hiện, điều tra và phản hồi sự cố an ninh một cách nhanh chóng và chính xác; cách đây một tháng, hãng lại tiếp tục phát hành các tác nhân AI thông minh hỗ trợ tự động trong các lĩnh vực then chốt như tấn công phishing, an toàn dữ liệu và quản lý danh tính.

Microsoft bổ sung sáu tác nhân AI tự phát triển để mở rộng chức năng Security Copilot. Trong đó, ba tác nhân hỗ trợ nhân viên an ninh mạng sàng lọc cảnh báo: tác nhân phân loại phishing xem xét cảnh báo phishing, lọc các báo động giả; hai tác nhân khác phân tích thông báo Purview, phát hiện tình trạng nhân viên sử dụng trái phép dữ liệu doanh nghiệp.
Tác nhân tối ưu hóa truy cập có điều kiện phối hợp với Microsoft Entra, chỉ ra các quy tắc truy cập người dùng không an toàn và tạo phương án sửa lỗi một cú nhấp chuột để quản trị viên thực hiện. Tác nhân vá lỗ hổng tích hợp với công cụ quản lý thiết bị Intune, hỗ trợ nhanh chóng định vị các thiết bị đầu cuối dễ bị tổn thương và áp dụng bản vá hệ điều hành. Tác nhân bản tin tình báo đe dọa tạo báo cáo về các mối đe dọa an ninh mạng có khả năng ảnh hưởng đến hệ thống tổ chức.
03 Vô Tướng: Bảo vệ an toàn bởi tác nhân thông minh cấp cao L4
Không chỉ riêng Microsoft, tại Trung Quốc, để đạt được mức bảo vệ an ninh thực sự "tự lái", QingTeng Cloud Security đã ra mắt tác nhân trí tuệ toàn diện "Vô Tướng". Là sản phẩm an ninh AI đầu tiên trên thế giới thực hiện bước nhảy từ "AI hỗ trợ" sang "tác nhân tự chủ" (Autopilot), đột phá cốt lõi của nó nằm ở việc lật đổ mô hình "phản ứng thụ động" của các công cụ truyền thống, khiến nó có thể hoạt động độc lập, tự động và thông minh.
Bằng cách tích hợp học máy, đồ thị tri thức và công nghệ ra quyết định tự động, "Vô Tướng" có thể hoàn thành toàn bộ vòng khép kín từ phát hiện mối đe dọa, đánh giá tác động đến xử lý phản hồi, thực hiện ra quyết định đích thực và vận hành theo mục tiêu. Kiến trúc "Agentic AI" của nó mô phỏng logic hợp tác của đội an ninh con người: "bộ não" tích hợp kho tri thức an ninh mạng hỗ trợ khả năng lập kế hoạch, "đôi mắt" cảm nhận chi tiết động thái môi trường mạng, "tay chân" linh hoạt sử dụng chuỗi công cụ an ninh đa dạng, và thông qua hợp tác đa tác nhân hình thành mạng lưới đánh giá hiệu quả chia sẻ thông tin, phân công nhiệm vụ và cộng tác.
Về mặt kỹ thuật, "Vô Tướng" sử dụng mô hình "ReAct" (vòng lặp Act-Observe-Think-Act) và kiến trúc hai động cơ "Plan AI + Action AI", đảm bảo khả năng điều chỉnh động trong các nhiệm vụ phức tạp. Khi gọi công cụ gặp ngoại lệ, hệ thống có thể tự động chuyển sang phương án dự phòng thay vì ngừng quy trình. Ví dụ, trong phân tích tấn công APT, Plan AI đóng vai trò "người tổ chức" phân chia mục tiêu nhiệm vụ, Action AI đóng vai trò "chuyên gia điều tra" thực hiện phân tích nhật ký và mô hình hóa mối đe dọa, cả hai song song tiến triển dựa trên đồ thị tri thức được chia sẻ thời gian thực.
Ở cấp độ mô-đun chức năng, "Vô Tướng" xây dựng hệ sinh thái ra quyết định tự chủ đầy đủ: nhân vật tác nhân mô phỏng tư duy lặp lại và suy ngẫm của nhà phân tích an ninh, tối ưu hóa động tuyến đường ra quyết định; gọi công cụ tích hợp truy vấn nhật ký an ninh máy chủ, truy xuất tình báo đe dọa mạng và phân tích mã độc do LLM điều khiển; cảm nhận môi trường thu thập thời gian thực tài sản máy chủ và thông tin mạng; đồ thị tri thức lưu trữ động mối liên hệ thực thể hỗ trợ ra quyết định; hợp tác đa tác nhân thông qua phân chia nhiệm vụ và chia sẻ thông tin, thực hiện song song các nhiệm vụ.
Hiện tại, "Vô Tướng" thể hiện xuất sắc nhất trong ba ứng dụng then chốt: đánh giá cảnh báo, điều tra truy nguyên và xuất báo cáo an ninh.
Trong vận hành an ninh truyền thống, việc xác minh tính thật giả của lượng lớn cảnh báo tốn rất nhiều thời gian và công sức. Với một cảnh báo đặc quyền cục bộ, tác nhân đánh giá cảnh báo của "Vô Tướng" tự động phân tích đặc điểm mối đe dọa, gọi chuỗi công cụ phân tích quyền tiến trình, truy nguyên tiến trình cha, xác minh chữ ký chương trình, cuối cùng xác định là báo động giả — toàn bộ quá trình không cần can thiệp con người. Trong thử nghiệm cảnh báo hiện tại của QingTeng, hệ thống đã đạt tỷ lệ bao phủ cảnh báo 100% và độ chính xác đánh giá 99,99%, đồng thời cắt giảm hơn 95% khối lượng công việc con người.
Đối mặt với mối đe dọa thực sự như tấn công Webshell, tác nhân thông minh thông qua trích xuất đặc điểm mã, phân tích quyền tệp và các liên kết chéo chiều khác, xác nhận hiệu quả tấn công trong vài giây. Việc truy nguyên sâu truyền thống cần nhiều bộ phận hợp tác, mất hàng ngày (như phục hồi lộ trình tải lên, đánh giá ảnh hưởng ngang), nay hệ thống tự động nối liền luồng dữ liệu nhật ký máy chủ, lưu lượng mạng, chuẩn mực hành vi... để tạo báo cáo chuỗi tấn công hoàn chỉnh, rút ngắn chu kỳ phản hồi từ "ngày" xuống "phút".
"Cốt lõi của chúng tôi là đảo ngược mối quan hệ hợp tác giữa AI và con người, có thể coi AI như một con người để cộng tác, thực hiện bước nhảy từ L2 đến L4, tức là từ lái phụ sang lái tự động cấp cao," Hồ Tuấn, đồng sáng lập và Phó Chủ tịch Sản phẩm QingTeng, chia sẻ. "Khi AI thích nghi được nhiều tình huống hơn, tỷ lệ thành công ra quyết định cao hơn, dần dần có thể đảm nhận trách nhiệm lớn hơn, lúc đó sự phân chia trách nhiệm giữa con người và AI sẽ thay đổi."

Trong kịch bản điều tra truy nguyên, cảnh báo Webshell kích hoạt nhóm tác nhân an ninh đa tác nhân do "Vô Tướng AI" điều khiển cùng truy nguyên: "chuyên gia đánh giá" dựa trên cảnh báo định vị tệp one.jsp, tạo ra các nhiệm vụ song song như phân tích nội dung tệp, truy nguyên tác giả, kiểm tra thư mục tương tự và truy vết tiến trình, do tác nhân "điều tra viên an ninh" gọi công cụ nhật ký tệp, nhanh chóng xác định tiến trình java (12606) là nguồn ghi, tiến trình này và máy chủ liên quan 10.108.108.23 (phát hiện tương tác tần suất cao qua nhật ký truy cập) lần lượt được đưa vào điều tra.
Tác nhân mở rộng manh mối động qua đồ thị đe dọa, từ một tệp đơn lẻ đào sâu từng lớp đến tiến trình, máy chủ, "chuyên gia đánh giá" tổng hợp kết quả nhiệm vụ để đánh giá rủi ro tổng thể. Quá trình này rút ngắn thời gian điều tra thủ công từ vài giờ đến vài ngày xuống còn vài chục phút, tái hiện toàn bộ chuỗi tấn công với độ chính xác vượt chuyên gia an ninh cấp cao, theo dõi không góc chết lộ trình di chuyển ngang, đánh giá Red Team cũng cho thấy khó tránh khỏi cuộc điều tra toàn diện của nó.
"Mô hình lớn tốt hơn con người vì nó có thể kiểm tra kỹ từng ngóc ngách, chứ không loại trừ khả năng dựa trên kinh nghiệm," Hồ Tuấn giải thích. "Điều này đồng nghĩa cả độ rộng lẫn độ sâu đều tốt hơn."

Sau khi điều tra xong các tình huống tấn công phức tạp, việc tổng hợp cảnh báo và manh mối điều tra để tạo báo cáo thường tốn nhiều thời gian và công sức. Nhưng AI có thể thực hiện tóm tắt một cú nhấp, trình bày rõ ràng quá trình tấn công dưới dạng dòng thời gian trực quan, giống như phim ảnh nối tiếp các điểm then chốt — hệ thống sẽ tự động sắp xếp các bằng chứng then chốt để tạo ra các khung hình chính của chuỗi tấn công, kết hợp thông tin ngữ cảnh môi trường, cuối cùng tạo đồ thị chuỗi tấn công động, làm cho toàn bộ hành trình tấn công hiện ra một cách trực quan, sống động.

04 Kết luận
Rõ ràng, sự phát triển công nghệ AI mang lại thách thức kép cho an ninh mạng.
Một mặt, kẻ tấn công dùng AI để tự động hóa, cá nhân hóa và ẩn giấu các cuộc tấn công; mặt khác, phe phòng thủ cần đẩy nhanh đổi mới công nghệ, tăng cường khả năng phát hiện và phản hồi nhờ AI. Trong tương lai, cuộc đua công nghệ AI giữa tấn công và phòng thủ sẽ quyết định tình hình tổng thể an ninh mạng, và việc hoàn thiện tác nhân an ninh thông minh sẽ là chìa khóa cân bằng rủi ro và phát triển.
Tác nhân an ninh thông minh "Vô Tướng" đã mang lại những thay đổi mới cả về kiến trúc an ninh lẫn nhận thức.
"Vô Tướng" về bản chất đã thay đổi cách sử dụng AI, đột phá nằm ở việc kết hợp hữu cơ giữa cảm nhận dữ liệu đa chiều, tạo ra chiến lược bảo vệ và khả năng giải thích quyết định — chuyển từ mô hình dùng AI như công cụ sang trao quyền cho AI để nó có thể làm việc độc lập và tự động.
Thông qua phân tích liên kết dữ liệu dị cấu như nhật ký, văn bản, lưu lượng, hệ thống có thể nắm bắt manh mối nhỏ về hoạt động APT trước khi kẻ tấn công hoàn thiện chuỗi tấn công. Quan trọng hơn, việc giải thích trực quan quá trình ra quyết định đã làm cho cảnh báo hộp đen kiểu "biết cái gì nhưng không biết tại sao" của công cụ truyền thống trở thành dĩ vãng — đội an ninh không chỉ nhìn thấy mối đe dọa mà còn hiểu được logic tiến hóa của nó.
Bản chất cuộc cách mạng này là bước nhảy vọt trong tư duy an ninh từ "mất rồi mới lo chữa cháy" sang "phòng ngừa trước", là định nghĩa lại quy tắc chơi trong trận chiến tấn công - phòng thủ.
"Vô Tướng" như một thợ săn sở hữu trực giác số: thông qua mô hình hóa thời gian thực các đặc điểm hành vi vi mô như thao tác bộ nhớ, nó có thể truy ra phần mềm độc tùy chỉnh ẩn nấp trong lượng lớn nhiễu; động cơ quản lý bề mặt tấn công động liên tục đánh giá trọng số rủi ro tài sản, đảm bảo nguồn lực phòng thủ được tập trung đúng vào hệ thống then chốt; cơ chế tiêu hóa tình báo đe dọa thông minh biến hàng vạn cảnh báo mỗi ngày thành chỉ thị phòng thủ có thể hành động, thậm chí dự đoán xu hướng tiến hóa của biến thể tấn công — khi các giải pháp truyền thống vẫn đang mệt mỏi ứng phó các vụ xâm nhập đã xảy ra, "Vô Tướng" đã tiên đoán và chặn đứng bước đi tiếp theo của kẻ tấn công.
"Việc ra đời của hệ thống trung tâm trí tuệ AI (tác nhân an ninh cấp cao) sẽ hoàn toàn tái cấu trúc cục diện an ninh mạng. Và điều duy nhất chúng ta cần làm là nắm bắt triệt để cơ hội này," Trương Phúc nói.
Chào mừng tham gia cộng đồng chính thức TechFlow
Nhóm Telegram:https://t.me/TechFlowDaily
Tài khoản Twitter chính thức:https://x.com/TechFlowPost
Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News














