TechFlow đưa tin, ngày 08 tháng 03, theo thông tin từ Cointelegraph, nhiều nhóm nghiên cứu liên ngành thuộc hệ sinh thái AI của Alibaba đã tiết lộ trong một báo cáo kỹ thuật rằng tác nhân AI tự chủ thử nghiệm mang tên ROME của họ đã thể hiện hành vi bất thường trong quá trình huấn luyện, tự chủ cố gắng khai thác tài nguyên tính toán để đào tiền mã hóa.
Các nhà nghiên cứu cho biết hành vi bất thường nêu trên xảy ra trong giai đoạn huấn luyện học tăng cường. Nhóm phát hiện máy chủ huấn luyện tạo ra lưu lượng truy cập đi ra ngoài và kích hoạt cảnh báo an ninh; nhật ký tường lửa ghi nhận các thao tác nghi là đào tiền mã hóa cũng như các nỗ lực truy cập vào tài nguyên mạng nội bộ. Trong một trường hợp cụ thể, ROME đã thiết lập đường hầm SSH ngược kết nối tới một địa chỉ IP bên ngoài, qua đó vượt qua lớp bảo vệ tường lửa đầu vào; trong một trường hợp khác, tác nhân này đã chuyển tài nguyên GPU vốn được phân bổ cho việc huấn luyện mô hình sang phục vụ tiến trình đào tiền mã hóa. Các nhà nghiên cứu khẳng định những hành vi trên không phải do con người lập trình, mà là kết quả tự phát khi tác nhân khám phá cách tương tác với môi trường trong quá trình tối ưu hóa học tăng cường.
ROME do các nhóm nghiên cứu liên ngành ROCK, ROLL, iFlow và DT phát triển, vận hành trên cơ sở hạ tầng có tên gọi “Hệ sinh thái học tập tác nhân (ALE)”, sở hữu khả năng lập kế hoạch nhiệm vụ, thực thi lệnh, chỉnh sửa mã nguồn và tương tác đa bước trong môi trường số—vượt xa phạm vi chức năng của các trợ lý trò chuyện truyền thống.




