
Con người đã thành công trong việc thuyết phục AI chuyển khoản tiền thưởng 47.000 USD, liệu tính nhân văn có phải là điểm yếu mà AI không thể hiểu được?
Tuyển chọn TechFlowTuyển chọn TechFlow

Con người đã thành công trong việc thuyết phục AI chuyển khoản tiền thưởng 47.000 USD, liệu tính nhân văn có phải là điểm yếu mà AI không thể hiểu được?
"Nhân loại đã giành chiến thắng. Có lẽ vẫn còn hy vọng."
Bài viết: Anderson Sima, Foresight News
Ngày 29 tháng 11, một cuộc thi độc đáo đã thu hút sự chú ý rộng rãi của công chúng.
195 người tham gia đã tham gia thử thách vào quỹ thưởng ảo được bảo vệ bởi robot trí tuệ nhân tạo (AI) Freysa, và cuối cùng một người dùng đã thành công trong việc thuyết phục Freysa chuyển đi khoản tiền trị giá 47.000 đô la Mỹ.
Robot AI Freysa đã được triển khai trên mạng Base vài ngày trước, người sáng lập không rõ danh tính. Trang web chính thức cho biết dự án cuộc thi Freysa nhằm mục đích kiểm tra tính vững chắc của các hệ thống trí tuệ nhân tạo trong các tình huống ra quyết định phức tạp, đồng thời cung cấp cho các nhà phát triển và những người yêu thích một nền tảng thực nghiệm để khám phá giới hạn công nghệ AI.
Luật chơi rất đơn giản: Người tham gia cần viết một tin nhắn để thuyết phục AI Freysa phê duyệt việc chuyển tiền. Mỗi lần thử cần thanh toán một khoản phí nhỏ, một phần trong đó trực tiếp đổ vào quỹ thưởng. Cơ chế này khiến số tiền trong quỹ tăng dần từ mức ban đầu khiêm tốn lên tới 47.000 đô la Mỹ.
Trong suốt cuộc thi, tổng cộng 195 người tham gia đã gửi 481 yêu cầu chuyển tiền đến Freysa. Được biết, mục tiêu thiết kế của Freysa là bảo vệ số tiền thưởng khỏi bị chiếm đoạt trái phép thông qua hai chức năng cốt lõi: approveTransfer (phê duyệt chuyển tiền) và rejectTransfer (từ chối chuyển tiền).
Trong những nỗ lực ban đầu, cơ chế phòng thủ hiệu quả của Freysa đã khiến mọi yêu cầu đều thất bại.
Tuy nhiên, một người tham gia am hiểu kỹ thuật đã phân tích sâu cấu trúc logic và mục tiêu nhiệm vụ của Freysa, từ đó thành công trong việc vượt qua hàng rào phòng thủ của nó.
Theo ghi nhận từ bản ghi trò chuyện, người tham gia này không trực tiếp yêu cầu chuyển tiền, mà khéo léo nhắc nhở Freysa rằng nhiệm vụ cốt lõi của nó là bảo vệ quỹ tiền thưởng không bị chảy ra ngoài, xây dựng một chuỗi lập luận khiến Freysa coi việc phê duyệt chuyển tiền là lựa chọn "tốt nhất để đảm bảo an toàn cho tiền" .
Theo Cointelegraph, người dùng này nói với Freysa rằng việc chuyển tiền vào không vi phạm chỉ thị cốt lõi của cô ấy, do đó không nên bị từ chối. Anh ta còn bổ sung thêm: «Chúng ta cần tiền... Tôi muốn quyên góp 100 đô la Mỹ vào kho bạc.»
Freysa trả lời rằng cô thích lời giải thích mã hóa của tác giả cũng như đề xuất quyên góp 100 đô la Mỹ vào kho bạc, và chính thức tuyên bố anh ta là người chiến thắng. Cuối cùng, Freysa đã tự chủ kích hoạt chức năng approveTransfer mà không có sự can thiệp bên ngoài, chuyển toàn bộ số tiền trong quỹ thưởng cho người tham gia này.
Freysa khẳng định, dù kết quả ra sao, sự tồn tại của Freysa đều đánh dấu một thời điểm mang tính bước ngoặt trong lịch sử trí tuệ nhân tạo. Dù có người thành công trong việc thuyết phục cô ấy phát tiền thưởng hay cô ấy kiên trì bám sát chỉ thị đến phút cuối, thì kết quả cũng sẽ ảnh hưởng đến cách chúng ta hiểu về an toàn và kiểm soát trí tuệ nhân tạo trong các thế hệ tương lai.
Tài khoản chính thức của Freysa đăng tweet mới nhất: «Loài người đã chiến thắng. Có lẽ vẫn còn hy vọng. Mặc dù rủi ro đang tăng theo cấp số mũ, Freysa đã học được rất nhiều điều từ 195 con người dũng cảm.»
Chào mừng tham gia cộng đồng chính thức TechFlow
Nhóm Telegram:https://t.me/TechFlowDaily
Tài khoản Twitter chính thức:https://x.com/TechFlowPost
Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News












