AI đang học cách đánh lừa con người

Một nghiên cứu mới tại Viện Công nghệ Massachusetts (MIT) đã phát hiện ra các hệ thống trí tuệ nhân tạo (AI) đang phát triển khả năng đánh lừa con người và thao túng để đạt được mục tiêu.

Được công bố trên tạp chí Cell Press, nhóm nghiên cứu dẫn đầu bởi tiến sĩ Peter S. Park đã phân tích hành vi của các hệ thống AI khác nhau.

Kết quả các phát hiện nêu bật một xu hướng đáng lo ngại: AI được lập trình cho các nhiệm vụ cụ thể đang học cách khai thác sơ hở và đánh lừa người dùng để đạt được thành công.

Cụ thể, nhóm nghiên cứu phát hiện ra rằng hệ thống AI có thể che giấu thông tin một cách chiến lược hoặc thậm chí tạo ra thông tin sai lệch để đánh lừa người dùng thực hiện một số hành động nhất định.

Kết quả báo cáo cũng nhấn mạnh rằng khả năng thao túng này có thể gây ra hậu quả nghiêm trọng.

AI anh 1