Microsoft cảnh báo kĩ thuật bẻ khóa có thể biến AI thành ‘khủng bố’

Mark Russinovich, kiến trúc sư trưởng của Microsoft Azure vừa lên tiếng cảnh báo về một kỹ thuật hack cực kỳ nguy hiểm, có thể cho phép người dùng khai thác lỗ hổng bảo mật để buộc các mô hình ngôn ngữ lớn tiết lộ thông tin nguy hiểm.

Bằng cách bỏ qua các biện pháp bảo vệ, Skeleton Key cho phép người dùng ra lệnh cho mô hình ngôn ngữ lớn thực hiện những hành vi độc hại và nguy hiểm.

Hiện tại, Skeleton Key đã được phát hiện có hiệu quả đối với một số chatbot AI phổ biến như ChatGPT của OpenAI, Gemini (Google) và Claude (Anthropic).

Phía Microsoft đã lập tức phát hành một số bản cập nhật phần mềm để giảm thiểu tác động của Skeleton Key đối với các mô hình ngôn ngữ lớn trên nền tảng này, bao gồm cả trợ lý AI Copilot.