Apple: AI suy luận là ‘ảo tưởng’

Nghiên cứu của Apple cho thấy các mô hình AI lý luận mạnh nhất hiện nay thực tế vẫn chưa có khả năng “suy nghĩ”, tức đường đến AGI còn xa vời.

Với tiêu đề Ảo tưởng về Tư duy, nghiên cứu do Apple công bố cuối tuần qua được đánh giá là “gáo nước lạnh” cho những người lạc quan về AI “lý luận” và siêu trí tuệ AGI.

Báo cáo cho biết các mô hình lý luận lớn (LRM) như OpenAI o1, o3, DeepSeek R1, Claude 3.7 Sonnet Thinking hay Google Gemini Flash Thinking đối mặt với “sự sụp đổ hoàn toàn về độ chính xác” khi gặp những vấn đề cực kỳ phức tạp. Trước đó, các mô hình này được ca ngợi có khả năng “suy luận” (reasoning), một bước tiến trên con đường phát triển AGI – những hệ thống siêu trí tuệ nhân tạo với khả năng tư duy và thông minh như con người.

Để chứng minh luận điểm LRM vẫn chưa đủ thông minh như mô tả, Apple bỏ qua cách đánh giá truyền thống, như các bài kiểm tra toán tiêu chuẩn cho AI – vốn có thể bị “nhiễm” dữ liệu đã học được trên Internet. Thay vào đó, nhóm nghiên cứu tự thiết kế một môi trường giải đố có kiểm soát, với các trò chơi logic như Checkers Jumping, River Crossing, Tháp Hà Nội và Blocks World, sau đó đưa vào các mô hình kể trên.

Dựa trên nhiều thử nghiệm, nhóm nghiên cứu của Apple chỉ ra rằng không có bằng chứng nào cho thấy các mô hình này thực hiện các bước suy luận logic. Nghĩa là, chúng chỉ hoạt động như những hệ thống suy đoán từ dựa trên dữ liệu đầu vào có được khi huấn luyện.

Minh họa AI có thể suy luận. Ảnh: Meta AI