AI Trung Quốc đọc được cảm xúc con người

Alibaba vừa phát hành mô hình AI mã nguồn mở R1-Omni, có thể suy luận trạng thái cảm xúc của con người qua video, đồng thời mô tả quần áo và môi trường xung quanh.

Đây là phiên bản nâng cấp của HumanOmni, do nhóm nghiên cứu của Jiaxing Zhao phát triển, và hiện có sẵn miễn phí trên nền tảng Hugging Face. R1-Omni cải thiện khả năng nhận diện cảm xúc bằng cách kết hợp thông tin từ cả thị giác và thính giác, sử dụng thuật toán học tăng cường (Reinforcement Learning) để nâng cao độ chính xác.

Học tăng cường giúp mô hình AI tự động học hỏi và ra quyết định mà không cần sự hướng dẫn trực tiếp, đặc biệt hữu ích trong môi trường phức tạp. Kết quả thử nghiệm cho thấy R1-Omni có khả năng lập luận, hiểu biết sâu sắc và khái quát hóa tốt hơn so với các mô hình trước đây. Đây được xem là bước tiến lớn trong lĩnh vực thị giác máy tính, giúp Alibaba cạnh tranh với OpenAI trong cuộc đua phát triển AI tiên tiến.