ChatGPT thêm khả năng tạo ảnh ‘như thật’

Ngày 26/3, OpenAI cho biết bản phát hành ban đầu của Images in ChatGPT chỉ yếu tập trung vào tạo hình ảnh và người dùng gói đăng ký Plus, Pro, Team hay bản miễn phí đều có thể sử dụng. Trước đó, ChatGPT cho tạo ảnh nhưng thông qua mô hình Dall-E bị giới hạn tính năng và chỉ cho phép tạo ba ảnh miễn phí mỗi ngày.

Theo Goh, một cải tiến đáng chú ý về khả năng tạo ảnh của ChatGPT dùng GPT-4o gọi là “Binding” – thuật ngữ chỉ mức độ mà trình tạo hình ảnh AI duy trì mối liên kết chính xác giữa thuộc tính và đối tượng. Trình tạo ảnh trên ChatGPT cũng được cải thiện về hiển thị văn bản trong hình ảnh, giúp tạo văn bản mạch lạc hơn và không bị “bóp méo”. Theo Goh, đây cũng là thách thức đáng kể, vì nếu các tiêu đề hoặc thành phần văn bản có lỗi, toàn bộ hình ảnh không sử dụng được.

Ngoài ra, công cụ mới sử dụng phương pháp hồi quy tự động, tức tạo ảnh tuần tự từ trái sang phải và từ trên xuống dưới tương tự cách viết văn bản, thay vì kỹ thuật mô hình khuếch tán được hầu hết trình tạo ảnh sử dụng. Khác biệt về mặt kỹ thuật này là yếu tố giúp Images in ChatGPT có khả năng kết xuất và liên kết văn bản trong ảnh tốt hơn.