Trong thông báo trên blog ngày 21/4, OpenAI khẳng định Images 2.0 mang đến một chuẩn mực mới về độ chi tiết. Mô hình không chỉ hiểu được những bối cảnh hình ảnh phức tạp mà còn hiện thực hóa tầm nhìn của người dùng một cách trung thành tuyệt đối với câu lệnh (prompt), bảo toàn mọi chi tiết nhỏ nhất được yêu cầu.
Điểm yếu cố hữu của AI là hiển thị các chi tiết li ti như văn bản nhỏ, biểu tượng (icon) hay các yếu tố giao diện người dùng (UI) nay đã được khắc phục. Images 2.0 có thể xử lý các bố cục dày đặc và các ràng buộc khắt khe về phong cách nghệ thuật, cho ra đời những tác phẩm có độ phân giải sắc nét lên đến 2K.
Một tính năng mang tính cách mạng là việc OpenAI đưa khả năng tư duy vào quy trình tạo hình. Images 2.0 giờ đây có thể:
Tự động tìm kiếm thông tin trên web để đảm bảo tính chính xác của hình ảnh.
Tạo ra nhiều biến thể hình ảnh khác nhau từ một yêu cầu duy nhất.
Tự kiểm tra và chỉnh sửa nội dung trước khi hiển thị cho người dùng.
Nhờ khả năng này, ChatGPT trở thành một chuyên gia thiết kế thực thụ, có thể tạo ra các sản phẩm chuyên nghiệp như: banner quảng cáo, menu quán ăn với nhiều kích thước, hay thậm chí là các trang truyện tranh có sự nhất quán giữa nhiều khung hình. Dù quá trình xử lý có thể lâu hơn một chút, nhưng kết quả mang lại đạt độ chuẩn xác cao chưa từng có.

Khả năng tạo ảnh trên ChatGPT dùng Images 2.0. Ảnh: Bảo Lâm
Thử nghiệm thực tế cho thấy, Images 2.0 là một "cú nhảy vọt" so với phiên bản Image 1.5 ra mắt cuối năm ngoái. Với tiếng Việt, chữ viết hiển thị trên ảnh gần như không còn gặp lỗi chính tả, các dấu câu được đặt chính xác kể cả trong những đoạn văn bản dài.
Ngoài tiếng Việt, AI mới cũng hỗ trợ các hệ chữ viết phi La-tinh như tiếng Nhật, Hàn, Hindi và Bengali. Dữ liệu của mô hình đã được cập nhật đến tháng 12/2025, giúp nó hiểu được các xu hướng thiết kế và thông tin mới nhất.
Giới chuyên gia nhận định, các mô hình tạo ảnh bằng AI truyền thống thường gặp khó khăn với chữ viết vì chúng sử dụng cơ chế khuếch tán (diffusion) – vốn tập trung vào việc tái tạo pixel theo mảng thay vì nhận diện ký tự cụ thể. Images 2.0 đã giải quyết bài toán này bằng cách tối ưu hóa thuật toán nhận diện ngôn ngữ.
Cuộc đua AI tạo ảnh đang nóng hơn bao giờ hết khi các đối thủ cũng liên tục tung ra các vũ khí mới. Cuối năm ngoái, Google đã trình làng Nano Banana Pro với khả năng làm đồ họa, sơ đồ và infographic cực mạnh. Sự ra đời của Images 2.0 cho thấy OpenAI quyết tâm giữ vững ngôi vương, biến ChatGPT thành công cụ sáng tạo nội dung toàn diện cho cả người dùng cá nhân lẫn doanh nghiệp.