Quảng Cáo
0943778078
Thứ tư, 22/4/2026, 11:35 (GMT+7)
ChatGPT được cập nhật mô hình tạo ảnh Images 2.0, cải thiện khả năng hiển thị chữ viết chính xác cho nhiều ngôn ngữ, trong đó có tiếng Việt.
"Images 2.0 mang đến chi tiết và độ chính xác chưa từng có trong việc tạo hình ảnh", OpenAI cho biết trên blog ngày 21/4. "Không chỉ hình dung bối cảnh ảnh phức tạp, nó còn hiện thực hóa tầm nhìn của người dùng hiệu quả nhưng vẫn tuân theo hướng dẫn, bảo toàn các chi tiết được yêu cầu".
Theo công ty, ChatGPT với Images 2.0 có thể hiển thị chi tiết nhỏ vốn "làm khó" mô hình AI tạo ảnh, như văn bản nhỏ, biểu tượng, yếu tố giao diện người dùng, bố cục dày đặc cũng như các ràng buộc về phong cách. Tất cả ảnh tạo ra đều ở độ phân giải đến 2K.
Lần đầu tiên, OpenAI cũng tích hợp khả năng suy luận vào mô hình tạo ảnh khi Images 2.0 có "khả năng tư duy", cho phép tìm kiếm trên web, tạo ra nhiều hình ảnh từ một yêu cầu duy nhất, tự động kiểm tra trước khi hiển thị. Nhờ đó, công cụ có thể tạo banner, menu cho quán ăn... với nhiều kích thước khác nhau, cũng như truyện tranh nhiều khung hình. Chế độ này mất nhiều thời gian xử lý hơn so với thông thường, nhưng cho độ chính xác cao hơn.
AI mới cũng có khả năng hiển thị văn bản không phải chữ La-tinh với các ngôn ngữ như tiếng Nhật, tiếng Hàn, tiếng Hindi và tiếng Bengali. Kiến thức của mô hình được cập nhật đến tháng 12/2025. Công ty của Sam Altman không nêu chi tiết mô hình AI đứng sau Images 2.0.
Khả năng tạo ảnh trên ChatGPT dùng Images 2.0. Ảnh: Bảo Lâm
ChatGPT Images 2.0 hỗ trợ dải tỷ lệ khung hình rộng từ 3:1 đến 1:3, có thể thiết lập trực tiếp qua câu lệnh. Tuy nhiên, công cụ cũng gặp một số khó khăn khi mô phỏng chi tiết ẩn, góc nghiêng lạ hoặc cấu trúc vật lý phức tạp. Các biểu đồ chứa thông tin dày đặc cũng dễ sai sót. OpenAI cho biết đã áp dụng biện pháp an toàn để ngăn người dùng tạo nội dung độc hại.
Thử nghiệm thực tế với tiếng Việt cho thấy, so với bản cũ Image 1.5 cuối năm ngoái, ChatGPT với Images 2.0 cho khả năng tạo ảnh nhanh và chính xác. Chữ tiếng Việt hiển thị gần như không gặp các lỗi liên quan đến chính tả hay hiển thị sai, kể cả với văn bản dài.
Theo TechCrunch, thuật toán tạo ảnh bằng AI thường gặp khó khăn trong nhận diện ngôn ngữ, bởi chúng sử dụng mô hình khuếch tán. "Các mô hình khuếch tán chủ yếu tái tạo lại đầu vào nội dung. Chúng có thể giả định rằng chữ viết trên hình ảnh chỉ là một phần rất nhỏ, vì thế bộ tạo hình ảnh sẽ học các mẫu bao phủ nhiều pixel hơn thay vì hiển thị chính xác", Asmelash Teka Hadgu, người sáng lập kiêm CEO của Lesan AI, giải thích.
Cuối năm ngoái, Google cũng ra mắt công cụ Nano Banana Pro nâng cấp khả năng tạo chữ chính xác, hỗ trợ làm đồ họa, sơ đồ, điều mà các mô hình AI khác chưa làm được khi đó. Công cụ có thể được ứng dụng cho những đồ họa như infographic, biển quảng cáo, sơ đồ minh họa, bản ghi chú, công thức nấu ăn...
Bảo Lâm
- OpenAI ra mắt GPT-5.4 hạn chế 'ảo giác'
- Làn sóng tẩy chay ChatGPT
- OpenAI lần đầu vận hành mô hình bằng chip không phải của Nvidia
- ChatGPT bắt đầu có quảng cáo








