Theo thông báo từ OpenAI, GPT-5.4 được thiết kế đặc biệt để khắc phục một trong những điểm yếu lớn nhất của trí tuệ nhân tạo hiện nay: sự thiếu chính xác về mặt thực tế.
So với người tiền nhiệm GPT-5.3 Instant (vừa ra mắt ngày 3/3), mô hình mới đã đạt được những con số ấn tượng:
Giảm 33% lỗi trong các phản hồi riêng lẻ.
Cải thiện độ chính xác tổng thể lên tới 18%.
Để đạt được điều này, OpenAI đã bổ sung một bài kiểm tra an toàn mới cho phép đánh giá "chuỗi suy nghĩ" (chain of thought) của AI. Người dùng giờ đây có thể soi xét kỹ lưỡng quá trình lập luận của chatbot trước khi nhận kết quả cuối cùng, đảm bảo tính minh bạch và đáng tin cậy.

Mô hình GPT-5.4 giảm thiểu đáng kể lỗi ảo giác so với phiên bản trước. Ảnh: Internet
OpenAI tự tin khẳng định GPT-5.4 mang lại hiệu suất hàng đầu với chi phí vận hành thấp hơn đối thủ cạnh tranh. Các bài kiểm tra độc lập đã chứng minh sức mạnh của "tân binh" này:
OSWorld-Verified & WebArena Verified: Đạt 75% trong bài kiểm tra hiệu năng máy tính.
GDPval: Đạt điểm số kỷ lục 83% cho các nhiệm vụ đòi hỏi kiến thức chuyên môn sâu.
MMMU-Pro: Đạt 81,2%, vượt mặt đối thủ sừng sỏ Gemini 3.1 Pro của Google (80,5%).
Đặc biệt, trong lĩnh vực luật và tài chính, CEO Brendan Foody của Mercor đánh giá GPT-5.4 vượt trội hoàn toàn trong việc tạo ra các sản phẩm phức tạp như bản trình chiếu dài hơi hay mô hình phân tích pháp lý.
Với sự hỗ trợ từ OpenAI Codex, GPT-5.4 cho phép tạo mã nguồn (code) nhanh hơn 1,5 lần mà vẫn giữ nguyên chất lượng. Khả năng tích hợp sẵn công cụ máy tính tiên tiến giúp các tác nhân AI (AI Agent) có thể tự động thực hiện quy trình công việc phức tạp trên nhiều ứng dụng khác nhau.
OpenAI cung cấp hai phiên bản chính:
GPT-5.4 Thinking: Dành cho các tác vụ suy luận sâu.
GPT-5.4 Pro: Tối ưu hóa cho hiệu suất cao.
Cửa sổ ngữ cảnh (context window) của API đã được mở rộng lên tới 1 triệu token - mức lớn nhất từ trước đến nay của OpenAI. Đi kèm là tính năng Tool Search đột phá, giúp AI tự động tra cứu định nghĩa công cụ khi cần thiết thay vì tải toàn bộ dữ liệu, giúp tiết kiệm đáng kể lượng token tiêu thụ.
Hiện tại, GPT-5.4 Thinking đã được triển khai cho người dùng các gói ChatGPT Plus, Team và Pro tại một số thị trường. Phiên bản cao cấp GPT-5.4 Pro dành riêng cho khách hàng doanh nghiệp (Enterprise) và người dùng gói Pro.