Trong một buổi hỏi đáp trên Reddit, Sam Altman, CEO của OpenAI, đã thừa nhận rằng việc thiếu năng lực tính toán là một trong những yếu tố chính ngăn cản công ty ra mắt sản phẩm với tốc độ mong muốn. Ông cho biết: "Tất cả các mô hình này đã trở nên khá phức tạp. Chúng tôi cũng phải đối mặt với nhiều hạn chế và quyết định khó khăn về cách phân bổ năng lực tính toán cho nhiều ý tưởng tuyệt vời."
Khó Khăn Về Cơ Sở Hạ Tầng
Nhiều báo cáo cho thấy OpenAI đang gặp khó khăn trong việc đảm bảo đủ cơ sở hạ tầng tính toán để chạy và huấn luyện các mô hình sinh sinh của mình. Reuters đưa tin rằng OpenAI đã làm việc với Broadcom để phát triển một con chip AI có thể sử dụng cho các mô hình, dự kiến sẽ ra mắt vào năm 2026.
Do sức ép về khả năng tính toán, tính năng phản hồi giọng nói tự nhiên của ChatGPT, Advanced Voice Mode, sẽ không nhận được khả năng nhìn mà đã được công bố hồi tháng Tư trong thời gian tới. Tại sự kiện đó, OpenAI đã trình diễn ứng dụng ChatGPT hoạt động trên điện thoại thông minh và phản hồi các dấu hiệu hình ảnh như trang phục của người sử dụng.
Về DALL-E và Sora
Trong buổi hỏi đáp, Altman cũng cho biết rằng không có kế hoạch phát hành rõ ràng cho phiên bản tiếp theo của DALL-E. Đồng thời, công cụ tạo video của OpenAI, Sora, cũng đang bị trì hoãn do cần hoàn thiện mô hình, đảm bảo an toàn và khả năng mở rộng. Sora đã gặp phải nhiều trở ngại kỹ thuật, khiến nó không cạnh tranh tốt với các hệ thống từ Luma, Runway và những đối thủ khác.
Định Hướng Tương Lai và Cải Tiến
Cuối cùng, Altman cho biết OpenAI vẫn đang xem xét khả năng cho phép nội dung "NSFW" trong ChatGPT trong tương lai, nhấn mạnh rằng công ty tin tưởng vào việc đối xử với người dùng trưởng thành như những người trưởng thành. Ông cũng cho biết ưu tiên hàng đầu của OpenAI là cải thiện các mô hình "reasoning" của o1 và các phiên bản kế tiếp.
Mặc dù có một số cải tiến sắp ra mắt trong năm nay, Altman khẳng định rằng không có sản phẩm nào được gọi là GPT-5 trong thời gian tới.