OpenAI chính thức triển khai Chế Độ Giọng Nói Nâng Cao (Advanced Voice Mode - AVM) đến nhóm khách hàng sử dụng ChatGPT trả phí. Tính năng này, được thiết kế để giúp ChatGPT giao tiếp tự nhiên hơn qua giọng nói, ban đầu sẽ ra mắt cho người dùng thuộc gói ChatGPT Plus và Teams. Các khách hàng thuộc nhóm Enterprise (doanh nghiệp) và Edu (giáo dục) sẽ bắt đầu được truy cập từ tuần sau.
Trong lần cập nhật này, AVM đã được cải thiện với một thiết kế hoàn toàn mới. Thay vì hiển thị dưới dạng các chấm đen động như trong buổi giới thiệu công nghệ hồi tháng 5, AVM giờ đây được biểu tượng hóa bằng một hình cầu màu xanh lam chuyển động. Khi AVM được kích hoạt, người dùng sẽ nhận được thông báo pop-up cạnh biểu tượng giọng nói trong ứng dụng ChatGPT.
AVM sẽ được triển khai cho tất cả người dùng gói Plus và Teams trong suốt tuần tới. Trong quá trình chờ đợi, OpenAI đã bổ sung thêm nhiều tính năng khác như Hướng dẫn Tùy chỉnh (Custom Instructions), Bộ nhớ (Memory), năm giọng nói mới và cải thiện khả năng nhận diện giọng nói với nhiều giọng điệu, ngữ điệu khác nhau.
OpenAI cũng đã giới thiệu năm giọng nói mới để người dùng thử nghiệm, bao gồm Arbor, Maple, Sol, Spruce và Vale. Những cái tên này đều mang tính biểu tượng thiên nhiên, nhằm nhấn mạnh đến mục tiêu của AVM: làm cho việc sử dụng ChatGPT trở nên tự nhiên, gần gũi hơn. Với sự bổ sung này, tổng số giọng nói của ChatGPT hiện là chín, gần như ngang bằng với số giọng của hệ thống Gemini Live của Google. Các giọng nói cũ như Breeze, Juniper, Cove và Ember vẫn tiếp tục được hỗ trợ.
Tuy nhiên, một giọng nói đáng chú ý đã không còn trong danh sách này là Sky, giọng mà OpenAI từng giới thiệu vào đợt cập nhật mùa xuân vừa qua. Lý do cho sự vắng mặt này xuất phát từ một tranh chấp pháp lý với diễn viên Scarlett Johansson. Nữ diễn viên nổi tiếng đã tuyên bố rằng giọng Sky có quá nhiều điểm tương đồng với giọng của cô, đặc biệt là sau khi cô từng thủ vai một hệ thống AI trong bộ phim "Her". Mặc dù OpenAI khẳng định rằng không có ý định mô phỏng giọng của Johansson, họ đã nhanh chóng gỡ bỏ giọng nói này và giải thích rằng đó chỉ là một sự trùng hợp.
Bên cạnh những cải tiến về giọng nói, một số tính năng khác từng được giới thiệu hồi đầu năm vẫn chưa được OpenAI tích hợp trong lần ra mắt này. Ví dụ, tính năng video và chia sẻ màn hình, cho phép ChatGPT xử lý đồng thời thông tin hình ảnh và âm thanh, vẫn chưa có sẵn. Trong các buổi trình diễn trước đó, OpenAI đã minh họa cách người dùng có thể đặt câu hỏi cho ChatGPT về bài toán trên giấy hoặc mã lập trình trên màn hình máy tính theo thời gian thực. Tuy nhiên, hiện tại công ty chưa công bố lịch trình chính thức cho tính năng đa phương tiện này.
Dù còn thiếu một vài tính năng, OpenAI cho biết AVM đã có những cải tiến đáng kể kể từ khi ra mắt thử nghiệm alpha hạn chế. Giờ đây, tính năng giọng nói của ChatGPT có khả năng nhận diện tốt hơn các giọng nói có nhiều giọng điệu và ngữ điệu khác nhau. Các cuộc hội thoại trở nên mượt mà hơn và tốc độ phản hồi nhanh hơn. Mặc dù trong quá trình thử nghiệm ban đầu, một số lỗi kỹ thuật đã xuất hiện, OpenAI khẳng định rằng họ đã khắc phục và cải thiện tình trạng này.
Ngoài ra, OpenAI cũng mở rộng khả năng tùy chỉnh của AVM với hai tính năng nổi bật: Hướng dẫn Tùy chỉnh (Custom Instructions) và Bộ nhớ (Memory). Tính năng Hướng dẫn Tùy chỉnh cho phép người dùng cá nhân hóa cách ChatGPT phản hồi lại các yêu cầu của họ, trong khi tính năng Bộ nhớ giúp ChatGPT ghi nhớ các cuộc trò chuyện trước đó để có thể tham khảo khi cần thiết trong tương lai.
Tuy nhiên, cần lưu ý rằng AVM hiện chưa khả dụng ở một số khu vực, bao gồm Liên minh châu Âu (EU), Vương quốc Anh, Thụy Sĩ, Iceland, Na Uy và Liechtenstein.
Việc ra mắt Chế Độ Giọng Nói Nâng Cao là một phần trong chiến lược dài hạn của OpenAI nhằm nâng cao trải nghiệm người dùng, làm cho ChatGPT không chỉ đơn thuần là một công cụ văn bản mà còn là một trợ lý giọng nói thực thụ. Với sự gia tăng số lượng người dùng toàn cầu, đặc biệt là trong lĩnh vực giáo dục và doanh nghiệp, việc cải tiến tính năng giọng nói được xem là bước đi chiến lược giúp ChatGPT duy trì sự cạnh tranh trên thị trường.
Nhìn chung, lần ra mắt AVM này không chỉ đánh dấu một bước tiến trong khả năng giọng nói của ChatGPT mà còn cho thấy nỗ lực không ngừng của OpenAI trong việc cải thiện chất lượng sản phẩm, từ việc lắng nghe phản hồi của người dùng đến điều chỉnh các tính năng sao cho phù hợp với nhu cầu thực tế. Điều này cũng phù hợp với xu hướng hiện nay, khi AI đang dần trở thành một phần không thể thiếu trong cuộc sống hàng ngày, từ việc hỗ trợ công việc đến cung cấp thông tin và giải trí.