OpenAI Cập Nhật Chế Độ Giọng Nói ChatGPT Để Cải Thiện Trải Nghiệm Giao Tiếp

OpenAI đã bắt đầu triển khai phiên bản nâng cấp của Chế Độ Giọng Nói cho ChatGPT, mang đến cho người dùng trải nghiệm hội thoại âm thanh tự nhiên hơn với chatbot nổi tiếng của mình.

Phiên bản nâng cấp của Chế Độ Giọng Nói hiện chỉ có sẵn cho một số ít người dùng ChatGPT Plus, gói đăng ký trị giá 20 đô la mỗi tháng, cung cấp quyền truy cập ưu tiên vào các mô hình tiên tiến và các khả năng đa phương thức.

“Chế Độ Giọng Nói Nâng Cao cung cấp các cuộc trò chuyện thời gian thực tự nhiên hơn, cho phép bạn ngắt lời bất kỳ lúc nào và cảm nhận cũng như phản ứng với cảm xúc của bạn,” OpenAI cho biết khi công bố triển khai.

Những người dùng ChatGPT Plus may mắn được cấp quyền truy cập alpha vào Chế Độ Giọng Nói mới sẽ nhận được thông báo qua email và thông báo trên ứng dụng di động.

OpenAI cho biết họ dự định mở rộng quyền truy cập “theo từng giai đoạn” với mỗi người dùng ChatGPT Plus sẽ được cấp quyền truy cập vào mùa thu này.

OpenAI cho biết việc phát hành alpha sẽ giúp cải thiện tính năng trước khi triển khai rộng rãi, với kế hoạch công bố báo cáo chi tiết về mô hình AI cơ sở của Chế Độ Giọng Nói, GPT-4o, vào cuối tháng này.

Các khả năng chia sẻ video và màn hình mới cũng sẽ được thêm vào ChatGPT, nhưng OpenAI cho biết những tính năng này sẽ được ra mắt “vào một ngày sau đó” mà không cung cấp thời gian cụ thể.

Chế Độ Giọng Nói của ChatGPT được giới thiệu lần đầu tiên vào tháng 9 năm 2023, cho phép người dùng trò chuyện với chatbot trong các cuộc hội thoại qua lại.

Tuy nhiên, tính năng này chỉ ở mức cơ bản và bị khóa sau một bức tường thanh toán. OpenAI đã thông báo tại bản cập nhật mùa xuân vào tháng 6 rằng họ sẽ mở rộng quyền truy cập vào tính năng Chế Độ Giọng Nói với một mô hình AI cơ sở mới, cung cấp các cuộc trò chuyện cải thiện.

Phiên bản nâng cấp của tính năng giọng nói cung cấp khả năng hiểu phản hồi tốt hơn, với khả năng tuân theo hướng dẫn cụ thể, chẳng hạn như phản hồi bằng một giọng nói hoặc tông giọng cụ thể. Chế Độ Giọng Nói của ChatGPT giờ có thể tạo ra phản hồi nhanh hơn nhiều, với khả năng ngắt lời bot trong khi phản hồi để yêu cầu thay đổi.

Tính năng này dự kiến sẽ được phát hành vào mùa hè nhưng đã bị trì hoãn đến mùa thu để đảm bảo nó an toàn cho việc sử dụng rộng rãi.

Công ty được Microsoft hỗ trợ cho biết họ đã đưa vào hơn 100 chuyên gia kiểm tra bên ngoài để kiểm tra đầu ra của sản phẩm trên 45 ngôn ngữ.

“Kể từ khi chúng tôi lần đầu tiên trình diễn Chế Độ Giọng Nói Nâng Cao, chúng tôi đã làm việc để củng cố sự an toàn và chất lượng của các cuộc trò chuyện giọng nói khi chúng tôi chuẩn bị đưa công nghệ tiên phong này đến với hàng triệu người,” OpenAI cho biết tuần này.

Phiên bản nâng cấp của Chế Độ Giọng Nói cũng có các hệ thống chặn tích hợp để ngăn các yêu cầu nội dung bạo lực hoặc vi phạm bản quyền.

Một hệ thống chặn khác đã được triển khai để ngăn Chế Độ Giọng Nói tạo ra các phản hồi khác với bốn giọng nói mặc định của nó.

Số lượng giọng nói ban đầu là năm, nhưng đã bị giảm xuống sau khi nữ diễn viên Scarlett Johansson phàn nàn về giọng nói mặc định thứ năm, cho rằng nó “quá giống” với giọng của cô.

Việc triển khai tính năng giọng nói mới của chatbot diễn ra cùng tuần với thông báo của OpenAI về việc thử nghiệm tính năng tìm kiếm mới cho ChatGPT, SearchGPT, sẽ cung cấp cho người dùng trải nghiệm tìm kiếm hội thoại hơn.

Đánh giá
No

OpenAI Cập Nhật Chế Độ Giọng Nói ChatGPT Để Cải Thiện Trải Nghiệm Giao Tiếp