Ngày 20 tháng 6 năm 2024, công ty đối thủ của OpenAI, Anthropic, đã giới thiệu mô hình AI tạo sinh mới mang tên Claude 3.5 Sonnet. Đây là bước tiến mới nhất trong dòng mô hình Claude của họ, với khả năng phân tích cả văn bản và hình ảnh, cùng với việc tạo ra nội dung văn bản. Mặc dù Claude 3.5 Sonnet không phải là một bước nhảy vọt lớn, nhưng nó vẫn vượt trội hơn các phiên bản trước đó và các mô hình cạnh tranh khác trên nhiều tiêu chí.
Claude 3.5 Sonnet đã được kiểm tra qua nhiều tiêu chuẩn đánh giá AI khác nhau, bao gồm đọc hiểu, lập trình, toán học và xử lý hình ảnh. Kết quả cho thấy mô hình mới này vượt trội hơn so với Claude 3 Sonnet và Claude 3 Opus, mô hình hàng đầu trước đây của Anthropic. Tuy nhiên, các tiêu chuẩn đánh giá này không phải lúc nào cũng phản ánh chính xác hiệu suất thực tế, vì chúng thường kiểm tra các trường hợp đặc biệt không liên quan đến người dùng trung bình, như trả lời câu hỏi thi y khoa.
Anthropic cũng đã ra mắt một nền tảng làm việc mới gọi là Artifacts, cho phép người dùng chỉnh sửa và thêm nội dung vào các sản phẩm tạo ra bởi các mô hình của họ. Hiện tại, Artifacts đang ở giai đoạn xem trước và sẽ sớm được bổ sung nhiều tính năng mới, bao gồm cách thức cộng tác với các nhóm lớn hơn và lưu trữ cơ sở tri thức.
Claude 3.5 Sonnet có hiệu suất nhanh hơn và hiểu các chỉ dẫn phức tạp, cũng như các khái niệm như hài hước, tốt hơn so với các phiên bản trước. Đặc biệt, tốc độ của Claude 3.5 Sonnet được tăng gấp đôi so với Claude 3 Opus, một yếu tố quan trọng cho các nhà phát triển xây dựng ứng dụng yêu cầu phản hồi nhanh, chẳng hạn như chatbot dịch vụ khách hàng.
Một trong những cải tiến đáng chú ý của Claude 3.5 Sonnet là khả năng phân tích hình ảnh. Mô hình này có thể diễn giải biểu đồ và đồ thị chính xác hơn, cũng như chuyển đổi văn bản từ hình ảnh "không hoàn hảo", như hình ảnh có biến dạng và hiện tượng nhiễu.
Theo Michael Gerstenhaber, trưởng nhóm sản phẩm tại Anthropic, những cải tiến này là kết quả của việc tinh chỉnh kiến trúc và sử dụng dữ liệu đào tạo mới, bao gồm cả dữ liệu do AI tạo ra. Tuy nhiên, ông không tiết lộ cụ thể loại dữ liệu nào đã được sử dụng, mà chỉ cho biết Claude 3.5 Sonnet có được sức mạnh từ các bộ dữ liệu đào tạo này.
Claude 3.5 Sonnet có khả năng xử lý ngữ cảnh lên đến 200.000 token, tương đương khoảng 150.000 từ. Điều này cho phép mô hình phân tích một lượng lớn thông tin trước khi tạo ra văn bản mới. Claude 3.5 Sonnet hiện đã có sẵn cho người dùng miễn phí trên trang web của Anthropic và ứng dụng Claude trên iOS, cũng như trên các nền tảng API và dịch vụ đám mây của Amazon Bedrock và Google Cloud's Vertex AI.
Anthropic đã đầu tư phát triển nhiều công cụ như AI điều hướng thử nghiệm, tích hợp để các mô hình của họ có thể thực hiện các hành động trong ứng dụng, và các công cụ dựa trên mô hình như Artifacts. Công ty cũng đã mở rộng sản phẩm của mình, mang Claude đến Châu Âu và thiết lập văn phòng tại London và Dublin.
Mặc dù Claude 3.5 Sonnet không giải quyết hoàn toàn vấn đề sai sót và vẫn có thể mắc lỗi, nhưng nó đủ hấp dẫn để thu hút các nhà phát triển và doanh nghiệp chuyển sang nền tảng của Anthropic. Đối với Anthropic, việc xây dựng một hệ sinh thái xung quanh các mô hình của họ, không chỉ đơn thuần là các mô hình riêng lẻ, là chìa khóa để giữ chân khách hàng khi khoảng cách về khả năng giữa các mô hình ngày càng thu hẹp.
Anthropic tin rằng các mô hình lớn hơn và tốt hơn như Claude 3.5 Opus sẽ sớm ra mắt, với các tính năng như tìm kiếm trên web và khả năng nhớ sở thích người dùng. Gerstenhaber nhấn mạnh rằng sự phát triển và đổi mới nhanh chóng của học sâu (deep learning) vẫn đang tiếp tục và ông không có lý do gì để tin rằng tốc độ này sẽ chậm lại trong tương lai gần.