Công ty khởi nghiệp Anthropic đã ra mắt một loạt tính năng mới nhằm giúp các nhà phát triển tạo ra các ứng dụng hữu ích hơn với mô hình ngôn ngữ Claude. Theo một bài đăng trên blog của công ty, các nhà phát triển hiện có thể sử dụng Claude 3.5 Sonnet để tạo, kiểm tra và đánh giá các câu lệnh, áp dụng các kỹ thuật "prompt engineering" để cải thiện đầu vào và nâng cao chất lượng câu trả lời của Claude cho các nhiệm vụ chuyên biệt.
Các mô hình ngôn ngữ thường khá "dễ tính" khi bạn yêu cầu chúng thực hiện một số tác vụ, nhưng đôi khi, chỉ cần thay đổi nhỏ trong câu lệnh có thể dẫn đến những cải thiện lớn về kết quả. Thông thường, bạn phải tự mình tìm ra cách thay đổi đó, hoặc thuê một kỹ sư câu lệnh để làm điều đó. Tuy nhiên, tính năng mới này của Anthropic cung cấp phản hồi nhanh chóng, giúp việc tìm kiếm các cải tiến trở nên dễ dàng hơn.
Các tính năng này được tích hợp trong Anthropic Console dưới một tab mới mang tên Evaluate. Console là môi trường thử nghiệm của công ty dành cho các nhà phát triển, được tạo ra nhằm thu hút các doanh nghiệp muốn xây dựng sản phẩm với Claude. Một trong những tính năng, được giới thiệu vào tháng 5, là công cụ tạo câu lệnh tích hợp của Anthropic; công cụ này sẽ lấy một mô tả ngắn về nhiệm vụ và xây dựng một câu lệnh chi tiết hơn, sử dụng các kỹ thuật "prompt engineering" của riêng Anthropic. Mặc dù các công cụ của Anthropic có thể không thay thế hoàn toàn các kỹ sư câu lệnh, công ty cho biết chúng sẽ giúp người dùng mới và tiết kiệm thời gian cho các kỹ sư câu lệnh có kinh nghiệm.
Trong Evaluate, các nhà phát triển có thể kiểm tra mức độ hiệu quả của các câu lệnh của ứng dụng AI trong nhiều tình huống khác nhau. Họ có thể tải lên các ví dụ thực tế vào một bộ kiểm tra hoặc yêu cầu Claude tạo ra một loạt các trường hợp kiểm tra do AI tạo ra. Các nhà phát triển sau đó có thể so sánh hiệu quả của các câu lệnh khác nhau bên cạnh nhau và đánh giá các câu trả lời mẫu trên thang điểm năm.
Ví dụ, trong một bài đăng trên blog của Anthropic, một nhà phát triển đã phát hiện ra rằng ứng dụng của họ đang đưa ra câu trả lời quá ngắn trong nhiều trường hợp kiểm tra. Nhà phát triển đã có thể chỉnh sửa một dòng trong câu lệnh để làm cho các câu trả lời dài hơn và áp dụng nó đồng thời cho tất cả các trường hợp kiểm tra của họ. Điều này có thể tiết kiệm cho các nhà phát triển rất nhiều thời gian và công sức, đặc biệt là những người có ít hoặc không có kinh nghiệm "prompt engineering".
CEO và đồng sáng lập của Anthropic, Dario Amodei, đã từng nói rằng kỹ thuật câu lệnh là một trong những yếu tố quan trọng nhất đối với việc chấp nhận rộng rãi AI sinh tạo trong doanh nghiệp. "Nghe có vẻ đơn giản, nhưng 30 phút với một kỹ sư câu lệnh có thể làm cho một ứng dụng hoạt động khi trước đó không thể," Amodei cho biết trong một cuộc phỏng vấn tại Google Cloud Next hồi đầu năm nay.
Việc bổ sung các tính năng mới này của Anthropic không chỉ giúp tối ưu hóa quy trình phát triển ứng dụng AI mà còn mở ra cơ hội cho các doanh nghiệp và cá nhân dễ dàng tiếp cận và ứng dụng công nghệ AI một cách hiệu quả hơn. Điều này cũng đồng nghĩa với việc tiết kiệm chi phí và tài nguyên, đồng thời nâng cao chất lượng sản phẩm, đáp ứng nhu cầu ngày càng cao của thị trường công nghệ hiện nay.