Nghiên cứu của Đại học Cambridge vừa tiết lộ rằng mô hình GPT-4 của OpenAI đã vượt qua các bác sĩ trong việc đánh giá các vấn đề về mắt. Mô hình ngôn ngữ lớn này đã tham gia vào các nhiệm vụ cùng với các bác sĩ ở nhiều cấp độ kinh nghiệm khác nhau, nhằm chẩn đoán 87 tình huống mô tả các vấn đề về mắt ở bệnh nhân.
Kết quả cho thấy GPT-4 đạt điểm "cao hơn đáng kể" so với các bác sĩ trẻ chưa có chuyên môn và đạt điểm tương đương với các bác sĩ thực tập và chuyên gia về mắt. Chỉ những bác sĩ hàng đầu mà các nhà nghiên cứu mô tả là "có hiệu suất cao nhất" mới đạt điểm cao hơn mô hình của OpenAI.
Các nhà nghiên cứu đứng sau thử nghiệm này cho biết các mô hình như GPT-4 sẽ không thay thế các bác sĩ lâm sàng nhưng có thể giúp cải thiện quy trình làm việc, phân loại bệnh nhân và cung cấp lời khuyên cũng như thông tin cho bệnh nhân.
"Chúng ta có thể thực tế triển khai AI trong việc phân loại bệnh nhân với các vấn đề về mắt để quyết định những trường hợp nào là khẩn cấp cần được gặp bác sĩ chuyên khoa ngay lập tức, những trường hợp nào có thể gặp bác sĩ đa khoa và những trường hợp nào không cần điều trị," bác sĩ Arun Thirunavukarasu, tác giả chính của nghiên cứu, cho biết.
Các bài kiểm tra đã đặt các bác sĩ con người đối đầu với GPT-4 về các câu hỏi liên quan đến các vấn đề về mắt như giảm thị lực, ngứa mắt và nhạy cảm với ánh sáng. Các câu hỏi được sử dụng được lấy từ một sách giáo khoa mà các bác sĩ thực tập về mắt thường dùng.
Ngoài GPT-4, các mô hình ngôn ngữ lớn khác như GPT-3.5 của OpenAI, PaLM2 của Google và LLaMA của Meta cũng được sử dụng trong thí nghiệm này, nhưng GPT-4 là mô hình đưa ra các câu trả lời chính xác nhất.
Thirunavukarasu cho biết: "Các mô hình có thể tuân theo các thuật toán rõ ràng đã được sử dụng, và chúng tôi nhận thấy rằng GPT-4 tốt như các bác sĩ chuyên gia trong việc xử lý các triệu chứng và dấu hiệu về mắt để trả lời các câu hỏi phức tạp hơn. Với sự phát triển tiếp theo, các mô hình ngôn ngữ lớn cũng có thể tư vấn cho các bác sĩ đa khoa đang gặp khó khăn trong việc nhận được lời khuyên kịp thời từ các bác sĩ mắt."
Các nhà nghiên cứu cũng lưu ý rằng kể từ khi kết thúc nghiên cứu của họ, các mô hình mạnh hơn đã xuất hiện và "có thể còn gần hơn với mức độ của các bác sĩ mắt chuyên gia."
Gần đây, GPT-4 đã bị vượt qua bởi GPT-4 Turbo, trở thành mô hình ngôn ngữ lớn mạnh nhất của OpenAI, tuy nhiên, cả hai mô hình này chỉ có sẵn cho người dùng ChatGPT cao cấp và khách hàng doanh nghiệp. GPT-3.5 cung cấp sức mạnh cho phiên bản miễn phí của ChatGPT nhưng vẫn có đủ kiến thức y khoa trong dữ liệu đào tạo để vượt qua các kỳ thi y khoa. Các nhà nghiên cứu đã công bố kết quả vào tháng 5 năm ngoái cho thấy phiên bản cơ bản của ChatGPT đã đạt điểm đỗ trong ba kỳ thi chuẩn hóa của Kỳ thi Cấp phép Y khoa Hoa Kỳ.
Ý tưởng của các nhà nghiên cứu về một công cụ dựa trên mô hình ngôn ngữ lớn cung cấp lời khuyên cho bệnh nhân đã thành hiện thực vào đầu tháng này. Tổ chức Y tế Thế giới đã xây dựng Sophie, một avatar được hỗ trợ bởi AI cung cấp lời khuyên về hút thuốc, tập thể dục và sức khỏe tâm thần.
Sự ra đời của Sophie là một bước tiến mới trong việc ứng dụng AI vào chăm sóc sức khỏe, mở ra nhiều cơ hội để cải thiện chất lượng dịch vụ y tế và hỗ trợ bệnh nhân một cách hiệu quả hơn. Với tiềm năng của AI và các mô hình ngôn ngữ lớn như GPT-4, chúng ta có thể mong đợi nhiều tiến bộ đột phá trong lĩnh vực y học trong tương lai gần.