Nền tảng hỗ trợ lập trình CodeRabbit vừa công bố những số liệu "biết nói" về chất lượng code của AI. Theo đó, trung bình một yêu cầu thay đổi mã nguồn (Pull Request) do AI thực hiện chứa tới 10,83 vấn đề. Trong khi đó, con số này ở các lập trình viên con người chỉ là 6,45. Sự chênh lệch này đang dấy lên hồi chuông cảnh báo về độ tin cậy của các trợ lý ảo đang được tung hô trên thị trường.
Không chỉ thua kém về số lượng, mức độ nghiêm trọng của các lỗi do AI tạo ra cũng đáng báo động. Tỷ lệ "lỗi nghiêm trọng" (critical bugs) trong code AI cao gấp 1,4 lần và "lỗi lớn" (major bugs) gấp 1,7 lần so với thông thường.
Cụ thể, AI tỏ ra yếu kém ở các hạng mục cốt lõi:
Logic và tính chính xác: Lỗi nhiều gấp 1,75 lần.
Chất lượng mã và khả năng bảo trì: Lỗi nhiều gấp 1,64 lần.
Bảo mật: Lỗi nhiều gấp 1,57 lần.
Hiệu suất: Lỗi nhiều gấp 1,42 lần.
Các lỗi bảo mật thường gặp bao gồm việc xử lý mật khẩu lỏng lẻo (hardcoded passwords), tham chiếu đối tượng không an toàn hoặc dính các lỗ hổng chèn mã độc (injection). Ông David Loker, Giám đốc AI tại CodeRabbit nhận định: "Công cụ AI giúp tăng năng suất vượt trội, nhưng cũng tạo ra những điểm yếu có thể dự đoán được mà các tổ chức cần chủ động giảm thiểu".
Minh họa về AI lập trình. Ảnh: Internet
Tuy nhiên, không thể phủ nhận những ưu điểm của AI. Thống kê cho thấy máy móc "sạch sẽ" hơn con người ở các lỗi cơ bản: AI mắc ít lỗi chính tả hơn 1,76 lần và có khả năng viết kịch bản kiểm thử (testing) tốt hơn 1,32 lần.
Bối cảnh năm 2025 cũng ghi nhận Microsoft đã phải vá tới 1.139 lỗ hổng bảo mật - con số cao thứ hai trong lịch sử. Điều này một phần do khối lượng mã nguồn được tạo ra ngày càng khổng lồ nhờ sự trợ giúp của AI.
Nghiên cứu chỉ ra một xu hướng chuyển dịch rõ rệt trong ngành công nghiệp phần mềm: Lập trình viên đang dần chuyển từ vai trò người trực tiếp gõ từng dòng code sang vai trò "người kiểm duyệt" (reviewer). Trách nhiệm của con người giờ đây là rà soát, tinh chỉnh và đảm bảo an toàn cho những sản phẩm do máy móc tạo ra với tốc độ chóng mặt.