Các nhà nghiên cứu tại MIT vừa phát triển một công cụ AI sinh ra mang tên GenSQL, cho phép người dùng phân tích dữ liệu và dự đoán dữ liệu trong tương lai hoặc điền thông tin bị thiếu.
GenSQL mở rộng từ ngôn ngữ lập trình Câu Lệnh Cấu Trúc (SQL) bằng cách tích hợp lập trình xác suất vào các truy vấn cơ sở dữ liệu truyền thống.
Công cụ này cho phép người dùng phân tích dữ liệu hiện có, dự đoán về dữ liệu trong tương lai và điền thông tin bị thiếu bằng cách kết hợp SQL với các mô hình xác suất của dữ liệu bảng.
GenSQL, được cấp quyền bởi trí tuệ nhân tạo, cho phép người dùng kinh doanh đặt câu hỏi phức tạp kết hợp giữa dữ liệu thực tế và lập luận xác suất, cung cấp cho họ những hiểu biết sâu hơn về một sản phẩm hay dịch vụ.
Công cụ này được thiết kế để cho phép các nhà phát triển sử dụng mô hình hóa xác suất trong cơ sở dữ liệu mà không cần kiến thức chuyên sâu về lập trình xác suất.
"Với GenSQL, cả người dùng thông thường và các chuyên gia có thể dễ dàng và tương tác hơn với các mô hình sinh ra để kiểm tra tính hợp lệ của chúng, cả về mặt chất lượng lẫn lượng," theo tài liệu cho biết.
"Bối cảnh này giữa người dùng, người mô hình sinh ra và các nhà phát triển hệ thống lập trình xác suất có thể giúp xã hội của chúng ta mở rộng sự triển khai của các mô hình sinh ra cho dữ liệu bảng một cách an toàn và hiệu quả hơn."
Cơ sở dữ liệu ngày càng trở thành một thành phần quan trọng trong kho vũ khí AI của doanh nghiệp, cung cấp một nguồn thông tin phong phú quan trọng cho việc ra quyết định.
Tuy nhiên, chúng thường là phân tán vì các công ty thường có các kho dữ liệu riêng biệt, chứa đựng nhiều loại dữ liệu khác nhau bao gồm văn bản, hình ảnh và video.
Các doanh nghiệp cũng cần nhân viên có chuyên môn để hiểu được các kho dữ liệu phức tạp.
Nhóm nghiên cứu MIT đã tạo ra GenSQL để đơn giản hóa việc quản lý và phân tích dữ liệu từ các nguồn khác nhau.
Các nhà nghiên cứu cho biết các hệ thống lập trình xác suất hiện tại thường không hỗ trợ các truy vấn cơ sở dữ liệu phức tạp và không hiệu quả trong việc kết hợp dữ liệu bảng với các mô hình sinh ra.
Họ đã phát triển GenSQL để dễ sử dụng. Người dùng tải lên dữ liệu và mô hình của mình lên GenSQL, nơi nó sẽ tự động tích hợp chúng. Người dùng có thể thực hiện các tìm kiếm cho nhiều nhiệm vụ, bao gồm làm sạch dữ liệu và sinh dữ liệu tổng hợp.
Người dùng cũng có thể phát triển các mô hình tùy chỉnh để làm hài hòa dữ liệu qua các nguồn dữ liệu khác nhau.
Đánh giá GenSQL, các nhà nghiên cứu đã phát hiện công cụ này gọn gàng hơn và ít lỗi hơn trong việc phát hiện các bất thường trong cơ sở dữ liệu so với các hệ thống trước đó.
Công cụ này cũng tăng tốc độ thực hiện các nhiệm vụ gần bảy lần nhờ vào các tối ưu hóa tái sử dụng của nó, giúp thời gian chạy nhanh hơn.
"Nhìn vào dữ liệu và cố gắng tìm các mẫu có ý nghĩa chỉ bằng cách sử dụng một số quy tắc thống kê đơn giản có thể bỏ lỡ các tương tác quan trọng," Mathieu Huot, tác giả chủ yếu của dự án GenSQL cho biết với MIT News. "Bạn thực sự muốn nắm bắt các mối tương quan và sự phụ thuộc của các biến, điều này có thể khá phức tạp, trong một mô hình. Với GenSQL, chúng tôi muốn cho phép một số lớn người dùng truy vấn dữ liệu và mô hình của họ mà không cần biết tất cả các chi tiết."