Tại Diễn đàn Data & AI mùa hè năm 2026 diễn ra vào ngày 8/5 tại TP.HCM, các chuyên gia công nghệ nhận định dữ liệu chất lượng cao chính là yếu tố quyết định hiệu suất của trí tuệ nhân tạo. Việc xây dựng một chiến lược tiếp cận đúng đắn và chuẩn hóa nguồn thông tin đầu vào sẽ giúp doanh nghiệp tối ưu hóa sức mạnh công nghệ, đồng thời triệt tiêu rủi ro "ảo giác" của AI.

Bà Trần Kim Sa, Quản lý kinh doanh nhóm giải pháp Microsoft 365 SME Việt Nam nói về tầm quan trọng của dữ liệu khi huấn luyện AI sáng 8/5. Ảnh: Bảo Lâm
Bà Trần Kim Sa – Quản lý kinh doanh nhóm giải pháp Microsoft 365 SME Việt Nam đã đưa ra hình ảnh ví von độc đáo: AI giống như một nhân sự "háu ăn", có khả năng tiếp nhận khối lượng thông tin khổng lồ nhưng chỉ có thể làm việc xuất sắc nếu được cung cấp nguồn "thức ăn" dữ liệu sạch và chuẩn chỉnh.
Dù hạ tầng công nghệ hiện tại đã hoàn toàn sẵn sàng, nhiều tổ chức trong nước vẫn chưa thể ứng dụng AI thành công do 3 rào cản cốt lõi sau:
Mơ hồ về mục tiêu kinh doanh: Doanh nghiệp chưa xác định rõ ràng bài toán cụ thể cần cấu trúc AI xử lý.
Hệ thống dữ liệu chưa sẵn sàng: Nguồn dữ liệu nội bộ bị phân mảnh, chưa được phân loại hoặc định dạng phù hợp cho các mô hình ngôn ngữ lớn (LLM).
Thiếu hụt hệ thống quản trị và bảo mật: Chưa xây dựng được các hàng rào kỹ thuật để kiểm soát quyền truy cập và an toàn thông tin.
Giải pháp tinh gọn từ chuyên gia: Thay vì tiêu tốn nguồn lực để làm sạch toàn bộ kho dữ liệu lịch sử tích lũy qua hàng chục năm, doanh nghiệp nên đi từ những mục tiêu hẹp và thực tế như: tự động hóa quy trình phản hồi email, tối ưu hóa hệ thống báo giá tự động hoặc nâng cấp chatbot chăm sóc khách hàng.
Trong kỷ nguyên số hiện nay, vai trò của dữ liệu đã dịch chuyển từ công cụ phục vụ con người tra cứu sang đối tượng tiêu dùng trực tiếp của AI. Trí tuệ nhân tạo sẽ khai thác các tài nguyên này để tự động đưa ra các quyết định hoặc kích hoạt chuỗi quy trình tiếp theo mà không cần sự can thiệp thủ công.
Sự thay đổi này khiến các sai sót dù là nhỏ nhất trong hệ thống dữ liệu cũng có thể dẫn đến những hậu quả nghiêm trọng:
Rủi ro vận hành: Nếu đầu vào của hệ thống bị sai lệch về giá thành sản phẩm, AI sẽ tự động xuất các bản báo giá lỗi gửi trực tiếp tới đối tác, thậm chí thiết lập các hợp đồng thương mại dựa trên thông tin sai trái đó.
3 tiêu chuẩn vàng cho dữ liệu doanh nghiệp: Để vận hành an toàn, doanh nghiệp cần bảo đảm toàn diện 3 yếu tố: Dữ liệu có độ tin cậy tuyệt đối; Cơ chế quản trị - bảo mật nghiêm ngặt; Năng lực sẵn sàng khai thác cao.
Đồng quan điểm, ông Lâm Nguyễn Hải Long – Chủ tịch Hội Tin học TP.HCM (HCA) khẳng định, giữa bối cảnh thị trường đang bị choáng ngợp bởi các nhà máy AI (AI Factory) và các vi mạch bán dẫn tiên tiến, dữ liệu vẫn là "trái tim" của hệ thống. Dữ liệu cần được nhìn nhận như một thực thể sống mang tính minh bạch, là cơ sở duy nhất để loại bỏ hiện tượng AI "ảo giác" (hallucination).
Ở góc độ quản lý nhà nước, ông Nguyễn Hữu Yên – Phó giám đốc Sở Khoa học và Công nghệ TP.HCM nhấn mạnh, chất lượng và tính kết nối của dữ liệu là nền tảng cốt lõi để đưa các giải pháp công nghệ từ phòng thí nghiệm đi thẳng vào giải quyết các bài toán quản trị đô thị và kinh doanh phức tạp.

Ông Nguyễn Hữu Yên, Phó giám đốc Sở Khoa học và Công nghệ TP HCM phát biểu tại sự kiện. Ảnh: Bảo Lâm
Để hiện thực hóa mục tiêu biến dữ liệu thành tài sản chiến lược, thành phố đang triển khai đồng bộ nhiều giải pháp vĩ mô:
Hoàn thiện khung pháp lý: Ban hành các chiến lược phát triển dữ liệu, kiến trúc chính quyền số và thành lập Ban chỉ đạo về Dữ liệu do Chủ tịch UBND TP.HCM trực tiếp dẫn dắt.
Chuẩn hóa và đồng bộ: Đẩy mạnh số hóa dữ liệu giấy, liên thông kho lưu trữ giữa các sở ngành và vận hành cổng dữ liệu mở phục vụ cộng đồng doanh nghiệp, startup.
Định hướng công nghệ tương lai: Trong giai đoạn tiếp theo, thành phố sẽ xây dựng một nền tảng AI dùng chung, thực hiện kết nối trực tiếp kho dữ liệu tập trung với các Tác nhân AI chuyên ngành (Specialized AI Agents) thuộc từng lĩnh vực cụ thể nhằm tối ưu hóa dịch vụ công và hỗ trợ ra quyết định chính xác.