Trong bối cảnh các mô hình ngôn ngữ lớn (LLM) toàn cầu đang thống trị, CMC OpenAI (C-OpenAI) đã chọn một lối đi ngách nhưng đầy tiềm năng: AI chuyên biệt cho pháp lý. Kết quả là sự ra đời của CMC-AI-Legal-32B - mô hình được thiết kế để trở thành trợ lý ảo pháp lý đắc lực cho người Việt.
Điểm khác biệt cốt lõi của CMC-AI-Legal-32B nằm ở dữ liệu huấn luyện. Nhờ được "tắm" trong ngữ cảnh và chuẩn viện dẫn của pháp luật Việt Nam, mô hình này giải quyết tốt các bài toán mà những "gã khổng lồ" như GPT-4o, Claude hay Gemini thường gặp khó do rào cản ngôn ngữ và sự khác biệt về hệ thống tư pháp. Kết quả đánh giá cho thấy, đại diện của CMC dẫn đầu về hiệu năng tổng thể và đứng Top 1 trong 6/22 tác vụ khó, đặc biệt là các yêu cầu suy luận và lập luận pháp lý nhiều lớp.
Để chứng minh năng lực của AI, không thể dùng các bài kiểm tra của phương Tây. Hiểu rõ điều này, nhóm kỹ sư CMC đã dày công xây dựng VLegal-Bench - bộ chuẩn đánh giá chuyên biệt đầu tiên cho AI pháp lý tại Việt Nam.
Ông Nguyễn Tiến Đồng, Giám đốc kỹ thuật CMC OpenAI, thừa nhận đây là một "bài toán khó" đòi hỏi sự am hiểu song hành cả kỹ thuật lẫn nghiệp vụ luật. Bộ chuẩn bao gồm 10.450 mẫu dữ liệu có đáp án chuẩn, được chia thành 22 tác vụ với 5 cấp độ suy luận tăng dần. Mỗi mẫu dữ liệu đều được gắn nhãn nguồn văn bản pháp luật cấp trung ương, đảm bảo tính đúng đắn và khả năng tái kiểm chứng - điều mà các bộ chuẩn quốc tế không thể làm thay.
Nhóm kỹ sư phát triển bộ chuẩn đánh giá VLegal - Bench. Ảnh: Bnews
Ông Đặng Văn Tú, Tổng giám đốc C-OpenAI khẳng định định hướng phát triển AI chuyên biệt theo từng lĩnh vực sâu. Đáng chú ý, công ty cam kết sẽ công bố mã nguồn, dữ liệu và quy trình đánh giá ra cộng đồng. Động thái này nhằm kêu gọi các chuyên gia trong và ngoài nước cùng tham gia chuẩn hóa, giúp hệ sinh thái AI Việt Nam phát triển nhanh và bền vững hơn.
Sự ra đời của CMC-AI-Legal-32B hoàn toàn phù hợp với chiến lược quốc gia. Trước đó, Thủ tướng Chính phủ đã đưa mô hình ngôn ngữ lớn tiếng Việt và trợ lý ảo vào danh mục công nghệ chiến lược. Bộ trưởng Bộ Khoa học và Công nghệ Nguyễn Mạnh Hùng cũng từng nhận định: "AI đang trở thành hạ tầng quốc gia. Việc phát triển các ứng dụng AI chuyên ngành không chỉ giải quyết bài toán nội tại mà còn giúp doanh nghiệp Việt nâng cao năng lực công nghệ".
Bên cạnh CMC, bức tranh AI Việt Nam đang ngày càng sôi động với sự tham gia của Zalo AI (mô hình 13 tỷ tham số), VNPT hay dự án dữ liệu mở ViGen của NIC và Meta, hứa hẹn một tương lai tự chủ công nghệ đầy triển vọng.