Một mô hình AI tư duy mới, QwQ-32B-Preview, vừa được Alibaba ra mắt, gây chú ý với khả năng cạnh tranh với mô hình o1 của OpenAI. Đây là mô hình đầu tiên thuộc loại này có thể được tải xuống theo giấy phép mở, hứa hẹn mang đến nhiều ứng dụng trong thực tế.
QwQ-32B-Preview được phát triển bởi nhóm Qwen của Alibaba, sở hữu 32,5 tỷ tham số và có khả năng xử lý các đoạn văn bản dài đến 32.000 từ. Với quy mô lớn như vậy, QwQ-32B-Preview vượt trội hơn so với các phiên bản o1-preview và o1-mini của OpenAI trên các bài kiểm tra chuẩn như AIME và MATH.
QwQ-32B-Preview được thiết kế để giải các câu đố logic và xử lý các bài toán phức tạp. Tuy nhiên, Alibaba cũng thừa nhận mô hình vẫn tồn tại những hạn chế như: dễ chuyển đổi ngôn ngữ bất ngờ, bị mắc kẹt trong các vòng lặp, và gặp khó khăn với những bài toán đòi hỏi "tư duy thông thường".
Điểm đặc biệt của QwQ-32B-Preview nằm ở khả năng tự kiểm tra và tư duy theo từng bước, giúp tránh được nhiều sai lầm phổ biến ở các mô hình AI thông thường. Cách tiếp cận này tương tự như mô hình o1 của OpenAI, nơi AI thực hiện chuỗi các hành động có kế hoạch để phân tích và đưa ra lời giải chính xác.
Tuy nhiên, khả năng tự tư duy cũng đồng nghĩa với việc mô hình này cần thời gian xử lý dài hơn để hoàn thành nhiệm vụ. Đây là một trong những hạn chế mà Alibaba đang cố gắng cải thiện trong các phiên bản tương lai.
Do phát triển tại Trung Quốc, QwQ-32B-Preview phải tuân thủ các quy định của cơ quan quản lý internet Trung Quốc, đảm bảo các phản hồi phù hợp với "giá trị cốt lõi xã hội chủ nghĩa".
Ví dụ:
Điều này khiến QwQ-32B-Preview chịu nhiều hạn chế khi được triển khai tại các thị trường quốc tế, nơi sự trung lập và khách quan là yếu tố quan trọng.
QwQ-32B-Preview được phát hành theo giấy phép Apache 2.0, cho phép sử dụng trong các ứng dụng thương mại. Tuy nhiên, chỉ một số thành phần của mô hình được công khai, khiến việc sao chép hoặc phân tích chi tiết về cấu trúc bên trong trở nên khó khăn.
Mức độ "mở" của mô hình AI hiện vẫn đang là chủ đề gây tranh cãi. Trong trường hợp này, QwQ-32B-Preview nằm ở mức trung gian giữa "đóng" (chỉ cung cấp API) và "mở" hoàn toàn (công khai mô hình, tham số, và dữ liệu huấn luyện).
Sự ra đời của QwQ-32B-Preview và các mô hình tư duy khác phản ánh sự chuyển dịch trong cách tiếp cận phát triển AI. Các "luật mở rộng" (scaling laws) – quan niệm rằng tăng quy mô dữ liệu và sức mạnh tính toán sẽ luôn cải thiện khả năng của mô hình – đang dần mất đi tính hiệu quả.
Để khắc phục, các nhà nghiên cứu đang tập trung vào những kỹ thuật mới, như test-time compute (tăng cường tính toán trong quá trình suy luận). Đây chính là công nghệ nền tảng cho các mô hình tư duy như o1 và QwQ-32B-Preview, giúp AI có thêm thời gian và tài nguyên để hoàn thành nhiệm vụ.
Không chỉ Alibaba, Google cũng đang đầu tư mạnh mẽ vào các mô hình tư duy với đội ngũ hơn 200 người và hệ thống tính toán tiên tiến.
QwQ-32B-Preview là một bước tiến lớn trong lĩnh vực AI, đặc biệt là về khả năng tư duy và giải quyết các bài toán phức tạp. Tuy nhiên, để cạnh tranh trên quy mô toàn cầu, Alibaba cần khắc phục các hạn chế về chính trị và hiệu năng.
Trong bối cảnh các công ty lớn như OpenAI và Google cũng đang đẩy mạnh nghiên cứu mô hình tư duy, tương lai của lĩnh vực này sẽ đầy tiềm năng nhưng cũng không kém phần cạnh tranh. QwQ-32B-Preview, với sự linh hoạt và tiềm năng của mình, hứa hẹn sẽ đóng góp quan trọng vào cuộc đua công nghệ AI toàn cầu.