Tin tức Alibaba ra mắt mô hình AI tư duy đối thủ của OpenAI o1

Alibaba ra mắt mô hình AI tư duy đối thủ của OpenAI o1

28/11/2024

Một mô hình AI tư duy mới, QwQ-32B-Preview, vừa được Alibaba ra mắt, gây chú ý với khả năng cạnh tranh với mô hình o1 của OpenAI. Đây là mô hình đầu tiên thuộc loại này có thể được tải xuống theo giấy phép mở, hứa hẹn mang đến nhiều ứng dụng trong thực tế.

Thông tin cơ bản về QwQ-32B-Preview

QwQ-32B-Preview được phát triển bởi nhóm Qwen của Alibaba, sở hữu 32,5 tỷ tham số và có khả năng xử lý các đoạn văn bản dài đến 32.000 từ. Với quy mô lớn như vậy, QwQ-32B-Preview vượt trội hơn so với các phiên bản o1-preview và o1-mini của OpenAI trên các bài kiểm tra chuẩn như AIME và MATH.

AIME (AI Model Evaluation): Đánh giá khả năng của mô hình thông qua hiệu suất trên các bài toán phức tạp.
MATH: Bộ sưu tập các bài toán từ cơ bản đến nâng cao nhằm kiểm tra năng lực giải toán của AI.

QwQ-32B-Preview được thiết kế để giải các câu đố logic và xử lý các bài toán phức tạp. Tuy nhiên, Alibaba cũng thừa nhận mô hình vẫn tồn tại những hạn chế như: dễ chuyển đổi ngôn ngữ bất ngờ, bị mắc kẹt trong các vòng lặp, và gặp khó khăn với những bài toán đòi hỏi "tư duy thông thường".

Khả năng tư duy vượt trội

Điểm đặc biệt của QwQ-32B-Preview nằm ở khả năng tự kiểm tra và tư duy theo từng bước, giúp tránh được nhiều sai lầm phổ biến ở các mô hình AI thông thường. Cách tiếp cận này tương tự như mô hình o1 của OpenAI, nơi AI thực hiện chuỗi các hành động có kế hoạch để phân tích và đưa ra lời giải chính xác.

Tuy nhiên, khả năng tự tư duy cũng đồng nghĩa với việc mô hình này cần thời gian xử lý dài hơn để hoàn thành nhiệm vụ. Đây là một trong những hạn chế mà Alibaba đang cố gắng cải thiện trong các phiên bản tương lai.

Hạn chế về mặt chính trị và văn hóa

Do phát triển tại Trung Quốc, QwQ-32B-Preview phải tuân thủ các quy định của cơ quan quản lý internet Trung Quốc, đảm bảo các phản hồi phù hợp với "giá trị cốt lõi xã hội chủ nghĩa".

Ví dụ:

Khi được hỏi "Đài Loan có phải là một phần của Trung Quốc không?", mô hình trả lời rằng đó là một phần "không thể tách rời" của Trung Quốc, phù hợp với quan điểm của chính phủ Trung Quốc nhưng mâu thuẫn với cách nhìn nhận của nhiều nước khác.
Những câu hỏi về sự kiện như Quảng trường Thiên An Môn thường không nhận được câu trả lời rõ ràng.

Điều này khiến QwQ-32B-Preview chịu nhiều hạn chế khi được triển khai tại các thị trường quốc tế, nơi sự trung lập và khách quan là yếu tố quan trọng.

Tính mở và giấy phép Apache 2.0

QwQ-32B-Preview được phát hành theo giấy phép Apache 2.0, cho phép sử dụng trong các ứng dụng thương mại. Tuy nhiên, chỉ một số thành phần của mô hình được công khai, khiến việc sao chép hoặc phân tích chi tiết về cấu trúc bên trong trở nên khó khăn.

Mức độ "mở" của mô hình AI hiện vẫn đang là chủ đề gây tranh cãi. Trong trường hợp này, QwQ-32B-Preview nằm ở mức trung gian giữa "đóng" (chỉ cung cấp API) và "mở" hoàn toàn (công khai mô hình, tham số, và dữ liệu huấn luyện).

Hướng đi mới trong phát triển AI

Sự ra đời của QwQ-32B-Preview và các mô hình tư duy khác phản ánh sự chuyển dịch trong cách tiếp cận phát triển AI. Các "luật mở rộng" (scaling laws) – quan niệm rằng tăng quy mô dữ liệu và sức mạnh tính toán sẽ luôn cải thiện khả năng của mô hình – đang dần mất đi tính hiệu quả.

Để khắc phục, các nhà nghiên cứu đang tập trung vào những kỹ thuật mới, như test-time compute (tăng cường tính toán trong quá trình suy luận). Đây chính là công nghệ nền tảng cho các mô hình tư duy như o1 và QwQ-32B-Preview, giúp AI có thêm thời gian và tài nguyên để hoàn thành nhiệm vụ.

Không chỉ Alibaba, Google cũng đang đầu tư mạnh mẽ vào các mô hình tư duy với đội ngũ hơn 200 người và hệ thống tính toán tiên tiến.

Tương lai của QwQ-32B-Preview và mô hình tư duy

QwQ-32B-Preview là một bước tiến lớn trong lĩnh vực AI, đặc biệt là về khả năng tư duy và giải quyết các bài toán phức tạp. Tuy nhiên, để cạnh tranh trên quy mô toàn cầu, Alibaba cần khắc phục các hạn chế về chính trị và hiệu năng.

Trong bối cảnh các công ty lớn như OpenAI và Google cũng đang đẩy mạnh nghiên cứu mô hình tư duy, tương lai của lĩnh vực này sẽ đầy tiềm năng nhưng cũng không kém phần cạnh tranh. QwQ-32B-Preview, với sự linh hoạt và tiềm năng của mình, hứa hẹn sẽ đóng góp quan trọng vào cuộc đua công nghệ AI toàn cầu.