Theo số liệu mới nhất từ nền tảng OpenRouter vào cuối tháng 2, cán cân quyền lực trong thế giới AI đang có sự dịch chuyển đáng kinh ngạc. Các mô hình ngôn ngữ lớn (LLM) của Trung Quốc không chỉ bắt kịp mà còn vượt qua đối thủ Mỹ về mức độ phổ biến và khối lượng công việc thực tế.
Cụ thể, ngôi vương hiện thuộc về MiniMax M2.5 - sản phẩm của một startup Trung Quốc đầy tham vọng. Mô hình này đã xử lý khoảng 1,7 nghìn tỷ token mỗi tuần, bỏ xa đại diện sừng sỏ nhất của Mỹ là Google Gemini 3 Flash Preview (997 tỷ token).
Đứng ở vị trí thứ ba là một cái tên khác từ Trung Quốc: DeepSeek V3.2 với 798 tỷ token. Ngoài ra, danh sách top đầu còn ghi nhận sự góp mặt của Kimi K2.5 (Moonshot AI) và GLM-5 (Zhipu AI), đều vượt mốc 600 tỷ token.

Bức tranh tổng thể cho thấy sự áp đảo rõ rệt. Trong tuần từ 16-22/2, tổng lượng token được xử lý bởi các mô hình Trung Quốc đã vọt lên con số kỷ lục 5,16 nghìn tỷ, trong khi các đối thủ Mỹ sụt giảm xuống còn 2,7 nghìn tỷ.
Đây là tuần thứ hai liên tiếp Trung Quốc dẫn trước, sau khi lần đầu tiên vượt mặt Mỹ vào tuần từ 9-15/2 với tỷ số 4,12 nghìn tỷ so với 2,94 nghìn tỷ.
Giới phân tích chỉ ra hai động lực chính thúc đẩy sự bùng nổ này:
Hiệu ứng mùa lễ: Nhu cầu ứng dụng AI tăng vọt trong dịp Tết Nguyên đán tại Trung Quốc và các nước châu Á.
Sự phổ biến của Tác nhân AI (AI Agent): Việc triển khai rộng rãi các tác nhân AI tự động hóa quy trình làm việc đã làm tăng đáng kể mức tiêu thụ dữ liệu.
OpenRouter xác nhận xu hướng tạo văn bản dài đang lên ngôi. Đặc biệt, MiniMax M2.5 đang thống trị phân khúc các tác vụ "hạng nặng" tiêu tốn từ 100.000 đến 1 triệu token - mức tiêu thụ điển hình cho các quy trình làm việc phức tạp dựa trên tác nhân AI.