Google vừa chính thức công bố Gemini 3 Flash, phiên bản được phát triển dựa trên kiến trúc của Gemini 3 trình làng hồi tháng trước. Ngay lập tức, mô hình này sẽ thay thế Gemini 2.5 Flash để trở thành "trái tim" mặc định cho ứng dụng Gemini trên toàn cầu và Chế độ AI trong công cụ tìm kiếm của hãng.
Điểm nhấn ấn tượng nhất của Gemini 3 Flash nằm ở hiệu suất vượt trội. Theo công bố, mô hình này chạy nhanh gấp ba lần so với phiên bản cao cấp tiền nhiệm là Gemini 2.5 Pro. Đáng chú ý, trong các tác vụ đòi hỏi tư duy logic, nó sử dụng ít hơn 30% lượng token (đơn vị dữ liệu), giúp tối ưu hóa đáng kể chi phí vận hành tổng thể.
Bà Tulsee Doshi, Giám đốc cấp cao phụ trách các mô hình Gemini tại Google, chia sẻ với TechCrunch: "Chúng tôi định vị Flash như một mô hình mạnh mẽ và đáng tin cậy. Nếu xem xét giá đầu vào và đầu ra, Flash rõ ràng là lựa chọn kinh tế hơn nhiều, cho phép các công ty xử lý khối lượng tác vụ lớn mà không lo về chi phí".
Đối với giới phát triển phần mềm, Gemini 3 Flash mang đến một mức giá cực kỳ cạnh tranh: 0,50 USD cho một triệu token đầu vào và 3 USD cho một triệu token đầu ra.
Không chỉ rẻ, nó còn rất giỏi viết code. Trong bài kiểm tra SWE-bench Verified (tiêu chuẩn đo lường khả năng viết phần mềm của AI), Gemini 3 Flash đạt điểm số 78%. Kết quả này giúp nó vượt qua cả "người anh em" Gemini 3 Pro (76,2%) và bỏ xa bản cũ Gemini 2.5 Flash (60,4%), chỉ chịu đứng sau sát nút so với đối thủ GPT-5.2 (80%). Điều này biến Gemini 3 Flash trở thành lựa chọn lý tưởng cho các quy trình làm việc nhanh, lặp lại và trích xuất dữ liệu quy mô lớn.

Với người dùng thông thường, Gemini 3 Flash thể hiện khả năng "hiểu" thế giới xung quanh một cách trực quan. Khả năng nhận diện đa phương thức (multimodal) cho phép người dùng tải lên video ngắn (như một trận đấu thể thao) để xin lời khuyên chiến thuật, hoặc một bản phác thảo tay để AI đoán ý đồ và hoàn thiện.
Mô hình cũng được cải thiện đáng kể trong việc nắm bắt ý định truy vấn, trả về các kết quả trực quan như bảng biểu, hình ảnh thay vì văn bản thuần túy. Thậm chí, người dùng có thể yêu cầu Gemini thiết kế nguyên mẫu (prototype) ứng dụng ngay trong khung chat chỉ bằng các câu lệnh đơn giản.
Động thái ra mắt Gemini 3 Flash của Google diễn ra chỉ một ngày sau khi OpenAI tung ra GPT Image 1.5 - trình tạo ảnh với tốc độ nhanh gấp 4 lần. Sự bám đuổi sát sao này cho thấy năm 2025 tiếp tục là một năm "rực lửa" của trí tuệ nhân tạo, khi các ông lớn không chỉ cạnh tranh về sức mạnh mô hình mà còn tối ưu hóa triệt để về tốc độ và giá thành để giành thị phần.