Startup xAI của Elon Musk đã quyết định không mở rộng việc sử dụng dịch vụ đám mây Oracle để hỗ trợ các khối lượng công việc huấn luyện AI trong tương lai.
Theo các báo cáo, cuộc đàm phán giữa hai bên đã kết thúc sau khi Oracle thừa nhận không thể đáp ứng yêu cầu về thời gian của xAI. Musk đã xác nhận thông tin này trên X (Twitter), cho biết rằng những nỗ lực của startup "phụ thuộc vào việc trở thành người nhanh nhất, chúng tôi phải tự mình nắm quyền kiểm soát, chứ không phải là người ngồi sau tay lái."
Trước đây, xAI đã sử dụng máy chủ Oracle Cloud để huấn luyện các mô hình ngôn ngữ Grok và Grok 1.5. Tuy nhiên, hiện tại, công ty đang xây dựng cụm huấn luyện riêng, cũng như một siêu máy tính khổng lồ ở Memphis để cung cấp năng lượng cho các nỗ lực huấn luyện trong tương lai.
Startup này dự kiến sẽ phát hành Grok 2 vào tháng 8 và có kế hoạch phát triển Grok 3. Tuy nhiên, Musk tin rằng mô hình này cần tới 100.000 GPU H100 từ Nvidia để huấn luyện Grok 3 một cách hiệu quả.
xAI từng là một trong những khách hàng dịch vụ đám mây lớn nhất của Oracle, sử dụng khoảng 16.000 GPU Nvidia để huấn luyện dòng mô hình Grok. Tuy nhiên, startup của Musk liên tục tăng nhu cầu về phần cứng.
Larry Ellison, người sáng lập và CTO của Oracle, đã chia sẻ trong cuộc gọi báo cáo thu nhập quý 2 của công ty rằng xAI "muốn nhiều GPU hơn số lượng chúng tôi đã cung cấp cho họ. Chúng tôi đã cung cấp cho họ khá nhiều, nhưng họ muốn nhiều hơn, và chúng tôi đang trong quá trình cung cấp thêm cho họ."
Mong muốn về phần cứng của xAI xuất hiện khi Musk cho biết ông hình dung Grok 3 sẽ ngang bằng "hoặc vượt qua" GPT-5, mô hình ngôn ngữ chưa được phát hành của OpenAI được cho là bước nhảy vọt tiếp theo trong lĩnh vực mô hình ngôn ngữ.
Mặc dù mới chỉ thành lập được một năm, startup này đã được định giá 24 tỷ USD, nhưng Musk muốn đẩy nhanh tốc độ để xAI cạnh tranh với OpenAI.
"Lý do chúng tôi quyết định tự phát triển hệ thống tiếp theo và sử dụng 100.000 H100 là vì khả năng cạnh tranh cơ bản của chúng tôi phụ thuộc vào việc nhanh hơn bất kỳ công ty AI nào khác. Đây là cách duy nhất để bắt kịp," Musk chia sẻ trên X.
Musk cho biết hệ thống làm mát bằng chất lỏng sẽ bắt đầu được huấn luyện vào cuối tháng này. Một siêu máy tính AI khổng lồ cuối cùng sẽ hỗ trợ cụm này, với hy vọng của xAI là trở thành siêu máy tính lớn nhất thế giới.
Mặc dù đánh giá cao Oracle, Musk đã chọn Nvidia, Dell và Supermicro để xây dựng cụm huấn luyện cơ sở hạ tầng mạnh mẽ nhất thế giới "với khoảng cách lớn."