Sau phiên phát biểu chính tại Hội nghị các nhà phát triển toàn cầu WWDC 2026 ngày 8/6, Apple đã tổ chức một buổi thảo luận công nghệ chuyên sâu với giới truyền thông. Sự kiện có sự góp mặt của các lãnh đạo cấp cao bao gồm ông Craig Federighi (Phó chủ tịch cấp cao về phần mềm), Amar Subramanya (Phó chủ tịch về AI), Mike Rockwell (Đứng đầu bộ phận Siri) và Sebastien Marineau-Mes (Phó chủ tịch phần mềm) nhằm bóc tách toàn diện kiến trúc trí tuệ nhân tạo mới của hãng.

Từ trái qua: Amar Subramanya, Phó chủ tịch về trí tuệ nhân tạo của Apple; Mike Rockwell, người đứng đầu bộ phận Siri; Sebastien Marineau-Mes, Phó chủ tịch phần mềm và Craig Federighi, Phó chủ tịch cấp cao về phần mềm. Ảnh: Internet.
Trước những tin đồn về việc Apple sử dụng hạ tầng của đối thủ, Phó chủ tịch Craig Federighi khẳng định hãng hoàn toàn không dùng Google Gemini, cơ sở hạ tầng tìm kiếm Google Search hay bất kỳ mô hình thương mại nào của Google làm "xương sống" cho tri thức máy học. Thay vào đó, hai ông lớn đã hợp tác để phát triển một hệ thống mô hình độc quyền mang tên Apple Foundation Model (AFM) thế hệ ba.
Hệ thống AFM thế hệ ba bao gồm 5 mô hình chuyên biệt, được tối ưu hóa riêng cho chip cấu trúc Apple Silicon, huấn luyện bằng dữ liệu độc quyền của Apple và tinh chỉnh thông qua phương pháp học tăng cường chắt lọc từ kết quả đầu ra của các mô hình tiên phong từ Gemini:
|
Phạm vi vận hành |
Tên mô hình AI |
Đặc tính kỹ thuật và vai trò cốt lõi trong hệ thống |
|
Trên thiết bị (On-device) |
AFM Core |
Vận hành dựa trên cấu trúc dày dặn (dense architecture). |
|
AFM Core Advanced |
Kiến trúc thưa (sparse architecture), đa phương thức nguyên bản. Hỗ trợ các tính năng tương tác phức tạp và giọng nói biểu cảm trực tiếp tại chỗ không cần máy chủ. |
|
|
Trên đám mây (Cloud) |
AFM Cloud |
Được tối ưu hóa tối đa cho độ trễ thấp và tiết kiệm chi phí điện toán đám mây. |
|
AFM Cloud Image |
Chuyên trách xử lý, tạo và chỉnh sửa hình ảnh (ví dụ: tính năng Định lại khung mới của Apple Intelligence). |
|
|
AFM Cloud Pro |
Mô hình mạnh mẽ nhất dành cho tác nhân AI (AI Agent) và tác vụ suy luận phức tạp, chất lượng ngang tầm các mẫu Gemini tiên tiến nhất. |
Để vận hành mô hình đám mây mạnh nhất AFM Cloud Pro, Apple đã công bố bước ngoặt lớn cho dịch vụ điện toán đám mây riêng tư Private Cloud Compute (PCC) bằng việc bắt tay với Google và Nvidia.
Mở rộng hạ tầng đám mây: Hạ tầng PCC (vốn trước đây chỉ giới hạn trên các máy chủ Apple Silicon trong trung tâm dữ liệu của Apple) giờ đây được mở rộng sang các hệ thống Google Cloud chạy GPU Nvidia mới nhất.
Hàng rào bảo mật nghiêm ngặt: Phó chủ tịch Sebastien Marineau-Mes khẳng định các chip Nvidia được cấu hình đặc biệt để hoàn toàn không thể đọc được nội dung trên máy chủ Apple. Dữ liệu người dùng chỉ được gửi đi dưới một thao tác cụ thể, được xóa sạch hoàn toàn ngay sau khi xử lý xong yêu cầu và hệ thống bảo mật tới mức chính các kỹ sư Apple cũng không thể truy cập để gỡ lỗi khi đang vận hành.
Kiểm chứng độc lập: Toàn bộ mã nguồn hệ thống phần mềm triển khai đều do Apple kiểm soát hoàn toàn, cho phép các nhà nghiên cứu độc lập tham gia kiểm chứng để minh chứng cho cam kết minh bạch dữ liệu.
Ông Mike Rockwell giới thiệu về các mô hình Apple Foundation Model thế hệ ba. Ảnh: Internet.
Giám đốc bộ phận Siri Mike Rockwell thừa nhận Apple đã quyết định "phá bỏ hoàn toàn" phiên bản Siri cũ để xây dựng lại từ đầu dựa trên mô hình AFM đa phương thức nguyên bản (natively multimodal). Quyết định này giúp Siri có khả năng hiểu, xử lý và kết hợp đồng thời văn bản, hình ảnh, âm thanh, video một cách nhất quán trên toàn bộ dải thiết bị (iPhone, iPad, Mac, Vision Pro).
Nhờ sự kết hợp giữa xử lý on-device và điện toán đám mây PCC, Siri mới có thể khai thác sâu các ngữ cảnh cá nhân hóa của người dùng để thực thi các tác vụ liên kết phức tạp:
Thấu hiểu dữ liệu nội bộ: Trong màn demo thực tế, khi được hỏi về các món đồ mọi người sẽ mang tới bữa tiệc BBQ, Siri tự động quét các tin nhắn lưu trong máy để tổng hợp thông tin chi tiết (ai mang dưa hấu, ai mang mỳ ống), sau đó chủ động kết hợp với dữ liệu trên Internet công cộng để gợi ý các loại đồ uống phù hợp nhất.
Nhận diện nội dung trên màn hình (On-screen awareness): Người dùng có thể nhìn một bức ảnh mây và hỏi trực tiếp: "Tại sao đám mây lại trông như này?", Siri sẽ phân tích hình ảnh hiển thị để giải đáp. Hoặc khi đang đọc một tin nhắn mời xem ca nhạc vào một ngày cụ thể, người dùng chỉ cần hỏi: "Tôi có rảnh vào ngày đó không?", Siri sẽ tự đối chiếu với lịch trình cá nhân để phản hồi.
Apple nhấn mạnh Siri mới không còn là một chatbot rời rạc đơn thuần mà là một công cụ hội thoại tích hợp sâu. Hệ thống sẽ sở hữu giao diện ứng dụng riêng biệt, giúp người dùng dễ dàng quản lý, rà soát và quay lại tương tác với các cuộc hội thoại lịch sử trước đó.