Với sự phát triển nhanh chóng của trí tuệ nhân tạo (AI), việc có một định nghĩa rõ ràng về AI mở (open source AI) trở nên vô cùng cần thiết. Gần đây, Tổ chức Mã Nguồn Mở (Open Source Initiative - OSI) đã công bố phiên bản 1.0 của định nghĩa AI Mở (Open Source AI Definition - OSAID). Định nghĩa này không chỉ cung cấp tiêu chuẩn để xác định một mô hình AI có thực sự mở hay không mà còn tạo ra cơ sở cho các nhà phát triển và nhà quản lý chính sách có thể đồng bộ trong cách hiểu và áp dụng AI mở.
Theo Stefano Maffulli, Phó Giám đốc điều hành của OSI, một trong những động lực lớn của việc có định nghĩa rõ ràng là để chính phủ và các nhà phát triển AI có thể hiểu rõ về khái niệm này. Ông nhấn mạnh rằng các nhà quản lý đã bắt đầu quan tâm đến lĩnh vực này và đã có những nỗ lực để công nhận AI mở một cách chính thức. Đặc biệt, các cơ quan như Ủy ban Châu Âu đang tìm cách tạo ra các quy định cho AI mở.
Với định nghĩa này, một mô hình AI được coi là mở khi nó cung cấp đủ thông tin về thiết kế của nó để người khác có thể "tái tạo" nó một cách đáng kể. Điều này có nghĩa là, nhà phát triển cần phải công bố đầy đủ chi tiết về dữ liệu đào tạo của mô hình, bao gồm nguồn gốc, cách thức xử lý, cũng như cách mà dữ liệu này có thể được thu thập hoặc cấp phép.
OSAID cũng chỉ ra những quyền sử dụng mà các nhà phát triển nên có khi làm việc với AI mở, như quyền tự do sử dụng mô hình cho bất kỳ mục đích nào và khả năng sửa đổi nó mà không cần xin phép. Quan trọng nhất, họ cũng nên có khả năng xây dựng trên nền tảng của mô hình đó.
Mặc dù OSI không có cơ chế thực thi nào mạnh mẽ để yêu cầu các nhà phát triển tuân thủ OSAID, tổ chức này hy vọng rằng cộng đồng AI sẽ tự nguyện không công nhận những mô hình được mô tả là "mở" nhưng không đáp ứng được tiêu chí của OSAID.
Trên thực tế, nhiều công ty lớn đã sử dụng thuật ngữ “mở” để mô tả chiến lược phát hành mô hình AI của họ, nhưng chỉ một số ít đáp ứng đủ tiêu chí của OSAID. Một ví dụ điển hình là Meta, công ty này yêu cầu các nền tảng có hơn 700 triệu người dùng hàng tháng phải xin giấy phép đặc biệt để sử dụng các mô hình Llama của họ. Điều này đặt ra câu hỏi liệu các mô hình này có thực sự mở hay không, khi mà quyền truy cập và sửa đổi bị hạn chế.
Một nghiên cứu gần đây từ các tổ chức như Signal Foundation cho thấy rằng nhiều mô hình “mở” thực tế chỉ mở về tên gọi. Dữ liệu cần thiết để đào tạo các mô hình này thường được giữ bí mật, và những công nghệ để tinh chỉnh chúng lại quá phức tạp đối với nhiều nhà phát triển. Kết quả là, thay vì mở rộng khả năng tiếp cận AI, những dự án “mở” này lại củng cố và mở rộng quyền lực tập trung trong ngành công nghiệp công nghệ.
Meta đã không ngần ngại bày tỏ quan điểm của mình về định nghĩa OSAID. Họ cho rằng định nghĩa này không bao quát hết các phức tạp của mô hình AI hiện đại và phản bác lại các ý kiến cho rằng họ đã lạm dụng thuật ngữ "mở". Công ty này lập luận rằng các điều khoản đi kèm với chính sách sử dụng của họ đóng vai trò như những rào cản để ngăn chặn những ứng dụng có hại.
Bên cạnh đó, Meta cũng cho biết họ đang áp dụng cách tiếp cận cẩn trọng trong việc chia sẻ chi tiết về mô hình, bao gồm cả dữ liệu đào tạo, đặc biệt khi các quy định như luật minh bạch đào tạo ở California ngày càng phát triển.
Nhiều người trong ngành công nghệ cho rằng định nghĩa hiện tại chưa đi đủ xa, đặc biệt là trong cách thức xử lý quyền cấp phép dữ liệu đào tạo. Luca Antiga, Giám đốc Công nghệ của Lightning AI, cho rằng một mô hình có thể đáp ứng tất cả các yêu cầu của OSAID nhưng vẫn không đảm bảo rằng dữ liệu sử dụng để đào tạo là công khai.
Maffulli thừa nhận rằng định nghĩa này cần phải được cập nhật thường xuyên, và OSI đã thành lập một ủy ban có trách nhiệm theo dõi cách OSAID được áp dụng và đề xuất các sửa đổi cho các phiên bản tương lai.
Với sự phát triển nhanh chóng của AI, việc có một định nghĩa rõ ràng về AI mở là rất quan trọng. Định nghĩa OSAID của OSI không chỉ tạo ra một tiêu chuẩn chung mà còn thúc đẩy sự minh bạch và trách nhiệm trong lĩnh vực này. Tuy nhiên, còn nhiều thách thức và bất đồng ý kiến cần được giải quyết để bảo đảm rằng AI thực sự mở và có thể phục vụ lợi ích của tất cả mọi người.