Technologie

Initiative Open Source : Vers une Définition de l’IA Open Source

L’Initiative Open Source (OSI) et ses partenaires s’approchent d’une définition de l’IA open source. Si tout se passe comme prévu, Stefano Maffulli, directeur exécutif de l’OSI, devrait dévoiler cette définition lors de l’événement All Things Open à la fin octobre. Cependant, certains leaders du mouvement open source semblent déjà réticents à cette initiative.

Contexte et Défis

De nombreuses entreprises, notamment Meta, prétendent que leurs modèles d’IA sont open source, mais cette affirmation est loin de la réalité. En réponse à cette situation, l’OSI, accompagnée de plusieurs autres organisations, travaille à l’élaboration d’une définition claire de l’IA open source, similaire à celle qu’elle a établie pour les logiciels open source.

Dans leur dernier projet, la Définition de l’IA Open Source – version 0.0.9, présentée lors de KubeCon et de l’Open Source Summit en Asie, des modifications significatives ont été apportées, suscitant des réactions mitigées au sein de la communauté open source. Parmi ces changements, on note :

  • Rôle des données d’entraînement : Bien que les données d’entraînement soient utiles, elles ne sont pas indispensables pour modifier les systèmes d’IA. Cette décision prend en compte les complexités liées au partage des données, notamment les préoccupations juridiques et de confidentialité. Le projet classe les données d’entraînement en trois catégories : ouvertes, publiques et non partageables, chacune avec des directives spécifiques pour améliorer la transparence et la compréhension des biais des systèmes d’IA.

  • Séparation de la liste de contrôle : La liste d’évaluation des licences a été dissociée du document principal de définition, en accord avec le Modèle d’Ouverture (MOF). Cette séparation permet de se concentrer sur l’identification de l’IA open source tout en maintenant des principes généraux dans la définition.

Jim Zemlin, directeur exécutif de la Linux Foundation, a expliqué lors de l’événement que le MOF « permet d’évaluer si un modèle est ouvert ou non, offrant ainsi un moyen de noter les modèles ».

Les Niveaux d’Ouverture

Zemlin a également précisé qu’il existe trois niveaux d’ouverture dans le MOF. Le premier niveau, le plus élevé, est une définition de science ouverte où toutes les données et instructions nécessaires à la création du modèle doivent être accessibles. Le deuxième niveau inclut des éléments qui ne sont pas entièrement ouverts, mais la majorité l’est. Enfin, le troisième niveau concerne des données qui peuvent ne pas être disponibles, bien que des descriptions des ensembles de données soient accessibles.

Cependant, cette approche ne convainc pas tout le monde. Tara Tarakiyee, technologue FOSS pour le Sovereign Tech Fund, a déclaré : « Un système qui ne peut être construit qu’avec des données propriétaires ne peut être que propriétaire. C’est une vérité évidente. »

Tarakiyee a ajouté que « la nouvelle définition contient tant de termes ambigus qu’on pourrait y voir une porte dérobée pour que des systèmes d’IA essentiellement propriétaires se qualifient d’open source ».

Réactions de la Communauté

Julia Ferraioli, une figure du mouvement open source, a exprimé son désaccord : « La Définition de l’IA Open Source dans sa version actuelle dilue la signification même de l’open source. Je suis stupéfaite que davantage de partisans de l’open source ne voient pas ce risque imminent. »

Tom Callaway, stratège technique principal en open source chez AWS, a également critiqué le projet avant sa publication : « Je crois fermement que la définition actuelle de l’IA open source ne garantit pas que les systèmes d’IA préservent les droits illimités des utilisateurs à les exécuter, copier, distribuer, étudier, modifier et améliorer. »

Callaway a exprimé sa déception face à la décision de l’OSI de choisir une définition défaillante, espérant qu’ils auraient pu viser plus haut. Il a conclu en se demandant qui pourrait prendre les rênes à leur place.

Conclusion : Un Débat Durable

La question demeure : la communauté adoptera-t-elle la Définition de l’IA Open Source comme la meilleure voie à suivre ? Ce débat pourrait perdurer pendant des années. Il est légitime de se demander si cela ne se transformera pas en une simple querelle technique, tandis que l’IA continuera d’évoluer sans faire référence à « l’open source », sauf à des fins marketing.

Show Comments (0)
Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *