Suchir Balaji, ancien chercheur en intelligence artificielle chez OpenAI, a révélé les pratiques controversées de l’entreprise concernant l’utilisation des données protégées par le droit d’auteur. Balaji, qui a quitté OpenAI en août 2024 après presque quatre ans, explique qu’il a participé à la collecte massive de données en ligne pour développer des technologies telles que ChatGPT. À l’époque, il pensait que la start-up de San Francisco pouvait exploiter librement ces données, y compris celles protégées par des droits d’auteur, sans se poser de questions légales.
« Dans le cadre d’un projet de recherche, on peut, en général, utiliser n’importe quelles données », déclare Balaji au New York Times. « C’était l’état d’esprit à l’époque. »
Un Revirement de Conscience
Balaji a commencé à reconsidérer la légitimité de ces pratiques après la sortie de ChatGPT fin 2022. Il estime désormais que l’utilisation de données protégées pour former des modèles d’intelligence artificielle viole le droit d’auteur et nuit à l’écosystème internet. Il a quitté l’entreprise, affirmant qu’il ne souhaitait plus contribuer à une technologie qui, selon lui, cause plus de mal que de bien à la société. Balaji se distingue par sa prise de position publique, un geste rare parmi les employés des grandes entreprises d’IA.
Les Conséquences Légales et Économiques
Plusieurs créateurs de contenu, dont le New York Times, ont intenté des poursuites contre OpenAI, accusant l’entreprise d’utiliser illégalement des matériaux protégés par le droit d’auteur. En décembre 2023, le New York Times a poursuivi OpenAI et Microsoft pour avoir utilisé des millions d’articles de presse afin de former des chatbots concurrents. Balaji soutient que ces technologies imitent et remplacent directement les contenus existants, mettant en danger la viabilité commerciale des services en ligne.
L’Argument du Fair Use et les Défis Juridiques
OpenAI défend ses pratiques en invoquant le principe du “fair use“, affirmant que l’utilisation des données est légale et justifiée par des précédents juridiques. L’entreprise argue que ses modèles transforment les données de manière substantielle, sans directement concurrencer les œuvres originales. Cependant, Balaji réfute ces affirmations, expliquant que les modèles génératifs d’OpenAI ne produisent pas de contenu fondamentalement nouveau. Il a même publié une analyse mathématique pour démontrer que les sorties de ces modèles ne respectent pas les critères du “fair use”.
Des experts juridiques comme Mark Lemley de l’Université Stanford soutiennent que, même si certains contenus générés par l’IA ressemblent aux données d’origine, la plupart diffèrent suffisamment pour être légitimes. Néanmoins, d’autres, dont Balaji, appellent à une régulation plus stricte pour encadrer l’usage des technologies IA et protéger les créateurs de contenu.
L’Appel à la Réglementation
Selon Balaji, la solution à ces problèmes réside dans une intervention législative. Il plaide pour que le Congrès américain crée des lois spécifiques pour encadrer les pratiques des entreprises d’intelligence artificielle, un secteur en évolution rapide et qui menace de bouleverser l’économie de l’internet. Cette perspective est partagée par plusieurs experts, qui soulignent la nécessité urgente d’adapter les lois actuelles aux nouvelles réalités de l’intelligence artificielle.
Cette controverse met en lumière les défis juridiques et éthiques auxquels sont confrontées les entreprises d’IA alors qu’elles continuent à transformer des données en produits rentables. Le débat sur le “fair use” et les droits d’auteur pourrait redéfinir l’avenir de l’IA et son impact sur l’économie numérique mondiale.
Qu’est-ce que OpenAI ?
OpenAI est une entreprise de recherche en intelligence artificielle fondée en 2015 par Elon Musk, Sam Altman et d’autres entrepreneurs. Son objectif est de développer des technologies d’IA sûres et bénéfiques pour l’humanité. OpenAI est à l’origine de modèles d’IA avancés comme GPT-3 et GPT-4, utilisés dans des applications telles que ChatGPT et DALL·E. L’entreprise explore divers domaines de l’IA, tout en mettant l’accent sur l’impact éthique et social de ses technologies.