C'est quoi l'"open source" ou code source ouvert ?

Quand un logiciel est en "open source", l'accès à son code de programmation est libre : les développeurs doivent avoir "tous les éléments pour pouvoir le reproduire, le modifier, le reconstruire et l'adapter", explique Michel-Marie Maudet, directeur général de Linagora, un éditeur de logiciels libres français. Les promoteurs de l'"open source" s'opposent historiquement aux entreprises qui veulent protéger leur propriété intellectuelle, source de revenus. Certaines technologies majeures, comme le système d'exploitation Linux, le navigateur internet Firefox de Mozilla et le serveur web Apache, sont ouvertes. Mais ces programmes à code source ouvert peuvent être plus difficiles à manier pour les non-initiés, nécessitent une communauté d'utilisateurs investie pour être maintenus et sont peu viables financièrement.

Mistral, DeepSeek, OpenIA... qui est open source ?

Les IA génératives, comme le robot conversationnel ChatGPT, offrent de nombreuses fonctionnalités : écrire des paroles de chansons ou proposer une recette en fonction de ce qu'il y a au réfrigérateur. Elles s'appuient sur un grand modèle de langage (LLM), formé à partir d'immenses quantités de textes. Mais à l'inverse des produits d'OpenAI ou d'Anthropic, des sociétés comme le géant américain Meta, la française Mistral AI et le chinois DeepSeek laissent les développeurs télécharger et utiliser gratuitement leurs modèles. Elles permettent également à d'autres start-up de s'en servir pour développer leurs propres modèles. "DeepSeek a bénéficié de la recherche en source ouverte", a écrit sur Threads Yann LeCun, directeur scientifique pour l'IA au sein de Meta. "Ils ont trouvé de nouvelles idées et les ont développées en s'appuyant sur le travail d'autres personnes".

Vraiment ouverts ? Appliqué à l'IA, le concept d'"open source" est "très mal utilisé", tempère Michel-Marie Maudet. La plupart des modèles qui se réclament de cette philosophie donnent "un accès plus ou moins restreint au code source et à la recette de construction du modèle". Thomas Wolf, cofondateur de la plateforme d'IA en accès libre franco-américaine Hugging Face, souligne à l'AFP que si "la sortie de DeepSeek-R1 est une formidable opportunité pour la communauté 'open source', tout n'a pas été publié", à commencer par "les jeux de données et le code utilisés pour l'entraîner". Pour autant, Mark Surman, patron de Mozilla et fervent défenseur de l'"open source", constate: "certaines choses, qui sont, même un peu, ouvertes - nous aimerions les voir encore plus ouvertes - commencent à permettre à la communauté mondiale de l'IA de collaborer pour rendre l'IA meilleure et plus accessible". Des plateformes totalement ouvertes existent, mais sont plus confidentielles, comme Bloom, née de l'initiative BigScience, ou plus récemment l'agent conversationnel Lucie, IA française développée par Linagora qui a connu des déboires à son lancement.

Bientôt la norme dans le secteur de l'IA ?

"Le fait qu'il y ait cette communauté mondiale qui coopère permet d'être plus rapide, plus nombreux et plus fort", explique Michel-Marie Maudet. "A un moment où la sécurité compte, où la croissance économique compte avec l'IA, l'open source est la clé", veut croire Mark Surman, qui espère que ces modèles ouverts deviennent la norme dans le secteur de l'IA. Pour assurer un accès plus large à cette technologie, et notamment dans les pays du sud, "nous devons développer des systèmes open source", a insisté mardi le Premier ministre indien Narendra Modi, en clôture du sommet pour l'IA à Paris. Pour Michel-Marie Maudet, l'arrivée tonitruante de la Chine dans la course à l'IA générative via un modèle ouvert comme DeepSeek montre aussi "une volonté de réponse aux grands modèles fermés" américains. "L''open source' est un outil parmi d'autres d'influence géopolitique et géostratégique", fait-il valoir, et ouvrir son utilisation permet de "créer le buzz" et d'assurer une publicité mondiale.