Cette semaine, nous avons eu le plaisir de recevoir Anastasia Stasenko, cofondatrice de Pleias, une startup qui révolutionne l'IA en construisant des modèles frugaux, transparents et souverains. La startup se fonde sur un principe clé : une IA respectueuse des droits d'auteur, exploitant des corpus de haute qualité et fonctionnant sans GPU, même dans des contextes limités.

Quelques moments forts de cet échange :

Le choix stratégique des données open-source : Pleias a élaboré le plus vaste corpus de données en libre accès jamais créé (2 trillions de tokens !), en intégrant des textes patrimoniaux, des archives publiques, et des bases de données scientifiques. À l'inverse d'autres modèles qui utilisent des données protégées par le droit d'auteur, Pleias mise sur la transparence.

L'importance capitale de l'open source pour le futur de l'IA : Anastasia promeut un paradigme où les sociétés et les institutions utilisent des IA claires et modifiables, libres des contraintes des solutions propriétaires opaques.

DeepSeek, une révélation chinoise qui redéfinit les normes : Comment ce modèle a-t-il surpassé tous les benchmarks ? Anastasia partage son interprétation et s'interroge sur le manque de dynamisme de l'Europe dans l'adoption de ces méthodes d'optimisation extrêmes.

L'influence globale de l'IA frugale : Les modèles développés par Pleias sont déjà déployés sur des Raspberry Pi au Sénégal, où ils soutiennent le personnel de santé dans des régions isolées. Un changement de paradigme significatif !

Citation marquante : "OpenAI nous disait qu’il était impossible d’entraîner un modèle d’IA performant uniquement avec des données libres de droit. On leur a prouvé qu’ils avaient tort."

Livre recommandé par Anastasia : "Il est difficile d’être un dieu" des frères Strougatski, une réflexion fascinante sur le progrès et le rôle de ceux qui le façonne.