Dans l’euphorie mondiale autour de l’intelligence artificielle, il y a deux écoles qui s’affrontent au niveau du financement : celle de l’artillerie lourde déployée par les Américains, comme en témoigne leur plan Stargate de 500 milliards de dollars, et celle qui ambitionne de rivaliser avec les leaders mondiaux avec peu de moyens. A l’heure actuelle, Argil appartient à la deuxième catégorie avec ses avatars IA hyperréalistes.
Lancée il y a à peine deux ans par Laodis Menard et Brivael Le Pogam, deux anciens de Teads, la startup tricolore a déjà connu plusieurs vies. Et pour cause, elle s’est d’abord concentrée sur le développement d’agents IA, avant de pivoter. «Les cas d’usage étaient trop limités et la vidéo m’intéressait beaucoup plus», confie Laodis Menard depuis les bureaux parisiens d'Argil nichés dans un immeuble haussmannien à deux pas du théâtre Mogador.
Les avatars ouvrent un nouveau champ des possibles dans la vidéo
Désormais, la société propose une plateforme pour générer des avatars vidéo en deux minutes à l’aide de l’intelligence artificielle. Pour cela, la jeune pousse tricolore réalise un «clone» de l’utilisateur pour lui permettre de créer facilement des vidéos, sans avoir besoin de matériel spécifique ou d’espace dédié. Cerise sur le gâteau, les avatars créés peuvent parler n’importe quelle langue. Argil s’était ainsi amusé à faire des deepfakes l’an passé de Barack Obama qui parle de mécanique quantique et de Mark Zuckerberg qui évoque la trigonométrie.
This is the AI version of Barack Obama teaching quantum mechanics to your kids in 1mn made with Argil AI
Imagine a world where the best actors will teach anything to anyone.
This is a new reality! pic.twitter.com/0z0pe0BX3f
— Brivael (@BrivaelLp) March 28, 2024
Cependant, il ne s’agissait que de mettre en avant les capacités bluffantes de l’entreprise française en matière de synchronisation labiale. L’expertise de la société dans le domaine offre de nouvelles perspectives aux personnes souhaitant réaliser des masterclass, aux créateurs de contenus ou encore aux médias qui disposent de volumes conséquents d'articles pouvant être transformés en vidéos. Pour en bénéficier, des abonnements sont proposés : d’une poignée de dollars pour un particulier à 1 500 dollars pour les entreprises, avec des licences pour chaque avatar.
«Cela permet de réduire considérablement les coûts et donc de rendre la vidéo vidéo beaucoup plus accessible à n’importe qui. Auparavant, ça me prenait beaucoup de temps de faire des vidéos sur TikTok. Mais les avatars changent totalement la donne. Le marché va être très rapidement multiplié par 100. En deux clics, quelqu’un qui n’est pas dans cet univers va pouvoir s’en servir comme levier marketing sans effort», estime Laodis Menard. Le marché de la génération d'avatars vidéo devrait atteindre 3 milliards de dollars à l’horizon 2032, contre à peine plus d’un demi-milliard à l’heure actuelle.
3 mois dans la «machine à laver» de Y Combinator
Après avoir réalisé un pivot décisif en novembre 2023, Argil a réussi à intégrer l’an passé le prestigieux accélérateur américain Y Combinator. Le patron de la société et six autres collaborateurs se sont ainsi envolés pour San Francisco pour prendre part au «batch» estival de la structure qui a propulsé Airbnb, Dropbox, Stripe ou encore Coinbase. «YC, c’est trois mois de machine à laver. On était en mode hackathon», se souvient Laodis Menard. Avant d’ajouter : «Dans la Silicon Valley, je retiens l’humilité des gens et la densité monstrueuse de talents. Cela élève les ambitions.» En sortie de son passage au sein de l’accélérateur californien, Argil a bouclé une levée de fonds de 4,9 millions d’euros avec EQT Ventures, le célèbre youtubeur Kwebblekop et Charles Gorintin, co-fondateur et CTO d'Alan.
Incubée au départ à Station F, la startup tricolore poursuit désormais sa route dans des locaux situés à Trinité, au cœur de Paris. Elle les partage avec une autre jeune pousse de l’IA, Phospho, qui est également passée par Y Combinator. «On voulait avoir un mini-YC à Paris», sourit Laodis Menard. C’est dans ces locaux qu’Argil a élaboré son nouveau modèle de génération d’avatars, que son patron annonce en exclusivité à Maddyness. «Avec la première version lancée l’an passé qui clone le visage en quelques minutes de vidéo, on pouvait scripter n’importe quel texte en n’importe quelle langue, mais on avait un peu de retard. La synchronisation labiale n’était pas parfaite, les États-Unis étaient encore en avance… Mais avec ce modèle, on devient les meilleurs du monde sur le respect du style de la personne», se réjouit Laodis Menard. Avant de conclure : «On a rattrapé les Américains avec 200 millions de dollars de moins. Et en seulement un an et demi !»
De quoi donner le sourire à cet entrepreneur franco-américain qui prévoit de multiplier les allers-retours entre Paris et les États-Unis cette année. Mais si la Californie et surtout Los Angeles revêtent un enjeu commercial important, Laodis Menard n’entend pas abandonner les racines françaises de la société. «Notre équipe technique est en France, nous avons des talents incroyables ici. Nous serions idiots d’aller construire notre société dans la Valley», observe-t-il. C’est donc au cœur de Paris qu’Argil compte bien devenir une référence mondiale des avatars vidéo générés par l’IA.