Alexa, Siri, Google Assistant: développés par les géants technologiques américains, des millions d'assistants vocaux ont fait leur entrée dans les foyers ces dernières années. Face à cette hégémonie, les acteurs français tentent de se frayer une voie, en se tournant notamment vers le marché des professionnels. "Lancés tôt dans la course de la technologie vocale", les Gafam (acronyme désignant les groupes américains Google, Apple, Facebook, Amazon et Microsoft) ont "rapidement préempté le marché", souligne une étude du cabinet Roland Berger, publiée l'été dernier.
En ce qui concerne la France, "elle est très avancée en termes de recherche académique mais très en retard en offre commerciale, comme pour les autres sujets liés à l'intelligence artificielle", souligne auprès de l'AFP Ghislain de Pierrefeu, associé au cabinet Wavestone. Malgré cette configuration, les entreprises françaises spécialisées dans les technologies vocales ne baissent pas les bras et multiplient les initiatives. Les Gafam "ont aidé à démocratiser la voix, mais ne savent pas faire certaines choses; nous pouvons être aussi bons sur certains sujets", commente auprès de l'AFP Florian Guichon, directeur des opérations et associé de Vivoka, rencontré lors du salon Voice Tech qui se tient jusqu'à mercredi à Paris. Créée en 2015, cette jeune pousse basée à Metz développe des solutions vocales sur-mesure à destination des entreprises, ciblant notamment l'hôtellerie, l'industrie, la distribution ou encore la banque.
Le marché des pros ? "Un boulevard"
"Le B2B (de professionnels à professionnels, NDLR), c'est un boulevard", estime auprès de l'AFP Yann Lechelle, ancien directeur des opérations de Snips, startup à l'origine d'une technologie de commande vocale fonctionnant sans internet, rachetée par Sonos, spécialiste américain des enceintes connectées, pour 37,5 millions de dollars. "Il y a un vrai marché pour les sociétés proposant des briques de technologie de reconnaissance vocale, cela peut intéresser des acteurs qui ont besoin d'une relation client et ne veulent pas la confier aux géants américains", abonde auprès de l'AFP Sylvain Chevallier, associé au sein du cabinet BearingPoint.
En s'associant à différents partenaires, l'opérateur Orange a par exemple développé conjointement avec l'Allemand Deutsche Telekom son assistant vocal Djingo, permettant à ses abonnés de mieux interagir avec ses différents services (télévision, téléphonie etc.) Mais pour pouvoir répondre à d'autres types de requêtes, l'enceinte connectée embarque également Alexa d'Amazon.
Pour certains, les lignes peuvent encore bouger. "Les Gafam ont une puissance écrasante, mais ça ne veut pas dire que c'est pérenne, les régulateurs, les lobbys et les acteurs peuvent mettre en place beaucoup de choses qui changent la donne", estime Yann Lechelle, rappelant que certains groupes ont déjà vu leur influence réduite à peau de chagrin, à l'instar de Yahoo. La question de l'utilisation des données personnelles, qui reste relativement opaque, pourrait notamment porter préjudice à certains géants américains.
Des voix pour entraîner les algorithmes
Pour les jeunes acteurs français, qui privilégient généralement une approche basée sur la protection des données, les défis restent toutefois nombreux. "Ce sont des technologies qui nécessitent des investissements assez significatifs, on est sur une logique d'intelligence artificielle où il y a de l'apprentissage, ce qui prend du temps", décrypte Sylvain Chevallier. Des milliers d'heures d'enregistrement audio sont nécessaires pour apprendre aux algorithmes à reconnaître la parole humaine.
Or les startups françaises font face à un obstacle. "Nous n'avons pas suffisamment de données pour entraîner des modèles", explique à l'AFP Karel Bourgois, fondateur de Voxist, qui propose un répondeur intelligent, capable de personnaliser l'annonce d'accueil et de retranscrire les messages vocaux. Pour pallier ce manque, Karel Bourgois et d'autres entrepreneurs ont récemment fondé Le Voice Lab qui compte constituer un corpus vocal de 100 000 heures, comprenant des voix de personnes de tout âge et aux accents différents. À terme, cette association rassemblant une trentaine de startups et de laboratoires a vocation à devenir une place de marché où un industriel pourra trouver les différentes "briques" pour monter son assistant vocal en français.
Maddyness avec AFP