Grâce aux enceintes connectées et aux assistants comme Siri et Cortana, on peut commander sa pizza ou gérer sa musique uniquement via la voix. Une interaction «beaucoup plus naturelle» que le texte, selon ses promoteurs. Mais est-ce vraiment le cas ?

Pendant des années, les entreprises tech ont tenté de nous débarrasser de la voix, ce mode de communication tellement ringard. Les appels téléphoniques allaient complètement disparaitre au profit des textos. Plus besoin d’appeler une compagnie de taxis quand on peut commander un VTC en quelques clics sur Internet. Fini les conversations avec votre conseiller bancaire quand celui-ci vous répond directement par chat sur le site de la banque.

Mais ça, c’était avant. Car aujourd’hui, les mêmes tentent de nous convaincre d’abandonner nos écrans pour tout diriger grâce à la voix. Les enceintes connectées Amazon Echo sont ainsi capables de diffuser la musique que vous lui demandez, d’appeler un correspondant automatiquement, de vous donner la météo et les informations du jour, de commander vos produits préférés ou même de vous conseiller un traitement si vous lui décrivez vos symptômes. Avec Siri, Apple ambitionne de la même façon d’éviter de passer par l’écran de l’iPhone. On peut par exemple lui demander «Lis moi les messages de maman» ou «De qui parle-t-on sur Twitter».

«Démocratiser l’accès la la technologie»

«La voix est une interface beaucoup plus naturelle que de taper sur un écran», rapporte Rand Hindi, créateur de la startup française Snips. Celle-ci promet de «démocratiser» l’accès à la technologie en rendant n’importe quel objet pilotable par la parole. «La voix nécessite deux fois moins d’efforts au cerveau que l’écrit», assure-t-il. «Plus besoin d’apprendre à vous servir d’un logiciel ou de lire un obscur mode d’emploi. Si je veux regarder un match de foot, plutôt que de chercher le programme télé, d’apprendre à utiliser la télécommande, il me suffit de demander à la télévision pour y avoir directement accès».

Selon lui, l’interface vocale permettra ainsi d’utiliser énormément plus d’appareils et de fonctionnalités. «Aujourd’hui le cerveau est complètement saturé par la prolifération d’objets et d’applications. On ne se rappelle même plus de toutes les applis installées sur notre téléphone». «L’interface vocale permettra aussi de toucher de nouvelles populations peu familiarisées avec l’écrit ou mal à l’aise avec les nouvelles technologies, comme les personnes âgées ou l’Afrique», estime pour sa part Luc Bretones, directeur du Technocentre d’Orange.

La nouvelle marotte des marques

En tous cas, les entreprises y croient. Plus de 100 000 chatbots ont ainsi vu le jour sur Facebook Messenger depuis avril 2016. Amazon aurait écoulé 10 millions de ses enceintes connectées aux Etats-Unis. Google vient de lancer la sienne en France et le HomePod d’Apple est prévu pour 2018.  Selon Gartner, 20% des interactions avec son téléphone auront lieu via des assistants personnels virtuels en 2019.

Soucieuses de ne pas rater cette prochaine «révolution», les marques se lancent à tout-va. Philips a été parmi les pionniers sur les enceintes connectées d’Amazon afin de permettre aux utilisateurs de régler leurs ampoules connectées par la voix. Voyage-sncf teste depuis 2016 la commande vocale via Alexa. Une équipe de neuf personnes au sein de l’entreprise a même été entièrement dédiée au «conversationnel». «On voit un véritable engouement de la part de nos clients», confirme Patrick Joubert, cofondateur de la startup Recast.ai, qui fournit des solutions de chatbot aux entreprises, comme Engie ou Europ Assistance.

0,1% du temps passé sur mobile

Malgré ces prévisions décoiffantes, la réalité est un peu moins rose. Selon Verto, spécialisée dans l’analyse de données consommateurs issues d’applications, Siri a perdu 15% d’utilisateurs en un an et leur engagement a diminué de moitié. Tous appareils confondus, les utilisateurs n’accordent que 12 minutes par mois à l’usage de ces assistants vocaux, soit moins de 0,1% du temps passé sur leur mobile. Même sur Alexa, seules 62% des 20 000 applications vocales n’ont aucune note, ce qui suggère qu’elles sont peu ou pas utilisées, rapporte le site Voicebot.ai. Parmi les raisons invoquées pour le non usage, 33% disent «être plus à l’aide avec l’écrit» et 20% ne pas avoir été convaincus par l’expérience, d’après une étude Creative Strategies. 19% n’ont simplement pas le réflexe de l’utiliser et ont même «oublié» qu’il existe.

Des usages limités à des interactions basiques

«Aujourd’hui on est plus proche du serveur vocal des années 1990 que du véritable assistant personnel», raille Renaud Ménérat, Président de la Mobile Marketing Association France (MAAF). Qui se souvient des bons vieux répondeurs téléphoniques Météo France ne peut que se féliciter d’avoir une application smartphone pour connaître la météo du jour ou de la semaine. «Vous imaginez la galère pour réserver un billet de train si le serveur vous énumère tous les numéros de wagon ?». D’autant plus que la technologie de reconnaissance vocale est encore loin d’être au point : elle est très mauvaise pour reconnaître les accents et fonctionne mal dans les environnements bruyants. Du coup, l’usage des assistants vocaux se cantonne à des requêtes très simples. 63% des utilisateurs s’en servent d’abord pour effectuer une recherche web, 50% pour écouter de la musique. Quand ils ne servent tout simplement pas… de défouloir, pour 55% des gens qui s’amusent juste à poser des questions marrantes.

Compléter sans remplacer

On est donc loin d’un monde sans écran, où nos chers bambins n’auraient même plus besoin d’apprendre à lire. «La voix ne remplacera pas l’écran. C’est juste un moyen supplémentaire d’usage», corrobore Rand Hindi. «Dans une voiture, c’est totalement stupide voire dangereux d’avoir une interface tactile. En revanche dans le métro vous préférez sans doute interagir sur un écran pour des raisons de discrétion». Selon Patrick Joubert, la domotique est le secteur le plus prometteur. «Pouvoir désactiver son alarme ou piloter ses volets roulants par la voix fait réellement sens». L’enceinte connectée, réservée à un usage à domicile, présente donc un certain intérêt. Mais imaginer un smartphone sans écran relève tout simplement de l’utopie. «Le smartphone est même l’objet le moins intéressant pour la voix», juge carrément Rand Hindi. L’iPhone réduit à de simples écouteurs AirPod n’est encore pas pour demain.