News -

publié le 14 March 2016

[SXSW 2016] La voix : entre innovation et émotion

Parmi tous les innombrables sujets abordés, nous commençons à voir se détacher certaines tendances, au premier rang desquelles : l’émergence de la voix comme interface.

L’utilisation de la voix pour interagir avec les machines irrigue depuis longtemps l’imagination des auteurs de science-fiction. De HAL (2001 : L’Odyssée de l’espace) à Her, la conversation entre l’Homme et la machine semble s’imposer comme l’interface la plus naturelle et la plus intuitive. Les efforts des ingénieurs pour passer de la fiction à la réalité ne datent pas d’hier. Certains de nos lecteurs se souviendront peut-être de la Renault 11 Electronic (1984), dont le système de synthèse vocale se voulait à la pointe, même s’il parait désuet aujourd’hui.

Si l’on en croit les speakers de SXSW 2016, cet état de fait est sur le point de changer. La technologie a connu de grandes avancées, avec en tête de pont les 4 géants incontournables que sont Google (Google Now), Apple (Siri), Microsoft (Cortana) et Amazon (Alexa). Ce n’est d’ailleurs pas un hasard si l’on ne voit pas de « petit » les concurrencer directement, tant les moyens financiers à déployer pour arriver à des résultats satisfaisant sont importants. Cette éclosion est due à 4 facteurs concomitants, dont l’apparition simultanée devrait enfin permettre de faire émerger les usages :

  • Le premier challenge qui semble aujourd’hui résolu est celui de la reconnaissance vocale, c’est-à-dire la compréhension parfaite des syllabes et des mots prononcés par l’utilisateur. Quand on met dans la balance l’éventail des langues, accents, intonation et d’autres complexités comme le bruit ambiant, on comprend mieux les difficultés qu’il a fallu surmonter.
  • Une fois les mots identifiés, encore faut-il les interpréter. C’est là qu’intervient l’Intelligence Artificielle, qui a accomplit des progrès phénoménaux ces dernières années. Là encore, la complexité du langage humain rend la tâche à accomplir particulièrement ardue. Ainsi, le travail accompli pour domestiquer une langue doit être repris quasiment à zéro pour étendre son service à une nouvelle langue. La langue d’un pays étant directement liée à la culture, on observe ainsi 2 évolutions très distinctes et parallèles en la matière entre les travaux des GAFA d’une part, et des asiatiques BAT (Baïdu, Alibaba, Tencent) d’autre part.
  • Le troisième point est qu’en parallèle, toute une génération de services « voice ready » est en train de voir le jour. Comme nous l’expliquions à l’occasion du WebSummit, le succès des applications de messagerie va pousser les marques à penser leur relation client sur des canaux tels que Facebook Messenger ou Whatsapp. Si ces services sont conçus pour être activés par chat ou sms, ils pourront également l’être par la voix. Au cours d’une conférence dédiée au Design d’Interfaces Conversationnels, Julie Ha présentait Lark, un service de coaching de perte de poids via messagerie. Lark est un robot conversationnel, qui est capable de guider un utilisateur pour l’aider à perdre du poids au quotidien. La encore, il est aisé d’imaginer l’intégration de Lark à nos assistants virtuels commandés par la voix.

 

Nous l’avions l’avait déjà constaté lors du CES, mais cela s’avère encore plus présent à Austin : s’il est un acteur qui sort vraiment du lot en la matière, c’est Amazon. Tous les experts, des bidouilleurs géniaux de Chaotic Moon, jusqu’à Microsoft, en la personne de Lesley Carmichael, Principal Program Manager, s’accordent sur le fait que c’est bien la technologie Amazon Alexa qui a pris le plus d’avance, tant dans la finesse de compréhension du langage humain, que dans son ouverture et sa capacité à être le centre d’un écosystème d’acteurs tiers qui utilisent cette solution. L’enceinte Echo, lancée en 2015, avait à l’origine pour but d’être un raccourci entre le désir du consommateur et son achat (pas besoin de sortir son téléphone, sa tablette ou son ordinateur pour commander un produit). Amazon est surtout en train de réussir à imposer Alexa comme une solution de référence de la maison connectée dans son ensemble (centre de commande de tous les appareils et accessoires connectés), et ouvre la voie à de nombreux autres domaines.

askAmazonEcho

Avec la diffusion de la voix comme interface, les entreprises vont devoir repenser l’interaction avec leurs services. La voix nécessite d’être précis et pertinent, car les utilisateurs sont beaucoup moins tolérants envers les erreurs et les hésitations d’une machine qui leur parle que lorsque ces mêmes messages d’erreur sont affichés sur un écran.

C’est également une opportunité pour les marques de créer des services teintés d’une réelle valeur émotionnelle, tant l’interaction vocale en est chargée : Julie Ha racontait que quand elle interroge des utilisateurs de son service de coaching, ils en parlent presque comme d’une personne réelle, quasiment un ami ou un confident, auquel on avoue des choses qu’on admettrait pas forcément à des humains. Il se raconte même que 25% des utilisateurs d’assistants virtuels lui auraient déjà déclaré « I Love You ».

Cet article [SXSW 2016] La voix : entre innovation et émotion est apparu en premier sur Le Lab SQLI.

Article source
Partager

Expéditeur (requis)

Destinataire (requis)

Message