Technologie d’IA à commande vocale

Les systèmes capables d’effectuer des opérations de routine à la place des humains contribuent à soutenir l’économie mondiale. En fait, ils le font depuis des décennies – de tels systèmes travaillent au profit de la civilisation depuis longtemps. Mais qu’en est-il des systèmes qui peuvent communiquer et interagir avec l’utilisateur ? Si nous parlons de communication à part entière, nous ne l’avons pas encore, et ce pour une seule raison : notre langage est trop compliqué.

Quiconque a essayé d’interagir avec des assistants numériques comme Alexa et Siri a vu et ressenti la différence entre “communiquer” avec eux et avoir une véritable conversation avec une personne. Mais le progrès ne s’arrête pas. Dans un avenir plus ou moins proche, des interlocuteurs IA avancés ne manqueront pas d’apparaître, car c’est vers cela que tout se dirige. Globalement, cette technologie a le potentiel de changer le monde. Voici un aperçu de trois technologies innovantes qui stimulent le développement de l’ensemble du secteur.

L’IA conversationnelle pour traiter les commandes/demandes des clients

Les experts en IA vocale ont donné la priorité aux technologies qui peuvent faciliter les tâches de routine, libérant ainsi les gens pour qu’ils s’engagent dans des activités créatives à fort impact. Un exemple : communiquer avec les clients qui commandent un produit ou un service, traiter leurs commandes et leurs appels.

Cela semble simple – télécharger un menu, utiliser un chatbot et c’est tout. En réalité, de nombreux facteurs viennent compliquer les choses. Par exemple, un système qui doit communiquer avec les clients en parlant nécessite un module de reconnaissance vocale quasi parfait qui n’est pas affecté par le bruit de la voiture, la musique dans la chambre du client ou tout autre son, y compris la parole des autres personnes qui se trouvent près du client qui passe la commande. En outre, le système doit reconnaître la parole des enfants, des adultes, des personnes souffrant de troubles de la diction, etc.

Parler au téléphone dans son appartement avec la musique éteinte et sans aucun son étranger, c’est une chose. De nombreux systèmes d’IA actuellement disponibles peuvent gérer ce type de discours. Reconnaître le flux audio d’un client dans la rue ou dans les transports est une toute autre affaire.

La société américaine Hi auto a réussi à surmonter ces problèmes, et le système qu’elle a développé est capable de fonctionner avec une précision de 90 %. Ce n’est bien sûr pas idéal, mais c’est bien mieux que la moyenne.

Les experts suggèrent que dans environ 3 ans, de nombreux restaurants utiliseront un système d’IA vocale pour prendre les commandes. Nous parlons de dizaines de milliers de lieux de restauration dans le monde. Dans quelques années, cette technologie deviendra courante, car elle permettra de libérer les employés des restaurants et des cafés de l’obligation de prendre les commandes. Ils pourront être utilisés pour d’autres tâches où l’intelligence et les capacités humaines sont nécessaires.

Systèmes d’IA conversationnelle dans le nuage pour les voitures intelligentes

La deuxième technologie prometteuse mise en avant par les experts est un système qui comprend le contexte d’une conversation. Les conversations humaines se déroulent généralement dans un certain contexte, et les mêmes mots et phrases peuvent avoir une signification différente selon le contexte. Il est naturel pour les humains de comprendre le contexte, mais pas pour les systèmes numériques. Ils comprennent le discours littéralement, sans prêter attention au contexte – la grande majorité des assistants numériques n’en sont tout simplement pas capables.

L’humour en est une bonne illustration. Les assistants numériques sont incapables de comprendre même les blagues les plus simples, sans parler des blagues à double/triple fond. En fait, même les humains ne sont pas tous capables de comprendre l’humour “complexe”, et encore moins les machines.

Mais la compréhension du contexte est un élément extrêmement important d’un système d’IA conversationnel vraiment efficace. Différentes entreprises travaillent actuellement sur l’IA consciente du contexte, qui crée des modèles utilisant des informations supplémentaires, au-delà de la personnalité du locuteur, lors des interactions avec l’interlocuteur.

Les robots de conversation constituent un domaine d’application potentiel de cette technologie. Dans une situation idéale, ils devraient recueillir des informations supplémentaires provenant de divers endroits, notamment le profil de l’utilisateur, ses commandes précédentes, etc. Ces données peuvent être utilisées pour générer des réponses très intelligentes.

Les systèmes de réponse rapide constituent une autre option. Par exemple, une personne se retrouve coincée dans un ascenseur, elle le signale immédiatement au système d’IA intégré, qui notifie instantanément les services concernés par l’incident. Bien sûr, on peut aussi se souvenir de la vidéo avec les Écossais dans l’ascenseur à commande vocale, mais il semble que ce problème soit plus facile à résoudre que celui de la compréhension du contexte de la conversation par le système numérique.