Quand l’IA essaie d’apprendre un accent régional par elle-même

Les équipes d’Amazon sont parvenues en quelques mois à créer un accent irlandais pour l’enceinte connectée Alexa, en faisant en sorte que l’IA apprenne par elle-même. Une tâche ardue que raconte le New York Times, qui a pu rencontrer une partie de l’équipe du géant de l’e-commerce.

Verra-t-on bientôt des enceintes connectées nous parler avec l’accent ch’ti, alsacien, ou marseillais ? Cela pourrait être la prochaine étape d’Amazon, qui propose depuis le mois d’octobre dernier une Alexa avec l’accent irlandais. Parvenir à créer un anglais Dublin pour son enceinte connectée n’a pourtant pas été un long fleuve tranquille, rapporte le New York Times. Car si, jusqu’à présent, la tendance était d’utiliser l’intelligence artificielle pour gommer les prononciations régionales, voire « occidentaliser » les accents des centres d’appel – ce qui supposait de proposer un seul accent, les ingénieurs ont pris la direction inverse.

Ils travailleraient désormais sur des systèmes d’IA capables de reproduire les prononciations locales, de quoi rendre les robots conversationnels bien plus proches de nous. Et selon nos confrères qui ont pu rencontrer une partie de l’équipe d’Amazon qui a travaillé sur le sujet, la tâche a été ardue.

Les IA en difficulté pour reproduire la musique d’un accent
Reproduire un accent serait une mission particulièrement complexe, expliquent nos confrères, à l’inverse du vocabulaire d’une langue que l’IA peut acquérir facilement. Un accent n’est pas seulement une syntaxe particulière. Les linguistes parlent de « prosodie », une musique de la langue qui a trait à la fois au rythme, au ton, au débit, à l’intonation et qui donne aux mots un poids émotionnel ou une signification nuancée. Et en la matière, les machines auraient le plus grand mal à maîtriser cette « musique ».

D’abord, les ingénieurs se sont évertués à transformer les voix générées par ordinateur en quelque chose de plus agréable. Ensuite, ils ont cherché à imiter véritablement certains accents. Et ils se sont heurtés à encore plus de difficultés. Car « l’accent est différent de la langue », explique Rohit Prasad, responsable scientifique d’Amazon pour Alexa, à nos confrères de CNBC dans une précédente interview.

Les technologies de l’IA doivent apprendre à dissocier l’accent des autres parties de la parole, telles que le ton et la fréquence, avant de pouvoir reproduire les particularités des dialectes locaux – par exemple, des « r » plus accentués, des « o » prononcés différemment. Ces systèmes doivent comprendre ces modèles « pour pouvoir synthétiser un tout nouvel accent », a-t-il déclaré. Et c’est plus que difficile, ajoute-t-il.

Corriger une prononciation phonème par phonème
Les équipes d’Amazon qui ont travaillé sur l’accent irlandais d’Alexa auraient ajouté un degré supplémentaire de difficulté en partant d’un modèle vocal anglais pour construire un modèle irlandais. Et elles auraient fait en sorte que la technologie, avec un corpus bien plus réduit qu’avant d’enregistrements (seulement 2 000 énoncés avec l’accent irlandais, ce qui correspond à 24 heures d’enregistrement), « apprenne par elle-même cet accent ».

Leur modèle vocal premier était composé principalement d’accents anglais britanniques – avec une gamme beaucoup plus réduite d’accents américains, canadiens et australiens. Les ingénieurs lui ont ensuite transmis un modèle d’accent irlandais et l’ont entraîné à parler l’anglais irlandais, en corrigeant les mots qui n’étaient pas correctement prononcés.

Par exemple, les Irlandais ont tendance à sur-prononcer le « r », à faire sonner le « bath » comme « bat » ou même « bad », souligne le New York Times. « Ce sont de grosses boîtes noires », explique M. Tinchev à nos confrères, un ressortissant bulgare qui est le principal scientifique d’Amazon pour ce projet. « ll faut beaucoup d’expériences pour les régler », avec, parfois, la nécessité de corriger une prononciation phonème par phonème – une unité sonore d’un mot, détaille-t-il.

Pour les chercheurs d’Amazon, la façon dont ils sont parvenus, finalement en peu de temps, à inculquer l’accent irlandais à Alexa est une première. « Nous prévoyons également d’étendre notre méthodologie à des accents de langues autres que l’anglais », ont-ils écrit dans un document de recherche publié en janvier sur le projet Alexa irlandais.

Et ils pourraient bientôt les conduire à reproduire les accents d’autres pays. Les accents français ne devraient pas être leur priorité, mais qui sait, nos prononciations et dialectes régionaux pourraient finir par arriver sur la table des ingénieurs d’Amazon.

The New York Times

You may like