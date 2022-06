Comme le souligne TechCrunch, lors de sa conférence de développeurs re : MARS 2022, Amazon a révélé une fonction expérimentale unique pour son assistant vocal Alexa : la possibilité de reproduire la voix de personnes décédées. Oui, vous avez bien lu.

Dans un développement qui semble tout droit sorti d’un film de science-fiction dystopique, Alexa pourrait bientôt avoir la possibilité d’imiter vos proches décédés.

Lors de l’événement, Amazon a montré un exemple de vidéo dans laquelle un enfant demande à Alexa de lui lire une histoire pour s’endormir. « Alexa, est-ce que grand-mère peut finir de me lire Le Magicien d’Oz ? », dit l’enfant dans la vidéo. Peu après, Alexa commence à réciter l’histoire avec ce qui est vraisemblablement la voix de la grand-mère de l’enfant.

Le plus intéressant, c’est que la voix de la grand-mère semble naturelle et non pas celle que l’on attend d’un assistant vocal qui a généralement une voix banale et robotique.

« Cela a nécessité des inventions où nous avons dû apprendre à produire une voix de haute qualité avec moins d’une minute d’enregistrement contre des heures d’enregistrement en studio. La façon dont nous avons réussi à le faire est de formuler le problème comme une tâche de conversion de la voix et non comme une voie de génération de la parole. Nous vivons incontestablement l’âge d’or de l’IA, où nos rêves et la science-fiction deviennent une réalité », a déclaré Rohit Prasad, premier vice-président et scientifique en chef d’Amazon pour Alexa.

L’avenir de l’IA ?

Bien que la démonstration d’Amazon de la fonction d’imitation de la voix fasse chaud au cœur, on peut déjà penser à plusieurs cas d’utilisateurs essayant d’abuser de cette fonction. Il reste à voir si les autres assistants vocaux détecteront intelligemment que la voix provient d’Alexa et éviteront les cas de contournement des systèmes d’authentification par reconnaissance vocale.

Prasad a également parlé des défis possibles, car il s’agit davantage d’une « tâche de conversion vocale et non d’une voie de génération de la parole ». On peut s’attendre à davantage de détails à ce sujet dans un proche avenir. En ce qui concerne la disponibilité, il n’y a pas de mot pour l’instant, car il est en cours de développement.