fermer
Microsoft

La dernière percée de Microsoft est de comprendre la parole comme un humain

06 research team 20161013 lowres

Les ordinateurs peuvent faire des choses incroyables et des progrès extraordinaires ces derniers temps, grâce aux traitements parallélisés, l’intelligence des machines et au matériel plus puissant. Microsoft s’est profondément inscrit dans le secteur de l’intelligence artificielle, et l’apprentissage machine est au centre de tout cela. Ce mardi, la société a annoncé une autre percée significative.

La façon la plus naturelle pour l’homme d’interagir avec des ordinateurs est de parler avec eux, et Microsoft a créé une technologie qui peut comprendre une conversation comme les humains, selon le blog de Microsoft. La parité de la reconnaissance de la parole humaine est un fait historique, et Microsoft a réalisé cette étape plus rapidement que prévu. « Il y a encore cinq ans, je n’aurais pas pensé que nous aurions pu réaliser cela », a déclaré Harry Shum, vice-président exécutif, responsable de la recherche et de l’intelligence artificielle chez Microsoft.

Selon un article publié ce lundi, l’équipe de recherche de Microsoft a créé un système de reconnaissance vocale, ayant un taux d’erreur de mot reconnu (REH) de seulement 5,9 %, soit une baisse notable par rapport aux 6,3 % relatés le mois dernier. Les êtres humains qui retranscrivent la même conversation dictée dans le cadre du test ont également obtenu un taux d’erreur de 5,9 %. Cela signifie que pour la première fois, un ordinateur peut déchiffrer une conversation tel un humain — contrairement à ce que l’on peut penser, la retranscription par un humain n’est pas parfaite, car ce dernier n’entend pas toujours le même mot que celui prononcé par son interlocuteur.

La recherche de reconnaissance vocale a commencé au début des années 1970
La recherche de reconnaissance vocale a commencé au début des années 1970

Meilleur que les humains assez rapidement ?

La recherche de reconnaissance vocale a commencé au début des années 1970 à la Defense Advanced Research Projects Agency (DARPA), et l’industrie informatique a relevé le défi et travaille depuis pour comprendre ce qu’un humain peut dire. Maintenant que cette étape est atteinte, nous pouvons nous attendre à des assistants numériques et d’autres outils beaucoup plus puissants, avec une capacité à interagir avec nous de façon plus naturelle. « Cela rendra Cortana plus puissant, et rend un assistant intelligent vraiment possible », a déclaré Shum.

Le nouveau système de reconnaissance vocale de Microsoft ne parvient pas à la perfection dans la reconnaissance d’une conversation, mais là encore, nous non plus. Pour surmonter les erreurs habituelles, le système utilise la technologie de réseau neuronal, un sujet très en vogue en ce moment, pour tirer parti des modèles de langage neuronaux qui peuvent rendre les mêmes conclusions que les humains font lors de la correction de mots mal compris.

Cela rendra Cortana plus puissant

L’équipe a utilisé quelques outils existants pour arriver à ses fins. Par exemple, le système open source Computational Network Toolkit a été utilisé par Microsoft pour appliquer l’apprentissage en profondeur à des tâches de calcul, permettant aux unités de traitement graphique (GPU dédiée) de fonctionner en parallèle pour permettre un traitement plus rapide des algorithmes d’apprentissage en profondeur. Les technologies utilisées pour d’autres tâches, telles que le traitement de l’image, ont également été mises à profit.

Cependant, les chercheurs ne vont pas se reposer sur leurs lauriers. Il reste du travail à faire pour que la technologie soit parfaite dans le monde réel, où le bruit de fond et le contexte peuvent rendre la reconnaissance beaucoup plus difficile. « La prochaine frontière est de passer de la reconnaissance à la compréhension ».

Tags : AIIAreconnaissance vocale
Yohann Poiron

The author Yohann Poiron

J’ai fondé le BlogNT en 2010. Autodidacte en matière de développement de sites en PHP, j’ai toujours poussé ma curiosité sur les sujets et les actualités du Web. Je suis actuellement engagé en tant qu’architecte interopérabilité.