Le robot HEARBO de Honda entend tout

Le Honda Research Institute japonais (HRI-JP) a mis au point un robot capable de distinguer des sons provenant simultanément de sources différentes. La technologie employée est nouvelle et pourrait bien faire avancer le domaine de l’analyse computationnelle de scènes auditives (CASA).

Nous évoluons dans un monde où règne une cacophonie de voix, sons et bruits qui se superposent les uns aux autres. Tous ces sons mélangés produisent un flux différent de ce que serait l’addition séparée de chacune de ces sources.

Pour reconnaître des sons dans cette jungle sonore, un robot utilise habituellement la technique dite de beamforming, un processus de filtrage du signal reçu, en quelques sortes. Le robot se focalise sur une onde sonore en particulier (par exemple, une personne qui parle), puis applique des filtres atténuant le bruit de fond pour ne garder que les ondes sonores qui l’intéressent afin de procéder à la reconnaissance vocale.

Blog_Humanoides_Fr_Honda_Hearbo_Hearing_robot_1

Le (HRI-JP) propose une nouvelle approche avec son robot HEARBO (contraction de HEARing roBOt). En effet, la technique dite de beamforming trouve rapidement ses limites dans des situations bruyantes où plusieurs personnes parlent en même temps et où le robot doit détecter la voix d’une personne en particulier.

L’équipe de chercheurs japonais dit avoir réussi avec HEARBO. Leur modèle fonctionne en trois étapes : la localisation, la séparation et la reconnaissance. Ce système, appelé HARK, permet de différencier chaque son en fonction de la distance parcourue avant d’atteindre le robot. Au lieu d’atténuer le fond sonore, les chercheurs préfèrent séparer chaque signal pour mieux l’analyser. Par exemple, les pleurs d’un bébé pourront être considérés comme du bruit dans certaines situations, mais deviendront un signal primordial à conserver dans d’autres.

Lors du salon IROS 2012, Keisuke Nakamura du HRI-JP a présenté l’algorithme de reconnaissance vocale localisante HARK qui permet de détecter et distinguer des sources sonores distantes d’1 seul degré. Le robot HEARBO détecte jusqu’à quatre sons et voix différents et simultanés. En théorie, avec huit microphones placés sur le robot, on pourra distinguer jusqu’à sept sources sonores différentes, chose que nous ne parviendrons jamais à faire avec nos deux oreilles.

Les applications possibles sont évidemment très vastes mais elles pourraient par exemple concerner le secours de personnes lors de catastrophes naturelles.


Laisser un commentaire