18 de diciembre de 2017

DIALOG

Por DRA. MARÍA JOSÉ ESCOBAR
Académica del Departamento de Electrónica – Investigadora asociada del Centro Avanzado de Ingeniería Eléctrica y Electrónica (AC3E)
Universidad Técnica Federico Santa María

Dispositivo orientado a personas con discapacidad auditiva permite capturar la modulación bucolingual, transformándola en expresión digital en tiempo real.

Desarrollar y adaptar algoritmos al idioma español a través de un software especializado en la lectura de labios, mediante el reconocimiento de la boca, labios y lengua, para luego traducirlo a una “voz digital”, son los principales objetivos de un dispositivo orientado a personas con discapacidad auditiva, creado por la empresa Dialog Chile y un grupo de investigadores del Centro Avanzado de Ingeniería Eléctrica y Electrónica (AC3E), de la Universidad Técnica Federico Santa María.

Este software, que trabaja en base a Inteligencia Artificial y Deep Learning, es una adaptación de un algoritmo desarrollado por ingenieros de la Universidad de Oxford, en conjunto con Google, denominado LipNet, que tiene una precisión del 95% en el reconocimiento de frases. En base a esto, Dialog busca poner a disposición de aquellos usuarios con discapacidades auditivas una herramienta similar, adaptada solo a palabras aisladas y entrenada con una base de datos local de fonemas en español, donde la salida del sistema sea una voz digital con la palabra modulada.

Considerando que la lectura de labios en humanos se reduce a una efectividad del 20 al 60%, este sistema propone la Inteligencia Artificial como un método confiable y altamente capacitado para la lectura bucolingual. Para ello, Dialog captura el movimiento de los labios a través de un video sin audio, generando una sugerencia de texto que “traduce” a voz digital lo que el usuario estaría diciendo.

El mecanismo trabaja en base a una arquitectura de redes neuronales artificiales que reconocen, mapean y “entienden” las palabras del usuario a través de reconocimiento facial que comprende específicamente el área bucolingual. De esta forma, los investigadores del AC3E desarrollaron, con apoyo de profesionales fonoaudiólogos, un set de 100 palabras que grabaron mediante la edición de una serie de videos en donde el software captura la lectura de labios, con buenos resultados.

Actualmente, el proyecto se está enfocando en un set de datos que contempla las palabras y fonemas más utilizados en la primera infancia, ya que los niños son el mejor público objetivo para testear este dispositivo, debido a que se encuentran en etapa de aprendizaje y son más abiertos a la hora de aprender nuevas formas de comunicación. Sin embargo, a futuro no se descarta extender la funcionalidad del dispositivo a usuarios jóvenes o adultos mayores.

Es importante mencionar que, el proyecto es desarrollado gracias al financiamiento de un Programa Regional de Apoyo al Emprendimiento (PRAE) de CORFO. Además, los investigadores están evaluando extender el proyecto a una segunda etapa en donde el sistema pueda ser alojado en una aplicación para smartphones, todo esto considerando que la prueba de concepto y el prototipo mínimo demostraron ser viables.

Cabe destacar que participaron de este proyecto, Luis López, Co-Fundador de Dialog Chile, además de Oscar Silva, Víctor Guerra y Fabián Rubilar, todos pertenecientes al AC3E.

  • DIALOG 001

No hay comentarios

Valoramos su opinión siempre que esta sea emitida con respeto y responsabilidad. Nos reservamos el derecho a no publicar comentarios que resulten ofensivos o fuera del contexto de la noticia.