Las dificultades para el lenguaje afectan a “millones de personas” por múltiples motivos, desde las lesiones cerebrales, hasta el Parkinson u otras enfermedades degenerativas. Pero, por suerte -y como demostró uno de los grandes telescópicos de la historia, Stephen Hawking-, no tiene por qué suponer una limitación. Aun así, quienes padecen este tipo de problemas, pueden sentir también “dificultades extremas y frustración”. Así lo explica Google, que ha creado el proyecto Euphonia, dentro de su programa de inteligencia artificial para el bien social.

El objetivo es usar esa tecnología “para mejorar las capacidades de los ordenadores para comprender patrones de lenguaje diverso”, explican desde Menlo Park.

La compañía se ha unido a diferentes asociaciones para grabar las voces de personas con esclerosis lateral amiotrófica, “una condición neurodegenerativa que puede provocar incapacidad para hablar y moverse”.

El reconocimiento de lenguaje debería funcionar para todo el mundo

Euphonia: Entender mejor

El objetivo de la colaboración es comprender mejor las necesidades de comunicación de estas personas, para optimizar la inteligencia artificial y los algoritmos con los que funciona con el fin de que tanto nuestros ordenadores, como los teléfonos móviles y otros dispositivos entiendan este tipo de dificultades de lenguaje.

“El reconocimiento de lenguaje debería funcionar para todo el mundo”, afirma Michael Brenner, científico investigador de Google. El equipo del proyecto Euphonia espera poder ayudar a las personas que padecen este tipo de enfermedades, para que puedan “enviar mensajes o generar comandos para sus dispositivos Google Home de forma independiente”, explica Maeve McNailly, máxima responsable de operaciones clínicas en ALS TDI, un laboratorio de investigación que fue fundado por Stephen Heywood cuando en 1999, con 29 años, le diagnosticaron una esclerosis lateral amiotrófica.

“El software de Google convierte las grabaciones de voz en un espectrograma o una representación visual del sonido”, explica la compañía. “El ordenador después usa espectrogramas comunes para entrenar al sistema para que reconozca mejor este tipo de lenguaje menos común”.

En 2055 habrá 900 millones de personas con pérdida de audición

También para la pérdida de audición

La compañía también está explorando el uso de la inteligencia artificial para ayudar a personas con pérdida de audición. Por ejemplo, Dimitri Kanevsky, otro de sus investigadores de lenguaje, “que aprendió inglés después de quedarse sordo de pequeño en Rusia”, ahora está utilizando una de las soluciones de Google, Live Transcribe, con un modelo personalizado y entrenado para que reconozca su voz y la transcriba.

Google cita datos de la Organización Mundial de la Salud que sitúan en 900 millones el número de personas con pérdida de audición en 2055. “Creemos en el poder de la tecnología para ayudar a romper barreras y hacer la vida más fácil para todo el mundo”.

Live Transcribe se creó a partir de CART, un servicio que se incorpora a una reunión de forma virtual para generar una transcripción de la conversación y mostrarla en un ordenador.

Esta solución obligaba a Kanevsky a cargar con varios dispositivos y prepararse con anticipación para las reuniones. Su compañero de trabajo, Chet Gnegy, se dio cuenta de las dificultades que suponía y se planteó: “¿Y si usamos reconocimiento de lenguaje automático en la nube para mostrar las palabras habladas en una pantalla?”.

Se creó un prototipo y lo probaron personas de la compañía de todos los países. El resultado fue el nacimiento de Live Transcribe, “una aplicación que recoge el lenguaje del mundo real a través del micrófono del móvil y lo convierte en transcripciones en tiempo real”.

Según la compañía, esta solución “tiene el potencial de dar mayor independencia a personas sordas o duras de oído en sus interacciones cotidianas”. Asegura que ha acercado a Kanevsky más a sus seres queridos, porque ahora se puede comunicar fácilmente con sus nietas de seis años, sin necesidad de ayuda por parte de otros miembros de la familia.

Live Transcribe, que funciona en más de 70 idiomas y dialectos y cuenta con más de 100 millones de descargas, también permite conversar a través de un teclado para quienes no pueden o no quieren hablar y se conecta con micrófonos externos para mejorar la transcripción.

Con Euphonia y Live Transcribe, Google está facilitando la comunicación a todas las personas con lenguaje diverso o problemas de audición.