María del Carmen López y Andrés Piñeiro, respectivamente responsable de la Oficina de I+D+i e investigador en tecnologías del lenguaje de la empresa tecnológica Balidea, hablan con nuestra compañera Leticia Río sobre FalAI, la iniciativa que pretende desenvolver herramientas para que las personas se puedan comunicar en gallego con el mundo digital.
No cabe duda de que la interacción con el mundo digital se ha transformado de manera radical en la última década. Los asistentes virtuales por voz han llegado para quedarse y cada vez son más las personas que hacen uso de ellos en su día a día. Ya sea para consultar el tiempo que va a hacer mañana o para establecer un recordatorio de una cita médica próxima, la comodidad de utilizar directamente nuestra voz hace que estos dispositivos tengan cada vez más defensores. La dificultad llega cuando éstos no reconocen nuestro idioma. ¿Recordáis a Moraima? La niña a la que Siri no entendía.
Balidea es una PYME gallega con más de veinte años de experiencia en el sector de las TIC. A lo largo de este tiempo ha abordado numerosos proyectos relacionados con la comunicación con los pacientes, los profesionales de la salud y la sociedad en general. Esta especialización en el diseño y desarrollo de soluciones de comunicación ha llevado al equipo de I+D+i de Balidea a cuestionarse cómo será la comunicación con el mundo digital en los próximos años. Y una cosa está clara: puesto que la comunicación por voz tendrá un papel muy destacado, la tecnología ha de garantizar la comunicación en nuestro idioma, sea cual sea. Así es como surge el proyecto falAi, en colaboración con el centro de investigación AtlanTTic de la Universidad de Vigo.
Leticia Río: La inteligencia artificial ha venido para quedarse, ¿qué utilidad tiene para poner en valor las lenguas minoritarias?
Andrés Piñeiro: Para poder comunicarnos con el mundo digital mediante voz las máquinas han de entender lo que decimos y reaccionar en consecuencia. Para lograrlo se trabaja en varias ramas de la inteligencia artificial. Por ejemplo, el Procesado de Lenguaje Natural, con sus siglas PLN, tiene como objetivo crear máquinas o soluciones que entiendan datos de texto o voz y ofrezcan una respuesta en una u otra forma. El PLN combina lingüística computacional con modelos estadísticos de aprendizaje máquina (en inglés “machine learning”) o aprendizaje profundo (“Deep learning”).
Mari Carmen López: La Inteligencia Artificial puede desempeñar un papel fundamental en la promoción y preservación de lenguas con pocos recursos. Por ejemplo, mediante herramientas de traducción automática o reconocimiento de voz podemos eliminar barreras lingüísticas, y contribuir al desarrollo de aplicaciones y soluciones que ayuden a revitalizar el idioma entre las generaciones más jóvenes, asegurando la supervivencia y enriquecimiento cultural.
Cualquier lengua humana puede ser tratada con estas tecnologías, pero existen limitaciones económicas. No es lo mismo desarrollar tecnología para el idioma Chino Mandarín, que lo hablan en torno a 1118 millones de personas, que para el Islandés, que sólo lo hablan alrededor de 320.000 personas. Por supuesto, también existen limitaciones prácticas o estratégicas. Pensemos dónde se localizan o qué idioma hablan las principales compañías mundiales del sector: Google, Amazon, Microsoft…
Es importante que exista una estrategia común y coordinada en toda Europa que garantice la vida de nuestra enorme riqueza cultural y lingüística en el mundo digital.
balidea
L.R: Entonces, ¿cómo surge el proyecto falAI?
A.P..: Para que la tecnología funcione es necesario contar con recursos para entrenar los algoritmos. Cuando hablamos de recursos nos referimos a “ejemplos de voces” o “ejemplos de frases”. De igual modo que un niño cuando aprende a hablar necesita escuchar a sus padres, a su entorno…, las máquinas necesitan de ejemplos para aprender. Lenguas como el gallego, el danés, el sueco…, tienen pocos recursos (voces, datasets…). No nos quedaba más remedio que crearlos y así es como diseñamos falAI, que no es otra cosa que un “crowdfunding de recursos”.
M.C.: Fue un esfuerzo enorme y un gran trabajo en equipo. Además, tuvimos la suerte de contar con apoyo económico de ELE (European Language Equality) a través de una convocatoria competitiva en la que la propuesta de Balidea fue seleccionada entre otras muchas de toda Europa. Se trata de un consorcio europeo encargado de escribir la Agenda y Hoja de Ruta de Europa para garantizar la igualdad digital de nuestras lenguas para el 2030.
L.R: Contáis con unos objetivos claros, ¿cuáles son?
M.C.: Nuestro objetivo es desarrollar tecnología que ayude a las personas en su día a día. Comunicarte con las máquinas por voz puede servir para ayudar a las personas con discapacidad visual, ayudar a las personas con dificultades de movilidad fina (dificultades para escribir), para optimizar procesos de comunicación o simplemente para apoyar a personas con dificultades para relacionarse con un ordenador. Pensemos en nuestros abuelos. En el caso de Balidea, y dada nuestra trayectoria en el sector de la salud digital, o e-salud, queremos desarrollar tecnología para mejorar procesos en este ámbito. Ahora mismo estamos, a través de un proyecto europeo, diseñando protocolos de cribado y seguimiento de pacientes crónicos en sus casas. Se trata de automatizar tareas repetitivas que permitan a los médicos centrarse en otras donde aporten más valor y ayudar a los pacientes a facilitar información estructurada mediante la voz.
L.R: Se trata de un proyecto en el que la colaboración de la sociedad gallega ha sido clave. ¿Cuál fue la acogida?
M.C.: ¡Espectacular! Fue increíble y emocionante. Para que os hagáis idea del impacto sólo había una iniciativa previa que había conseguido 30 horas de “recursos”, es decir, de voces. Nuestro sueño era superar esa iniciativa. ¡Y en la primera semana ya teníamos 100 horas de grabación!
A.P.: Hemos conseguido que miles de personas participaran y donaran su voz, obteniendo multitud de acentos y voces en rangos de edad normalmente infrarrepresentados, como es el caso de las personas mayores. Además, a nivel investigación, falAI también ha sido un éxito arrollador, ya que se ha convertido en la base de datos para asistentes virtuales, disponible públicamente, más grande del mundo, por encima de las bases de datos disponibles en inglés.
L.R: Mirando al futuro, ¿qué proyección tiene FALAI? ¿Cuáles son los próximos pasos?
A.P.: FalAI, como te comentaba, fue una especie de campaña para obtener recursos con los que entrenar nuestros algoritmos. Hemos puesto todos los recursos obtenidos a disposición de quien quiera utilizarlos para desarrollar tecnología que permita el uso de nuestro idioma en el mundo digital. El dataset generado está disponible en un repositorio público europeo creado por el consorcio del proyecto europeo ELE y será de utilidad para el desarrollo de asistentes virtuales y reconocedores de voz en gallego.
M.C.: Además, fue el éxito de falAI el que abrió las puertas a Balidea para colaborar con DFKI, el centro de investigación alemán de Inteligencia Artificial. Actualmente Andrés está en Berlín, colaborando en el proyecto openGPT-X (https://opengpt-x.de/en/), desarrollando modelos de reconocimiento de voz multilingües.
En definitiva, falAI será una de las bases de datos que contribuyan a crear la siguiente generación de aplicaciones relacionadas con el habla en gallego. Y, por supuesto, la aplicaremos en todos nuestros proyectos de asistentes conversacionales en Balidea. Además, también será muy importante en el campo de la investigación, permitiendo probar estas aplicaciones en bases de datos más amplias, con mayor variedad de hablantes y dominios.
Entrevista en galego
María del Carmen López e Andrés Piñeiro, respetivamente responsable da Oficina de I+D+i e investigador en tecnoloxías da linguaxe da empresa tecnolóxica Balidea, falan coa nosa compañeira Leticia Río sobre FalAI, a iniciativa que pretende desenvolver ferramentas para que as persoas se poidan comunicar en galego co mundo dixital.
Non cabe dúbida de que a interacción co mundo dixital transformouse de maneira radical na última década. Os asistentes virtuais por voz chegaron para quedarse e cada vez son máis as persoas que fan uso deles no seu día a día. Xa sexa para consultar o tempo que vai facer mañá ou para establecer un recordatorio dunha cita médica próxima, a comodidade de utilizar directamente a nosa voz fai que estes dispositivos teñan cada vez máis defensores. A dificultade chega cando estes non recoñecen o noso idioma. Recordades a Moraima? A nena á que Siri non entendía.
Balidea é unha PEME galega con máis de vinte anos de experiencia no sector das TIC. Ao longo deste tempo abordou numerosos proxectos relacionados coa comunicación cos pacientes, os profesionais da saúde e a sociedade en xeral. Esta especialización no deseño e desenvolvemento de solucións de comunicación levou ao equipo de I+D+i de Balidea a cuestionarse como será a comunicación co mundo dixital nos próximos anos. E unha cousa está clara: posto que a comunicación por voz terá un papel moi destacado, a tecnoloxía ten que garantir a comunicación no noso idioma, sexa cal sexa. Así es como surge el proyecto falAi, en colaboración co centro de investigación AtlanTTic da Universidade de Vigo.
Leticia Río: A intelixencia artificial veu para quedar, que utilidade ten para poñer en valor as linguas minoritarias?
Andrés Piñeiro: Para poder comunicarnos co mundo dixital mediante voz as máquinas teñen que entender o que dicimos e reaccionar en consecuencia. Para logralo trabállase en varias ramas da intelixencia artificial. Por exemplo, o Procesado da Linguaxe Natural, coas súas siglas PLN, ten como obxectivo crear máquinas ou solucións que entendan datos de texto ou voz e ofrezan unha resposta dunha forma ou outra. O PLN combina lingüística computacional con modelos estadísticos de aprendizaxe máquina (en inglés “machine learning”) ou aprendizaxe profundo (“Deep learning”).
Mari Carmen López: A Intelixencia Artificial pode desempeñar un papel fundamental na promoción e preservación de linguas con poucos recursos. Por exemplo, mediante ferramentas de tradución automática ou recoñecemento de voz podemos eliminar barreiras lingüísticas, e contribuir ao desenvolvemento de aplicacións e solucións que axuden a revitalizar o idioma entre as xeneracións máis novas, asegurando a supervivencia e enriquecemento cultural.
Calquera lingua humana pode ser tratada con estas tecnoloxías, pero existen limitacións económicas. Non é o mesmo desenvolver tecnoloxía para o idioma Chino Mandarín, que o falan ao redor de 1118 millones de persoas, que para o Islandés, que só o falan alrededor de 320.000 persoas. Por suposto, tamén existen limitacións prácticas ou estratéxicas. Pensemos onde se localizan ou que idioma falan as principais compañías mundiais do sector: Google, Amazon, Microsoft…
É importante que exista unha estratexia común e coordinada en toda Europa que garanta a vida da nosa enorme riqueza cultural e lingüística no mundo dixital.
balidea
L.R: Entón, como xurde o proxecto falAI?
A.P..: Para que a tecnoloxía funcione é necesario contar con recursos para adestrar os algoritmos. Cando falamos de recursos referímonos a “exemplos de voces” ou “exemplos de frases”. De igual modo que un neno cando aprende a falar necesita escoitar aos seus pais, á súa contorna…, as máquinas necesitan de exemplos para aprender. Linguas como o galego, o danés, o sueco…, teñen poucos recursos (voces, datasets…). Non nos quedaba máis remedio que crealos e así é como deseñamos falAI, que non é outra cousa que un “crowdfunding de recursos”.
M.C.: Foi un esforzo enorme e un gran traballo en equipo. Ademais, tivemos a sorte de contar con apoio económico de ELE (European Language Equality) a través dunha convocatoria competitiva na que a proposta de Balidea foi seleccionada entre outras moitas de toda Europa. Trátase dun consorcio europeo encargado de escribir a Axenda e Folla de Ruta de Europa para garantir a igualdade dixital das nosas linguas para o 2030.
L.R: Contades cuns obxectivos claros, cales son?
M.C.: O noso obxectivo é desenvolver tecnoloxía que axude ás persoas no seu día a día. Comunicarte coas máquinas por voz pode servir para axudar ás persoas con discapacidade visual, axudar ás persoas con dificultades de mobilidade fina (dificultades para escribir), para optimizar procesos de comunicación ou simplemente para apoiar a persoas con dificultades para relacionarse cun ordenador. Pensemos nos nosos avós. No caso de Balidea, e dada a nosa traxectoria no sector da saúde dixital, ou e-salud, queremos desenvolver tecnoloxía para mellorar procesos neste ámbito. Agora mesmo estamos, a través dun proxecto europeo, deseñando protocolos de cribado e seguimento de pacientes crónicos nas súas casas. Trátase de automatizar tareas repetitivas que permitan aos médicos centrarse noutras onde aporten máis valor e axudar aos pacientes a facilitar información estruturada mediante a voz.
L.R: Trátase dun proxecto no que a colaboración da sociedade galega foi clave. Cal foi a acollida?
M.C.: Espectacular! Foi incríble e emocionante. Para que vos fagades a idea do impacto só había unha iniciativa previa que conseguira 30 horas de “recursos”, é dicir, de voces. O noso soño era superar esa iniciativa. E na primeira semana xa tiñamos 100 horas de gravación!
A.P.: Conseguimos que miles de persoas participaran e doaran a súa voz, obtendo multitude de acentos e voces en rangos de idade normalmente infrarrepresentados, como é o caso das persoas maiores. Ademais, a nivel investigación, falAI tamén foi un éxito enorme, xa que se converteu na base de datos para asistentes virtuais, dispoñible publicamente, máis grande do mundo, por riba das bases de datos dispoñibles en inglés.
L.R: Mirando ao futuro, que proxección ten FALAI? Cales son os próximos pasos?
A.P.: FalAI, como che comentaba, foi unha especie de campaña para obter recursos cos que adestrar os nosos algoritmos. Puxemos todos os recursos obtidos a disposición de quen queira utilizalos para desenvolver tecnoloxía que permita o uso do noso idioma no mundo dixital. O dataset xerado está dispoñible nun repositorio público europeo creado polo consorcio do proxecto europeo ELE e será de utilidade para o desenvolvemento de asistentes virtuis e recoñecedores de voz en galego.
M.C.: Ademais, foi o éxito de falAI o que abriu as portas a Balidea para colaborar con DFKI, o centro de investigación alemán de Intelixencia Artificial. Actualmente Andrés está en Berlín, colaborando no proxecto openGPT-X (https://opengpt-x.de/en/), desenvolvendo modelos de recoñecemento de voz multilingües.
En definitiva, falAI será unha das bases de datos que contribúan a crear a seguinte xeración de aplicacións relacionadas coa fala en galego. E, por suposto, aplicarémola en todos os nosos proxectos de asistentes conversacionais en Balidea. Ademais, tamén será moi importante no campo da investigación, permitindo probar estas aplicacións en bases de datos máis amplas, con maior variedade de falantes e dominios.