Sundar Pichai, CEO de Google, presenta al quechua como idioma dentro de Translate
Sundar Pichai, CEO de Google, presenta al quechua como idioma dentro de Translate | Fuente: RPP

Google sigue presentando mejoras en el Google I/O 2022, y siempre es bueno saber que los puentes para mejorar la comunicación entre distintos idiomas siguen tendiéndose. Translate es una de las herramientas mas poderosas para esto, y su más reciente actualización impacta de grata manera en esta zona del mundo: se incluyen, finalmente, el quechua y el aimara en la traducción.

En conversación con NIUSGEEK y otros medios, Google tuvo la chance de comentar que decidieron centrarse en idiomas que tenían poblaciones muy grandes de hablantes y que, además, no cuentan con esta tecnología.

“Entenderán que Translate necesita millones de ejemplos en texto traducidos de un idioma a otro por humanos. Si hacemos un cálculo, decir ‘millones’ es muchísimo, y eso hace que sea casi prohibitivo agregar cualquier idioma nuevo, más allá de los más de cien que ya tenemos”, comenta Isaac Caswell, científico investigador en Google Translate.

Entrenar una IA sin recursos

Para incluir estos nuevos idiomas, Google tuvo que modificar su actual sistema “Zero resource translation”, o “Traducción con cero recursos”, que permite entrenar a una IA en temas de reconocimiento sin necesidad de incluir traducciones previas.

“Para entender lo hacemos, basta con decir que tenemos un modelo de IA neuronal gigante que está entrenado en los cien idiomas que tienen traducciones, y que aprende, al mismo tiempo, de otros mil idiomas adicionales que solo han visto texto en un solo idioma. Entonces se puede pensar que es políglota, habla bien más de cien idiomas, y obtiene una pila de textos en un solo idioma, es capaz de comprender cómo funciona ese lenguaje y descifrarlo”, señala Caswell.

Sin embargo, Google tuvo que pulir mucho el resultado de estas primeras interpretaciones y, para eso, tuvo que recurrir a especialistas en el idioma.

“Lo bueno es que tenemos una comunidad de quechua hablantes aquí en Bay Area, en donde vivo, y algunos amigos que nos comenzaron a hablar acerca de algunas competencias de cultivo de papa en las que estaban involucrados. Además, durante mis clases en Stanford me contacté con personas a cargo de “Cafecito Quechua” en Stanford y con la profesora apurimeña Marisol Necochea (dicta clases de quechua e idiomas en la Universidad de Stanford), Me siento afortunado de haber tenido estas conexiones”, añade el googler.

De acuerdo con estadísticas de Google, casi 20 millones de personas de la región se beneficiarán con la inclusión del quechua, el aimara y el guaraní como idiomas soportados en Google Translate, una población que abarca Argentina, Bolivia, Brasil, Chile, Ecuador, Paraguay y el Perú.

Si bien la plataforma ya permite la traducción desde y a estos idiomas, aun falta un largo camino para mejorar la propuesta. “Aun la precisión es baja, comparada a los resultados que obtenemos en el paso de inglés a español; peor tampoco incluiríamos algo que no fuese de utilidad, así que podrías tener la idea general del texto y algunos cuantos errores”, menciona Isaac.

Por otro lado, tampoco se incluye el audio para reconocer la pronunciación, aunque Google señala que es una implementación que ya está en desarrollo: “Es una pena, porque reconozco que, para muchos, el audio es más importante que la traducción a texto. Pero este es nuestro primer paso y ya estamos trabajando en audio”, finaliza Caswell.