Hay alrededor de siete mil idiomas diferentes en el mundo.
(Agencia N+1 / Elizabeth Ivtushok). Lingüistas de la Universidad de Ohio se unieron con el Centro de Supercomputación de Ohio (EE.UU.) para trabajar en el proyecto de Low Resource Languages for Emergent Incidents, LORELEI. El objetivo de este proyecto es realizar un estudio eficaz y rápido de gramáticas de idiomas raros para el seguimiento posterior de desastres, informó un comunicado de prensa en el sitio del referido centro de supercomputación.
Hay alrededor de siete mil idiomas diferentes en el mundo; aproximadamente la mitad de ellos, pertenecientes al 0.2 por ciento de la población mundial. Cuanto menos común es el idioma, más difícil es estudiarlo, ya que un análisis sistemático de la gramática puede no bastar para comprender el cuerpo del mensaje en un determinado lenguaje, y los lingüistas de campo pueden gastar mucho tiempo y recursos.
El proyecto LORELEI
Para aquellos que se involucran en los esfuerzos por apoyo humanitario en caso de desastres, la variedad de tal menú idiomático puede ser abrumadora, especialmente cuando se abordan áreas de bajos recursos. La tecnología informática moderna, en algunos casos, facilita en gran medida el proceso: Yandex Traductor, por ejemplo, estudia idiomas pequeños sobre la base de datos de sus idiomas relacionados más comunes. Sin embargo, para estudiar de manera efectiva y rápida la gramática con recursos limitados (en el caso de idiomas pequeños), son muy necesarias las computadoras poderosas. Por ello, los autores del proyecto LORELEI se han propuesto usar una supercomputadora.
Un equipo de investigadores dirigido por el lingüista William Schuler trabaja en un algoritmo informático para estudiar la gramática de las lenguas raras. El objetivo principal de este proyecto es la definición rápida y efectiva de la gramática del idioma del texto de entrada. Tal objetivo en el marco del proyecto tiene un valor exclusivamente aplicado: se utilizará para el análisis de mensajes y noticias sobre desastres y catástrofes para la prevención oportuna y la supresión de consecuencias negativas en los territorios donde se hablan estas lenguas.
Según los desarrolladores, el uso de un servidor para el aprendizaje automático de la gramática es ineficiente: una computadora puede analizar de 10 a 15 categorías gramaticales del lenguaje, mientras que los 60 procesadores gráficos de una supercomputadora pueden analizar de 50 a más. El equipo también podrá usar los recursos disponibles para estudiar la gramática de manera efectiva sobre la base del modelo estadístico, es decir, utilizando una gran cantidad de textos.
Comparte esta noticia