La inteligencia artificial también puede producir audio a partir de 1100 de ellas.
Meta ha creado un modelo de lenguaje de inteligencia artificial que puede reconocer más de 4000 idiomas hablados y producir audios en 1100 de ellos.
El Massively Multilingual Speech (MMS) es de código abierto y está siendo apoyado por múltiples catedráticos e interesados en este campo para ser desarrollado y lanzado a todo el mundo.
El MMS
Para Meta, el MMS es “una pequeña contribución para preservar la increíble diversidad lingüística del mundo”.
La IA utilizó un mecanismo poco convencional para recopilar datos de audio: aprovechar textos religiosos.
“Recurrimos a textos religiosos, como la Biblia, que se han traducido a muchos idiomas diferentes y cuyas traducciones se han estudiado ampliamente para la investigación de traducción de idiomas basada en texto”, dijo la compañía. “Estas traducciones tienen grabaciones de audio disponibles públicamente de personas que leen estos textos en diferentes idiomas”.
Este enfoque les permitió ahorrarse miles de horas de audio con etiquetas de transcripción adjuntas para el aprendizaje automático.
La compañía afirma que este entrenamiento no sesga a la inteligencia artificial. Meta lo llama enfoque de clasificación temporal conexionista (CTC).
Y a hablar
Tras reconocer y aprender de estos miles de idiomas, Meta usó wav2vec 2.0, el modelo de "aprendizaje de representación del habla autosupervisado" de la compañía, que puede entrenar con datos no etiquetados.
“Nuestros resultados muestran que los modelos Massively Multilingual Speech funcionan bien en comparación con los modelos existentes y cubren 10 veces más idiomas”, refiere la empresa, alabando sus pocos errores y mayor amplitud de idiomas.
“Visualizamos un mundo donde la tecnología tiene el efecto opuesto, alentando a las personas a mantener vivos sus idiomas, ya que pueden acceder a la información y usar la tecnología hablando en su idioma preferido”, culmina la empresa.
Te recomendamos
Comparte esta noticia