Meta, empresa matriz de Facebook, reveló su motor de generación de imágenes por IA llamado Make-A-Scene
Los generadores de imágenes mediante inteligencia artificial se han convertido en una tendencia digital que varias compañías tecnológicas están siguiendo. Ahora, además de las ya conocidas Craiyon (antes DALL-E mini) de OpenAI e Imagen de Google, Meta -empresa matriz de Facebook- se ha unido a esta simpática rama del arte tecnológico con su propia versión a la cual llama Make-A-Scene.
Tal como indicó a través de una publicación en su blog oficial, la firma espera adoptar esta nueva herramienta en su camino para desarrollar mundos inmersivos en el Metaverso, además de aportar a la creación de arte digital de alta calidad.
Con tan solo escribir una palabra o frase, el sistema comenzará un proceso en el que lo escrito pasará por un modelo de transformación, luego irá a una red neuronal que analiza el texto para desarrollar una comprensión contextual de la relación entre las palabras. Tras captar la esencia de lo que el usuario describe, la inteligencia artificial sintetizará una imagen usando un conjunto de redes generativas adversariales (GAN en inglés).
Una tecnología que avanza rápidamente
Debido a los múltiples esfuerzos que existen actualmente para entrenar modelos de inteligencia artificial con grupos de imágenes en alta definición que son cada vez más grandes y con descripciones textuales bien escogidas, los generadores más avanzados ya pueden crear imágenes fotorrealistas de prácticamente cualquier cosa que se les ordene. No obstante, este proceso cambia según la IA elegida.
Tenemos a Imagen de Google que usa un modelo de difusión “que aprende a convertir un patrón de puntos aleatorios en imágenes, comenzando con figuras de baja resolución para ir aumentando la resolución progresivamente”. Por otra parte, la IA Parti de Google “convierte primero una colección de imágenes en una secuencia de entradas de código, similar a las piezas de un puzzle. A continuación, se traduce un texto determinado en estas entradas de código y se crea una nueva imagen”.
El aporte de Meta en los generadores de imágenes por IA
Según apunta Mark Zuckerberg en la entrada sobre Make-A-Scene en el blog de Meta, si bien los sistemas antes mencionados pueden generar casi cualquier cosa, el usuario no tiene un verdadero control sobre los aspectos de dicha imagen en su forma final. “Para aprovechar el potencial de la IA para impulsar la expresión creativa, las personas deben poder dar forma y controlar el contenido que genera un sistema”, dijo el CEO de la compañía.
Por eso, lo que hace Make-A-Scene es incorporar los bocetos creados por el usuario a su sistema, dando como resultado una imagen de 2048 x 2048 px. Con esta combinación, el usuario podrá describir lo que desea en la imagen y, además, podrá controlar la composición general de la misma.
“Make-A-Scene demuestra cómo la gente puede utilizar tanto el texto como los dibujos simples para transmitir su visión con mayor especificidad, utilizando una variedad de elementos, formas, arreglos, profundidad, composiciones y estructuras”, indica Mark Zuckerberg.
Las pruebas de Make-A-Scene fueron alentadoras ya que los grupos de evaluadores humanos prefirieron este sistema de texto y dibujo sobre la de solo texto, dado que se ajustaba mejor a la descripción de la frase original en un 66% y al boceto original en un 99,54% de las veces. No obstante, por ahora la compañía no ha mencionado cuándo se pondrá a disposición del público.
Te recomendamos METADATA, el podcast de tecnología de RPP. Noticias, análisis, reseñas, recomendaciones y todo lo que debes saber sobre el mundo tecnológico. Para escucharlo mejor, #QuedateEnCasa.
Comparte esta noticia