El modelo de inteligencia artificial de Google llegará en tres versiones para competir contra OpenAI. La más poderosa, Ultra, supera a expertos humanos en comprensión masiva de multitareas.
Google ha anunciado finalmente el lanzamiento de Gemini 1.0, su modelo de lenguaje grande (LLM) de inteligencia artificial “más poderoso, capaz y general” hasta la fecha.
De acuerdo con Sundar Pichai, CEO de Alphabet, esta tecnología está construida para ser multimodal y está optimizada para tareas de gran magnitud, como para las consultas cotidianas de las personas.
Lo que se sabe de Gemini
Gemini está siendo trabajado desde el campo de Google Deepmind, el departamento combinado para inteligencia artificial de la empresa.
La compañía señala que este LLM está diseñado desde cero para la multimodalidad: un razonamiento fluido a través de imágenes, texto, videos, audio y hasta código de programación.
Dentro de las promesas de creación está poder desarrollar código a partir de imágenes, explicar tablaturas de música, generar texto e imágenes en conjunto y más.
Gemini llegará al mercado en tres tamaños: Ultra, Pro y Nano.
De acuerdo con Google, Gemini Ultra supera los resultados actuales de última generación “en 30 de los 32 puntos de referencia académicos ampliamente utilizados”. Además, asegura que, con una puntuación del 90 % (en comparación del 86 % de GPT-4), Ultra es el primer modelo que supera a los expertos humanos en “comprensión masiva de los lenguajes multitareas”, una combinación de 57 materias como matemáticas, física, historia, derecho, medicina y ética para evaluar ambos mundos. conocimientos y habilidades para la resolución de problemas.
Versiones listas para probar
Pero si ya quieres ir probando cómo marcha esta tecnología, desde hoy el modelo Gemini Pro se encuentra vinculado al chatbot Bard en la mayor actualización del sistema hasta la fecha (aunque solo en inglés).
Con este apoyo del LLM, Bard ahora podrá tener un razonamiento y una comprensión más avanzada en cada una de las respuestas. ¿Ultra llegará a Bard? Sí, con la finalidad de resolver tareas altamente complejas, pero aún en 2024.
Por otro lado, la versión más pequeña de Gemini, Nano, será eficiente para que pueda ser incluida en equipos como los propios celulares.
Según Google, los desarrolladores de Android podrán inscribirse en un programa de acceso temprano a través de Android AICore y los usuarios del Pixel 8 Pro ya podrán ver sus bondades en funciones como Resumir del Grabador de voz y Respuesta inteligente del Gboard en los próximos días.
Google cierra su blog señalando que han construido Gemini “de manera responsable” desde el principio, incorporando salvaguardas y trabajando junto con socios para hacerlo “más seguro e inclusivo”.
Te recomendamos
Comparte esta noticia