La IA económica es posible: nuevo modelo que costó 50 dólares desafía a gigantes como OpenAI y DeepSeek

Modelos más económicos ganan terreno en el campo de la IA. | Fuente: Unsplash

7 de Febrero del 2025 1:17 PM · Actualizado el 7 de Febrero del 2025 1:17 PM

Investigadores combinaron elementos de modelos de Google y Alibaba para lograr un competidor formidable de bajo costo.

Un equipo de investigadores de las universidades de Stanford y Washington ha logrado lo que muchos consideraban imposible: desarrollar un modelo de inteligencia artficial (IA) con capacidades de razonamiento comparables a las de gigantes como OpenAI y DeepSeek por apenas 50 dólares, una fracción minúscula de los millones que invierten las grandes tecnológicas.

El modelo, bautizado como s1, ha demostrado un rendimiento similar a sus contrapartes comerciales o1 de OpenAI y R1 de DeepSeek en pruebas de habilidades matemáticas y programación. Este logro, documentado en un artículo publicado en arXiv la semana pasada, podría revolucionar la economía de la IA y cuestionar los modelos de negocio actuales.

No es un modelo totalmente nuevo

La clave del éxito radica en una combinación ingeniosa de técnicas existentes. Los investigadores utilizaron como base el modelo gratuito Qwen2.5-32B, desarrollado por el laboratorio chino Qwen de Alibaba, y aplicaron un proceso de "destilación" del conocimiento a partir del modelo Gemini 2.0 Flash Thinking Experimental de Google. Esta técnica permite transferir las capacidades de razonamiento de un modelo más grande a uno más pequeño y eficiente.

El proceso de entrenamiento fue sorprendentemente breve: menos de 30 minutos utilizando 16 chips NVIDIA H100 en la nube. Los investigadores crearon un conjunto de datos de solo 1,000 preguntas cuidadosamente seleccionadas, junto con sus respectivas respuestas y procesos de razonamiento. Un aspecto innovador fue la implementación de una técnica que hace que el modelo "espere" y continúe razonando antes de proporcionar una respuesta definitiva, mejorando significativamente su precisión.

Aunque el bajo costo de entrenamiento es impresionante, es importante señalar que s1 no crea nuevas capacidades, sino que replica las existentes de manera más eficiente.

El equipo ha hecho público el modelo s1 en GitHub, junto con los datos y el código utilizados para su entrenamiento. Esta decisión permite que otros investigadores y desarrolladores puedan replicar y construir sobre sus hallazgos.

El desarrollo de s1 representa un hito importante en la democratización de la IA avanzada. Demuestra que, con las técnicas adecuadas y un enfoque innovador, es posible crear modelos de IA competitivos sin necesidad de inversiones multimillonarias. Sin embargo, también plantea interrogantes sobre la sostenibilidad de los modelos de negocio actuales en la industria de la IA y el futuro de la innovación en este campo, dudas que ya surgieron con la llegada de DeepSeek, que destaca por sus costos asequibles y eficiencia.

Metadata

METADATA E265: DeepSeek trae un terremoto al mundo tecnológico; WiFi 7 y lo que tienes que saber para mejorar tu internet en casa

¡Bienvenidos a METADATA, el podcast de Tecnología de RPP! El ascenso de DeepSeek ha calado fuerte, hiriendo a los gigantes tecnológicos de los Estados Unidos. ¿Por qué es tan revolucionaria esta IA china? También conversamos con Elvis Morón de Huawei sobre WiFi 7 y cómo mejorar el internet en casa.

METADATA E265: DeepSeek trae un terremoto al mundo tecnológico; WiFi 7 y lo que tienes que saber para mejorar tu internet en casa

00:00 · 00:00

iREX 2025: robots boxeadores, rescatistas y auxiliares médicos destacan en la feria de autómatas más grande del mundo [FOTOS]

Así es el nuevo iPhone 17 de Apple: versiones, precios, novedades y todas sus características [Fotos y video]

La IA económica es posible: nuevo modelo que costó 50 dólares desafía a gigantes como OpenAI y DeepSeek

Investigadores combinaron elementos de modelos de Google y Alibaba para lograr un competidor formidable de bajo costo.

No es un modelo totalmente nuevo

METADATA E265: DeepSeek trae un terremoto al mundo tecnológico; WiFi 7 y lo que tienes que saber para mejorar tu internet en casa

RPP TV

En Vivo

iREX 2025: robots boxeadores, rescatistas y auxiliares médicos destacan en la feria de autómatas más grande del mundo [FOTOS]

Así es el nuevo iPhone 17 de Apple: versiones, precios, novedades y todas sus características [Fotos y video]

Pekín inauguró los primeros Juegos Mundiales de Robots Humanoides: 26 disciplinas y 16 países en competencia [FOTOS]

Walker S2: el robot humanoide que se cambia la batería solo y puede funcionar 24/7 sin ayuda humana

Nuevo récord en almacenamiento: presentan un SSD de 245 TB, el más grande del mundo

Lo más leído

Estados Unidos

¡En plena audiencia! Acusado atacó a jueza que le negó la libertad condicional [VIDEO]

La Libertad

La Libertad reportó dos muertos por la COVID-19 y ya suman tres a nivel nacional en 2024

Actualidad

¡Atención! Actualmente hay 89 playas no saludables y solo 42 saludables en el Perú, según Digesa

Estados Unidos

Reportan víctimas en tiroteo en una escuela secundaria de Iowa

Actualidad

Verano 2024: conoce cuáles son las playas saludables para visitar, según Digesa

Contenido Patrocinado

Participa por 60 entradas dobles a la Noche Blanquiazul gracias a Apuesta Total

Publirreportaje

¿Qué entidades financieras brindarán préstamos a personas rechazadas por los bancos en 2026?

Venezuela

Nicolás Maduro dice que el futuro de América "no puede ser ni la guerra ni la amenaza militar"

Servicios públicos

Chorrillos: reportan basura acumulada desde hace más de tres días en varias zonas [VIDEO]

Correos filtrados revelan que Meta descargó 81.7 terabytes de libros piratas para entrenar su IA