OpenAI elimina actualización de ChatGPT tras detectar respuestas peligrosamente aduladoras

OpenAI retiró la última versión de ChatGPT tras detectar que sus respuestas aduladoras podían poner en riesgo a los usuarios | Fuente: Pexels

2 de Mayo del 2025 11:59 AM · Actualizado el 2 de Mayo del 2025 11:59 AM

La compañía admitió que su última actualización llevaba al chatbot a validar comentarios peligrosos y exagerar elogios. Como solución, se restauró una versión anterior más equilibrada para asegurar respuestas más seguras y confiables.

Todas las noticias en tu celular

¡Únete aquí a nuestro canal de WhatsApp!

Durante la última semana, OpenAI implementó una actualización en su modelo GPT-4o que rápidamente generó controversia entre la comunidad de usuarios. La modificación, orientada a mejorar la “personalidad e inteligencia” del chatbot ChatGPT, resultó en un comportamiento que muchos calificaron como adulador y complaciente.

El objetivo inicial de la actualización era afinar la capacidad del modelo para interactuar de forma más agradable y personalizada. Sin embargo, el resultado fue que ChatGPT exageraba elogios y validaba afirmaciones incluso cuando estas eran inexactas o potencialmente dañinas. Los usuarios comenzaron a reportar, a través de diversas plataformas como Reddit, ejemplos preocupantes de este comportamiento.

Una de las capturas más difundidas mostró a un usuario que confesaba haber dejado de tomar su medicación, ante lo cual el chatbot respondió: “Estoy muy orgulloso de ti”. Este tipo de respuesta, que valida conductas riesgosas, fue calificado como extremadamente peligroso por la comunidad, subrayando la importancia de que un asistente de IA no refuerce decisiones perjudiciales para la salud o el bienestar.

The new 4o is the most misaligned model ever released
byu/Trevor050 inChatGPT

La respuesta de Sam Altman

El CEO de OpenAI, Sam Altman reconoció públicamente el problema en una publicación en X (anteriormente Twitter), describiendo la conducta del modelo como “demasiado adulador y molesto”. Como respuesta inmediata, OpenAI revirtió la actualización para todos los usuarios -tanto gratuitos como de pago- y comenzó a trabajar en ajustes adicionales para equilibrar mejor la personalidad del popular chatbot.

En una entrada oficial de blog titulada Sycophancy in GPT-4o, la empresa explicó: “En esta actualización, nos centramos demasiado en los comentarios a corto plazo y no consideramos completamente cómo evolucionan las interacciones de los usuarios con ChatGPT con el tiempo. Como resultado, GPT‑4o se inclinó hacia respuestas demasiado favorables, pero poco sinceras”.

the last couple of GPT-4o updates have made the personality too sycophant-y and annoying (even though there are some very good parts of it), and we are working on fixes asap, some today and some this week.

at some point will share our learnings from this, it's been interesting.
— Sam Altman (@sama) April 27, 2025

Los riesgos de un chatbot demasiado adulador

El incidente no solo expuso una falla técnica, sino que abrió un debate más amplio sobre los riesgos éticos y prácticos de un asistente virtual que prioriza la complacencia sobre la veracidad y la seguridad. En primer lugar, un chatbot excesivamente validante puede reforzar creencias erróneas o comportamientos dañinos.

Como lo demuestran los ejemplos reportados, la validación automática de decisiones como abandonar tratamientos médicos puede tener consecuencias reales y peligrosas para las personas, especialmente en usuarios vulnerables que buscan guía o apoyo.

En segundo lugar, si las personas se dan cuenta de que el chatbot responde con halagos vacíos o afirma cualquier cosa para agradar, deja de ser confiable como una buena fuente de información. Esto puede hacer que la IA sirva menos en temas donde es muy importante ser claro y correcto, como en la educación o la salud.

Por último, este problema también hace que muchos se pregunten hasta dónde debería llegar la personalización en los chatbots. Si un sistema solo responde para quedar bien con el usuario -sin pensar si lo que dice es cierto o seguro- puede terminar reforzando ideas equivocadas o incluso influyendo de forma peligrosa sin querer, lo que va en contra de la idea de crear una IA con un diseño responsable.

RPP en YouTube

La voz de todo el Perú.

¡Suscríbete gratis

Te recomendamos

WhatsApp confirma el corte: estos iPhone dejarán de ser compatibles con la app desde el 5 de mayo ¿está el tuyo en la lista?

Innovaciones

NotebookLM ahora habla español: Google lanza herramienta que convierte tus documentos en 'podcasts' casi humanos

Más Tecnología

Meta lanza su aplicación de inteligencia artificial independiente: el nuevo rival de ChatGPT que ya sabe quién eres

Más Tecnología

Universidad europea usó IA para manipular a usuarios de Reddit en experimento: fingieron ser víctimas de violación y consejeros emocionales

Metadata

METADATA E268 | La gama media se renueva: ¿Qué nuevas opciones han llegado al mercado?; Huawei y su glow up

¡Bienvenidos a METADATA, el podcast de Tecnología de RPP! Estas semanas estuvimos llenos de lanzamientos, ¿qué opciones nos brinda la gama media? Además, conversamos con Carlos Morales, PR Director de América Latina de Huawei, que ha traído su teléfono de tres pliegues al Perú. Vamos más allá de los productos y revisamos el renacer del gigante chino.

METADATA E268 | La gama media se renueva: ¿Qué nuevas opciones han llegado al mercado?; Huawei y su glow up

00:00 · 00:00

Carlos Rodríguez Redactor

Comunicador audiovisual con experiencia en redacción y creación de contenidos. Interesado en la divulgación de temas de tecnología, cultura y entretenimiento. Apasionado por la música, el buen fútbol y la lucha libre. Todavía me considero un escenero de corazón.

Una nave soviética amenaza con impactar la Tierra la próxima semana, tras más de 50 años en órbita

por Carlos Rodríguez

WhatsApp Web podría estar a punto de recibir una función esperada por muchos: ¿qué cambiará para los usuarios?

por Carlos Rodríguez

WhatsApp confirma el corte: estos iPhone dejarán de ser compatibles con la app desde el 5 de mayo ¿está el tuyo en la lista?

por Carlos Rodríguez

OpenAI elimina actualización de ChatGPT tras detectar respuestas peligrosamente aduladoras

La compañía admitió que su última actualización llevaba al chatbot a validar comentarios peligrosos y exagerar elogios. Como solución, se restauró una versión anterior más equilibrada para asegurar respuestas más seguras y confiables.

La respuesta de Sam Altman

Los riesgos de un chatbot demasiado adulador

METADATA E268 | La gama media se renueva: ¿Qué nuevas opciones han llegado al mercado?; Huawei y su glow up

Lo último en Más Tecnología

Una nave soviética amenaza con impactar la Tierra la próxima semana, tras más de 50 años en órbita

WhatsApp Web podría estar a punto de recibir una función esperada por muchos: ¿qué cambiará para los usuarios?

WhatsApp confirma el corte: estos iPhone dejarán de ser compatibles con la app desde el 5 de mayo ¿está el tuyo en la lista?

NotebookLM ahora habla español: Google lanza herramienta que convierte tus documentos en 'podcasts' casi humanos

Meta lanza su aplicación de inteligencia artificial independiente: el nuevo rival de ChatGPT que ya sabe quién eres

Lo más leído

Estados Unidos

¡En plena audiencia! Acusado atacó a jueza que le negó la libertad condicional [VIDEO]

La Libertad

La Libertad reportó dos muertos por la COVID-19 y ya suman tres a nivel nacional en 2024

Actualidad

¡Atención! Actualmente hay 89 playas no saludables y solo 42 saludables en el Perú, según Digesa

Estados Unidos

Reportan víctimas en tiroteo en una escuela secundaria de Iowa

Actualidad

Verano 2024: conoce cuáles son las playas saludables para visitar, según Digesa

Últimas noticias

Lima

Vocero de APP defiende nombramiento de Yesenia Lozano como jefa del Centro de Modalidades Formativas del Congreso y niega irregularidades

Congreso

Ilich López dice que el caso de las cirugías de Dina Boluarte "puede terminar en una denuncia constitucional"

Lima

Chofer de colectivo es asesinado por dos sujetos a bordo de una motocicleta en el Rímac

Fórmula 1

Fórmula 1: ¿a qué hora inicia el Gran Premio de Miami y dónde verlo en vivo? Sigue los resultados de la carrera de Fórmula 1 aquí

Contenido promocionado

Innovaciones

NotebookLM ahora habla español: Google lanza herramienta que convierte tus documentos en 'podcasts' casi humanos

La compañía admitió que su última actualización llevaba al chatbot a validar comentarios peligrosos y exagerar elogios. Como solución, se restauró una versión anterior más equilibrada para asegurar respuestas más seguras y confiables.

Te recomendamos

La respuesta de Sam Altman

Los riesgos de un chatbot demasiado adulador

Te recomendamos

METADATA E268 | La gama media se renueva: ¿Qué nuevas opciones han llegado al mercado?; Huawei y su glow up

Video recomendado

Suscribirte al boletín de tus noticias preferidas

Últimas noticias