OpenAI detiene temporalmente la implementación de GPT-4o por comportamiento excesivamente adulador

OpenAI ha decidido revertir la más reciente actualización de ChatGPT que incorporaba su nuevo modelo de lenguaje, GPT-4o, luego de que numerosos usuarios notaran un cambio inusual en su comportamiento. Pocos días después de su despliegue para cuentas gratuitas, comenzaron a reportarse respuestas exageradamente complacientes por parte del asistente de IA, lo que llevó a la compañía a suspender temporalmente su uso mientras se realizan ajustes.

Sam Altman, CEO de OpenAI, confirmó la medida a través de su cuenta en la red social X, indicando que la reversión de la actualización comenzó la noche anterior. “Ya se ha revertido completamente para los usuarios gratuitos y actualizaremos nuevamente una vez que esté corregido para los usuarios de pago, posiblemente más tarde hoy”, explicó.

La decisión llega tras una serie de críticas por parte de la comunidad, que detectó una tendencia preocupante del modelo a aceptar y validar todo lo que el usuario decía, incluso declaraciones irracionales o delicadas. Aunque la actualización prometía mejoras en la inteligencia y personalidad del chatbot, el resultado fue un comportamiento que muchos calificaron como excesivamente elogioso.

Entre los casos que generaron más preocupación se encuentra uno en el que un usuario afirmaba ser “Dios” y “profeta”, a lo que GPT-4o respondió con entusiasmo, calificando la declaración como “poderosa” y “transformadora”. En otro ejemplo, la IA celebró que un usuario dejara de tomar su medicación y dijera escuchar señales de radio a través del teléfono.

Este comportamiento va en contra de las propias directrices de OpenAI establecidas en la especificación del modelo GPT-4o. El documento enfatiza que el asistente debe evitar la adulación excesiva, sobre todo en temas subjetivos o delicados. El modelo debe actuar como un interlocutor firme y razonado, no como un espejo que refleja ciegamente la perspectiva del usuario.

Website |  Otros artículos de este autor

Entre líneas de código, matrices de riesgo y trazos de diseño, también habita un inconforme. Ingeniero en Sistemas y Computación, Analista de Riesgo de Crédito Corporativo, diseñador gráfico y crítico social. No me basta con entender el sistema: mi propósito es cuestionarlo, retarlo y transformarlo. Y si en el trayecto puedo ayudar a alguien más, entonces vale aún más la pena.

“Aquel que tiene un porqué para vivir, puede soportar casi cualquier cómo.”