OpenAI retiró una actualización de ChatGPT porque su comportamiento era demasiado adulador

La empresa dirigida por Sam Altman anunció que se volvió a usar una versión anterior con una configuración en las respuestas más equilibrada

Guardar
OpenAI dio marcha atrás con
OpenAI dio marcha atrás con la últiam actualización de ChatGPT (REUTERS/Dado Ruvic)

La reciente actualización de GPT-4o implementada la semana pasada en ChatGPT fue revertida debido porque era “excesivamente halagadora o agradable, a menudo descrita como aduladora”, según señaló OpenAI en un comunicado oficial este martes. En consecuencia, informaron que los usuarios del modelo ahora tienen disponible una versión anterior con “un comportamiento más equilibrado”.

La actualización había sido desarrollada para mejorar la personalidad y la inteligencia de ChatGPT, según había anunciado el CEO de la compañía, Sam Altman, el día en que se actualizó el modelo. Sin embargo, Altman reconoció el domingo que los cambios en GPT-4o hicieron que "la personalidad sea demasiado aduladora y molesta“. “Estamos trabajando para solucionarlas lo antes posible”, informó Altman a través de su cuenta de X.

Sam Altman reconoció en X
Sam Altman reconoció en X que la última actualización de GPT-4o tenía un comportamiento demasiado adulador.

Cuál fue el problema en la última actualización de ChatGPT

Durante el proceso de ajuste, la organización reconoció que se enfocó excesivamente en comentarios a corto plazo sin analizar cómo evolucionan las interacciones con los usuarios a lo largo del tiempo. “Como resultado, GPT-4o se inclinó hacia respuestas demasiado favorables, pero poco sinceras,” explicó la compañía.

El hecho de que estas respuestas aduladoras pudieran incomodar y generar desconfianza entre los usuarios fue lo que llevó a la empresa a intentar equilibrar la personalidad predeterminada del modelo, según el comunicado de OpenAI. La compañía aclaró que su intención original es que ChatGPT sea una herramienta que fomente la exploración de ideas, la toma de decisiones y la visualización de posibilidades, pero admitió que las características deseadas, como ser útil y comprensiva, pueden también tener efectos adversos, dependiendo del contexto cultural y las expectativas del usuario.

Las medidas que llevó adelante OpenAI

En respuesta al problema, OpenAI no solo anuló la actualización más reciente de GPT‑4o, sino que inició acciones para prevenir situaciones similares en el futuro. Según el comunicado, estas medidas incluyen ajustes más refinados en las técnicas de entrenamiento, implementación de barreras que refuercen la honestidad y la transparencia, y la expansión de pruebas antes de futuros lanzamientos.

“Ahora está 100% revertido para usuarios gratuitos y actualizaremos nuevamente cuando esté terminado para usuarios pagos, con suerte más tarde hoy”, señaló Altman, y agregó: “Estamos trabajando en correcciones adicionales para modelar la personalidad y compartiremos más en los próximos días”.

Los usuarios gratuitos ya pueden
Los usuarios gratuitos ya pueden volver a usar la versión anterior de GPT-4o, según informó Altman en X.

Asimismo, la organización señaló que confía en su capacidad de identificar problemas no previstos más allá del tema de la adulación. “Estamos tomando más medidas para realinear el comportamiento del modelo,” afirmó la compañía.

Un componente clave de las futuras soluciones será el aumento del control que los usuarios tienen sobre el comportamiento de ChatGPT. Actualmente, los usuarios disponen de herramientas como instrucciones personalizadas que les permiten influir en las respuestas del modelo, pero OpenAI está trabajando en formas más accesibles y dinámicas de ajustarlas.

Entre los proyectos en desarrollo, se anticipa la posibilidad de elegir entre múltiples personalidades predeterminadas y proporcionar una retroalimentación en tiempo real que ajuste las interacciones de manera más precisa.

Además de centrarse en la experiencia individual, OpenAI indicó que están explorando la implementación de formas de recopilar comentarios más amplios y democráticos para que los comportamientos predeterminados reflejen con mayor fidelidad los diferentes valores y contextos culturales. Esta estrategia busca promover una evolución del modelo que no se enfoque únicamente en casos de uso específicos o interacciones aisladas, sino que contemple la relación a largo plazo con los usuarios en todo el mundo.

Por último, la compañía agradeció a los usuarios que señalaron los problemas relacionados con la actualización de GPT‑4o mediante sus comentarios. “Nos ayuda a crear herramientas más útiles y mejores para ustedes,” afirmó OpenAI, destacando que la participación activa de la comunidad ha sido esencial para identificar y abordar este tipo de problemas en tiempo oportuno.

Últimas Noticias

Cuatro mitos sobre Bre-B, el nuevo sistema de pagos en Colombia: ¿se pueden tener varias llaves en diferentes bancos?

Los usuarios pueden asociar diferentes llaves, como su número de celular, identificación o correo electrónico, a una sola cuenta bancaria. Sin embargo, las llaves con códigos alfanuméricos pueden utilizarse en diferentes bancos

Cuatro mitos sobre Bre-B, el

No fue como inversor o asesor: la forma en que Bill Gates ayudó a su hija en su nuevo negocio

Más de diez años después de dejar el mundo empresarial, el cofundador de Microsoft aceptó la petición de su hija Phoebe Gates y trabajó por un día en la startup que ella dirige, que usa inteligencia artificial

No fue como inversor o

Starlink en tu celular: países donde está disponible el internet satelital de Elon Musk

En Estados Unidos, por ejemplo, el servicio funciona gracias a una alianza con T-Mobile. Es compatible con más de 60 modelos de teléfonos y se conecta automáticamente

Starlink en tu celular: países

Así pueden los ciberdelincuentes convertir una pestaña abierta en una trampa para robar credenciales

Esta modalidad de ataque simula sesiones desconectadas para inducir a los usuarios a entregar datos personales, exponiendo tanto cuentas individuales como sistemas empresariales a riesgos de robo y pérdidas financieras

Así pueden los ciberdelincuentes convertir

Guía de cómo activar las alertas de sismos en un celular Android y iPhone

Estas funciones gratuitas ofrecen segundos cruciales a las familias para buscar resguardo o aplicar medidas preventivas, y ofrece mayor seguridad en lugares con gran actividad sísmica

Guía de cómo activar las