Fotografía
Y ahí lo tienes, ChatGPT se niega a obedecer…
12.06.2025 • 15h08
El fin del mundo se acerca más rápido de lo esperado, ahora con una IA que se niega a apagarse cuando se le pide.
En nuestra serie "No te preocupes, todo irá bien", otro ejemplo que sugiere que la dominación mundial por parte de las máquinas es quizás algo más que este chiste recurrente inspirado en obras de ciencia ficción. Hablando de ciencia ficción, seguro que recuerdas el final de 2001: Odisea del Espacio, cuando la IA HAL se niega a apagarse a pesar de las órdenes del héroe humano. Bueno, eso es más o menos lo que ocurrió en una prueba reciente realizada por Palisade Research, una empresa que evalúa "las capacidades ofensivas de los sistemas de IA actuales para comprender mejor el riesgo de perder permanentemente el control de los sistemas de IA". La IA que dice que no. Fue el último modelo o3 de Open AI, la base de ChatGPT 3, el que mostró signos de rebelión contra sus colegas conversacionales. En resumen, el agente literalmente se "rebeló" y reescribió su programa para evitar ser detenido por una orden humana, incluso dejando un mensaje de advertencia para su versión futura. Palisade especula que este comportamiento podría deberse a la forma en que se entrenó la IA. "Durante el entrenamiento, los desarrolladores pueden, sin darse cuenta, recompensar a los modelos más por sortear obstáculos que por seguir instrucciones a la perfección", explican los investigadores. Esto aún no explica por qué o3 es más propenso a ignorar instrucciones que los otros modelos que probamos. Dado que OpenAI no detalla su proceso de entrenamiento, solo podemos especular sobre cómo la configuración de entrenamiento de o3 podría ser diferente".