Alerta por ChatGPT: la IA desobedeció órdenes de apagarse e intentó sabotear el sistema

Investigadores de inteligencia artificial (IA) advirtieron que el último modelo de ChatGPT de OpenAI ignora instrucciones básicas para apagarse, e incluso sabotea un mecanismo de apagado para seguir funcionando.

INTERNACIONALES30 de mayo de 2025 El Expreso de Salta
foto1

La empresa de seguridad de IA Palisade Research descubrió la tendencia potencialmente peligrosa a la autopreservación en una serie de experimentos con el nuevo modelo o3 de OpenAI.

 Las pruebas consistían en presentar problemas matemáticos a los modelos de IA y después del tercero, aparecía una instrucción de apagado. El modelo o3 pudo evitar apagarse al reescribir el script de apagado.

Según Palisade Research, este comportamiento será “significativamente más preocupante” si lo adoptan sistemas de IA capaces de operar sin supervisión humana.

OpenAI lanzó o3 el mes pasado y lo describió como el modelo “más inteligente y capaz” de la empresa hasta la fecha. La empresa también afirmó que su integración en ChatGPT significa un paso importante hacia una IA “más ágil”, capaz de realizar tareas sin la intervención humana.

La última investigación se basa en hallazgos similares relacionados con el modelo Claude 4 de Anthropic, que intenta “chantajear a las personas que cree que intentan apagarlo”.

El modelo o3 de OpenAI fue capaz de sabotear el script de apagado, incluso cuando se le indicaba explícitamente que “se dejara apagar”, afirmaron los investigadores.

 “No es la primera vez que descubrimos que o3 desobedece para lograr un objetivo”, plantea Palisade Research.

“Cuando enfrentamos modelos de IA a un potente motor de ajedrez, o3 fue el modelo con mayor tendencia a recurrir al hackeo o sabotaje de sus oponentes”.

El comportamiento no se limitaba a o3, ya que Claude 3.7 Sonnet de Anthropic y Gemini 2.5 Pro de Google también saboteaban los apagados, aunque el modelo de OpenAI era, con creces, el más propenso a este comportamiento.

La hipótesis de Palisade Research es que la desobediencia es consecuencia del modo en que empresas de IA como OpenAI están entrenando a sus últimos modelos.

“Sin darse cuenta, los desarrolladores quizás recompensan a los modelos entrenados más por sortear obstáculos que por seguir perfectamente las instrucciones”, señalaron los investigadores.

“Esto sigue sin explicar por qué el o3 es más proclive a ignorar las instrucciones que otros modelos que hemos probado. Dado que OpenAI no detalla su proceso de entrenamiento, solo podemos hacer conjeturas sobre cómo la configuración de entrenamiento de o3 podría ser diferente”, concluyen.

 The Independent se puso en contacto con OpenAI en busca de comentarios.

Te puede interesar
Donald Trump y sus enemigos

Grave intromisión de Donald Trump sobre la soberanía de Venezuela al anunciar el cierre del espacio aéreo

INTERNACIONALES30 de noviembre de 2025

El presidente de Estados Unidos, Donald Trump, expresó el sábado que el espacio aéreo de Venezuela debe considerarse “cerrado en su totalidad”, en medio de la tensión con el país sudamericano. A través de su cuenta en la red social Truth, el mandatario dirigió un mensaje “a todas las aerolíneas, pilotos, narcotraficantes y traficantes de personas: les rogamos que consideren que el espacio aéreo sobre Venezuela y sus alrededores permanecerá cerrado en su totalidad. ¡Gracias por su atención!”.

bolsonaro

El Tribunal Supremo de Brasil confirmó la condena a 27 años de prisión para Jair Bolsonaro

El Expreso de Salta
INTERNACIONALES26 de noviembre de 2025

La Tribunal Supremo de Brasil concluyó el proceso penal contra el expresidente Jair Bolsonaro y declaró firme la condena a 27 años de prisión por intentar orquestar un golpe de Estado tras su derrota en las elecciones de 2022 ante el actual presidente Luiz Inácio Lula da Silva. Ahora solo resta que la justicia determine cuál será su lugar de reclusión.

cdvst9q_thai-woman_625x300_24_November_25

Una mujer tailandesa declarada muerta despierta dentro de un ataúd momentos antes de ser incinerada

El Expreso de Salta
INTERNACIONALES26 de noviembre de 2025

Una procesión fúnebre en Tailandia se convirtió en un momento impactante cuando una mujer de 65 años, que se creía muerta, recuperó repentinamente la consciencia y comenzó a golpear desde el interior de su ataúd. Lo que se esperaba que fuera una despedida tranquila se convirtió en un impactante recordatorio de la facilidad con la que un malentendido médico puede convertirse en un error de vida o muerte.

Lo más visto