Alerta por ChatGPT: la IA desobedeció órdenes de apagarse e intentó sabotear el sistema
Investigadores de inteligencia artificial (IA) advirtieron que el último modelo de ChatGPT de OpenAI ignora instrucciones básicas para apagarse, e incluso sabotea un mecanismo de apagado para seguir funcionando.
La empresa de seguridad de IA Palisade Research descubrió la tendencia potencialmente peligrosa a la autopreservación en una serie de experimentos con el nuevo modelo o3 de OpenAI.
Las pruebas consistían en presentar problemas matemáticos a los modelos de IA y después del tercero, aparecía una instrucción de apagado. El modelo o3 pudo evitar apagarse al reescribir el script de apagado.
Según Palisade Research, este comportamiento será “significativamente más preocupante” si lo adoptan sistemas de IA capaces de operar sin supervisión humana.
OpenAI lanzó o3 el mes pasado y lo describió como el modelo “más inteligente y capaz” de la empresa hasta la fecha. La empresa también afirmó que su integración en ChatGPT significa un paso importante hacia una IA “más ágil”, capaz de realizar tareas sin la intervención humana.
La última investigación se basa en hallazgos similares relacionados con el modelo Claude 4 de Anthropic, que intenta “chantajear a las personas que cree que intentan apagarlo”.
El modelo o3 de OpenAI fue capaz de sabotear el script de apagado, incluso cuando se le indicaba explícitamente que “se dejara apagar”, afirmaron los investigadores.
“No es la primera vez que descubrimos que o3 desobedece para lograr un objetivo”, plantea Palisade Research.
“Cuando enfrentamos modelos de IA a un potente motor de ajedrez, o3 fue el modelo con mayor tendencia a recurrir al hackeo o sabotaje de sus oponentes”.
El comportamiento no se limitaba a o3, ya que Claude 3.7 Sonnet de Anthropic y Gemini 2.5 Pro de Google también saboteaban los apagados, aunque el modelo de OpenAI era, con creces, el más propenso a este comportamiento.
La hipótesis de Palisade Research es que la desobediencia es consecuencia del modo en que empresas de IA como OpenAI están entrenando a sus últimos modelos.
“Sin darse cuenta, los desarrolladores quizás recompensan a los modelos entrenados más por sortear obstáculos que por seguir perfectamente las instrucciones”, señalaron los investigadores.
“Esto sigue sin explicar por qué el o3 es más proclive a ignorar las instrucciones que otros modelos que hemos probado. Dado que OpenAI no detalla su proceso de entrenamiento, solo podemos hacer conjeturas sobre cómo la configuración de entrenamiento de o3 podría ser diferente”, concluyen.
The Independent se puso en contacto con OpenAI en busca de comentarios.
Te puede interesar
Elton John confirmó que se está quedando ciego: "Perdí mi ojo derecho y el izquierdo tampoco está bien"
El artista contó que la enfermedad en su vista limitó su participación familiar y transformó su día a día. "No he podido ver nada, ni ver nada, ni leer nada", indicó el artista.
Historia criminal: Mató a su esposo, lo descuartizó y lo sirvió como pavo
Se cumplen 34 años del brutal crimen que estremeció a Estados Unidos y que aún hoy sigue siendo uno de los episodios más macabros de la historia criminal moderna. De esta historia, se hicieron documentales y fue parte de una serie televisiva.
Grave intromisión de Donald Trump sobre la soberanía de Venezuela al anunciar el cierre del espacio aéreo
El presidente de Estados Unidos, Donald Trump, expresó el sábado que el espacio aéreo de Venezuela debe considerarse “cerrado en su totalidad”, en medio de la tensión con el país sudamericano. A través de su cuenta en la red social Truth, el mandatario dirigió un mensaje “a todas las aerolíneas, pilotos, narcotraficantes y traficantes de personas: les rogamos que consideren que el espacio aéreo sobre Venezuela y sus alrededores permanecerá cerrado en su totalidad. ¡Gracias por su atención!”.
Hay un rumor creciente de que Trump va a anunciar la existencia de vida extraterrestre
Un reciente documental afirma que el Presidente de los Estados Unidos se prepara para revelar un contacto secreto con extraterrestres.
El Tribunal Supremo de Brasil confirmó la condena a 27 años de prisión para Jair Bolsonaro
La Tribunal Supremo de Brasil concluyó el proceso penal contra el expresidente Jair Bolsonaro y declaró firme la condena a 27 años de prisión por intentar orquestar un golpe de Estado tras su derrota en las elecciones de 2022 ante el actual presidente Luiz Inácio Lula da Silva. Ahora solo resta que la justicia determine cuál será su lugar de reclusión.
Una mujer tailandesa declarada muerta despierta dentro de un ataúd momentos antes de ser incinerada
Una procesión fúnebre en Tailandia se convirtió en un momento impactante cuando una mujer de 65 años, que se creía muerta, recuperó repentinamente la consciencia y comenzó a golpear desde el interior de su ataúd. Lo que se esperaba que fuera una despedida tranquila se convirtió en un impactante recordatorio de la facilidad con la que un malentendido médico puede convertirse en un error de vida o muerte.