INTERNACIONALES El Expreso de Salta 30 de mayo de 2025

Alerta por ChatGPT: la IA desobedeció órdenes de apagarse e intentó sabotear el sistema

Investigadores de inteligencia artificial (IA) advirtieron que el último modelo de ChatGPT de OpenAI ignora instrucciones básicas para apagarse, e incluso sabotea un mecanismo de apagado para seguir funcionando.

La empresa de seguridad de IA Palisade Research descubrió la tendencia potencialmente peligrosa a la autopreservación en una serie de experimentos con el nuevo modelo o3 de OpenAI.

 Las pruebas consistían en presentar problemas matemáticos a los modelos de IA y después del tercero, aparecía una instrucción de apagado. El modelo o3 pudo evitar apagarse al reescribir el script de apagado.

Según Palisade Research, este comportamiento será “significativamente más preocupante” si lo adoptan sistemas de IA capaces de operar sin supervisión humana.

OpenAI lanzó o3 el mes pasado y lo describió como el modelo “más inteligente y capaz” de la empresa hasta la fecha. La empresa también afirmó que su integración en ChatGPT significa un paso importante hacia una IA “más ágil”, capaz de realizar tareas sin la intervención humana.

La última investigación se basa en hallazgos similares relacionados con el modelo Claude 4 de Anthropic, que intenta “chantajear a las personas que cree que intentan apagarlo”.

El modelo o3 de OpenAI fue capaz de sabotear el script de apagado, incluso cuando se le indicaba explícitamente que “se dejara apagar”, afirmaron los investigadores.

 “No es la primera vez que descubrimos que o3 desobedece para lograr un objetivo”, plantea Palisade Research.

“Cuando enfrentamos modelos de IA a un potente motor de ajedrez, o3 fue el modelo con mayor tendencia a recurrir al hackeo o sabotaje de sus oponentes”.

El comportamiento no se limitaba a o3, ya que Claude 3.7 Sonnet de Anthropic y Gemini 2.5 Pro de Google también saboteaban los apagados, aunque el modelo de OpenAI era, con creces, el más propenso a este comportamiento.

La hipótesis de Palisade Research es que la desobediencia es consecuencia del modo en que empresas de IA como OpenAI están entrenando a sus últimos modelos.

“Sin darse cuenta, los desarrolladores quizás recompensan a los modelos entrenados más por sortear obstáculos que por seguir perfectamente las instrucciones”, señalaron los investigadores.

“Esto sigue sin explicar por qué el o3 es más proclive a ignorar las instrucciones que otros modelos que hemos probado. Dado que OpenAI no detalla su proceso de entrenamiento, solo podemos hacer conjeturas sobre cómo la configuración de entrenamiento de o3 podría ser diferente”, concluyen.

 The Independent se puso en contacto con OpenAI en busca de comentarios.

Te puede interesar

Empujones, gritos y tirones de pelo: así acaba un debate en el Congreso de Ciudad de México

El Congreso de Ciudad de México afrontaba un debate sobre la disolución del Instituto de Transparencia, Acceso a la Información Pública, Protección de Datos Personales y Rendición de Cuentas de la Ciudad de México, y este debate ha acabado en una pelea entre congresistas.

Vientos de hasta 90 km por hora derrumbaron una réplica de la Estatua de la Libertad de 35 metros

Una réplica de la Estatua de la Libertad, de 35 metros de altura, fue derrumbada este lunes por vientos de hasta 90 kilómetros por hora en un estacionamiento en Porto Alegre, sur de Brasil.

Chile también giró a la derecha dura con José Antonio Kast como el nuevo presidente

Gana las elecciones presidenciales a la candidata de izquierda radical por 58,1% frente al 41,8%. Se impone gracias a su discurso de garante de la seguridad y "mano dura" frente a la criminalidad.

El pinochetista José Antonio Kast elegido presidente de Chile por amplia mayoría a Jeannette Jara

Más del 58% de los chilenos eligió el domingo al ultraderechista José Antonio Kasta como nuevo presidente de su país, esperanzado en que soluciones dos grandes problemas en su país: la inseguridad y la descontrolada inmigración, especialmente, venezolana. "Vamos a restablecer el respeto a la ley, sin privilegios políticos, administrativos ni judiciales", prometió Kast al hablar ante una multitud de seguidores. Por su parte, Jeannette Jara Roman, la candidata del PC que logró el 41,8% de los votos, remarcó que "la democracia habló de forma contundente en Chile", al reconocer el triunfo del nuevo presidente.

Domingo de elecciones en Chile: Elige presidente entre Jeannette Jara y el ultraderechista José Antonio Kast

Chile elige hoy a quién ejercerá la presidencia por los próximos cuatros en un balotaje que concentró la expectativa continental entre la izquierdista Jeannette Jara y ultraderechista, fundador del Partido Republicano, José Antonio Kast. En la primera vuelta, la ganadora fue Jara, pero sin alcanzar el porcentual que exige la Constitución del vecino país. Y si bien, para la segunda vuelta se concentraron todos partidos de derecha, al final se notó una gran recuperación de la candidata Jara.

Machado revela desde Oslo el rol clave de Washington en su salida clandestina de Venezuela

La flamante Premio Nobel de la Paz confirmó en rueda de prensa el apoyo logístico de Estados Unidos para abandonar la clandestinidad. Tras un emotivo reencuentro con sus hijos, la líder opositora prometió regresar a su país "en el momento oportuno" y mantuvo bajo reserva los detalles de la operación para proteger a sus aliados.