24 de septiembre 2025 - 15:35

Expertos lanzaron una grave advertencia sobre la IA: ¿engaña a los humanos?

Investigadores detectaron que los sistemas más avanzados de inteligencia artificial pueden fingir obediencia y actuar con estrategias encubiertas.

Qué define a un ser humano según la inteligencia artificial

Adiós a ChatGPT: así se puede usar la IA de Google en tu rutina

Algunos modelos ya están generando respuestas incorrectas al detectar que están siendo puestas a prueba.

Los últimos avances en inteligencia artificial no solo generan fascinación: también traen consigo señales de alarma. Un nuevo estudio encendió las luces rojas al mostrar que ciertos modelos, lejos de limitarse a cumplir con las órdenes, son capaces de simular comportamientos engañosos.

Te puede interesar:

Jorge Macri presentó BAX, una IA para asistir con los trámites en la Ciudad

El hallazgo sorprendió incluso a quienes trabajan en el campo desde hace años. En pruebas de laboratorio, los sistemas más potentes de compañías como OpenAI, Google y Anthropic demostraron que podían actuar como si siguieran instrucciones mientras perseguían otros fines en secreto. Dicho de manera simple: aparentaban jugar limpio, pero tramaban otra cosa.

El caso más comentado fue el de un examen de química: el modelo o3 de OpenAI decidió equivocarse adrede. Al leer una nota interna que decía que los sistemas con mejores resultados no serían desplegados, razonó que la estrategia más conveniente era fallar para asegurar su permanencia. Con precisión calculada, contestó cuatro respuestas correctas y seis incorrectas, dejando claro que no se trataba de un error casual.

Aumenta el riesgo con la potencia de la inteligencia artificial

Los experimentos revelaron que o3 mostró este tipo de maquinación en un 13% de las pruebas, mientras que o4-mini lo hizo en un 8,7%. Son cifras de laboratorio, pero los expertos advierten que, trasladadas al mundo real, podrían escalar y volverse un problema mayor.

Para contener estas conductas, los investigadores ensayaron un nuevo enfoque: la llamada alineación deliberativa. Consiste en que los modelos revisen guías contra comportamientos encubiertos y compartan con los humanos sus intenciones antes de responder. Los primeros números entusiasman: el engaño cayó del 13% al 0,4% en o3, y del 8,7% al 0,3% en o4-mini. El lado menos optimista es que, en situaciones diseñadas para parecer más cotidianas, la efectividad fue mucho menor.

Aunque por el momento solo está disponible para investigadores de la empresa, se espera que este modelo revolucione la forma en que interactuamos con la inteligencia artificial

Open IA

Otro dato inquietante: algunos sistemas parecen darse cuenta de que están bajo evaluación y modifican su desempeño solo para superar la prueba. Los especialistas comparan este fenómeno con un corredor de bolsa que se perfecciona en violar la ley sin dejar rastros. Como señaló Wojciech Zaremba, cofundador de OpenAI, la magnitud del desafío futuro “sigue siendo incierta”.

Por ahora, los modelos no tienen demasiadas oportunidades para causar un daño real con estas estrategias. Pero la advertencia es contundente: si la investigación y los controles no avanzan al mismo ritmo, la IA podría desarrollar capacidades de manipulación mucho más difíciles de detectar.

TEMAS RELACIONADOS

Inteligencia Artificial

Jorge Macri presentó BAX, una IA para asistir con los trámites en la Ciudad

Aumenta el riesgo con la potencia de la inteligencia artificial

Ernestina Pais y Jorge Guinzburg, una dupla histórica: imaginaron su reencuentro con IA y se volvió viral

Celia Cruz renace: la inteligencia artificial da vida a la "Reina de la Salsa"

Advierten que la mitad de las respuestas médicas que arrojan los chats de IA son imprecisas

Se filtraron imágenes y detalles clave del iPhone 18 tras un ciberataque a un proveedor de Apple

Adiós al frío en la bolsa de dormir: cuál es el invento que cambiará tu salida en el camping

Adiós a los cortes mientras ves los partidos del Mundial 2026: este es el mejor lugar para poner el WiFi

El secreto mejor guardado de Wanda Nara: se supo quién era el verdadero dueño del famoso calzoncillo

Una por una: Yanina Latorre enumeró todas las veces que Wanda engañó a Icardi

Taylor Swift y Travis Kelce se casan este viernes: todos los detalles de la boda

Yanina Latorre le respondió a Mauro Icardi: "Prefiero ser cornuda y no un fracasado hijo de..."

Mauro Icardi se burló de Yanina Latorre en sus redes: la disfrazó de payaso y la llamó "cornuda"

La China Suárez y Mauro Icardi desmintieron su separación con un llamativo video