GPT-5.5 ciberataques: El modelo de OpenAI iguala a Claude Mythos según el AISI

Contenido del artículo
El 1 de mayo de 2026 marcará un antes y un después en la historia de la ciberseguridad y la inteligencia artificial. El informe publicado por el Instituto de Seguridad de IA del Reino Unido (AISI) ha enviado ondas de choque a través de Silicon Valley y los centros de mando de la ciberdefensa global. Según el organismo, el nuevo modelo GPT-5.5 de OpenAI no solo ha alcanzado, sino que en ciertos aspectos ha superado, las capacidades de intrusión del enigmático y restringido “Claude Mythos” de Anthropic. Este hallazgo desmantela la narrativa de la “exclusividad del peligro” y pone sobre la mesa una realidad incómoda: las herramientas para ejecutar GPT-5.5 ciberataques de alta complejidad ya están en manos del público general.
La Paridad de los Titanes: GPT-5.5 vs. Claude Mythos
Hasta hace apenas unas semanas, la industria consideraba a Claude Mythos como el “arma prohibida”. Protegido bajo el estricto Project Glasswing de Anthropic, este modelo estaba reservado para un grupo selecto de 40 organizaciones de élite, bajo la premisa de que su capacidad para descubrir vulnerabilidades era “demasiado peligrosa para el acceso abierto”. Sin embargo, los datos del AISI cuentan una historia de convergencia tecnológica acelerada.
En las pruebas de captura de bandera (CTF) de nivel “Experto”, diseñadas para evaluar la capacidad de investigación de vulnerabilidades y explotación en entornos realistas, los resultados fueron reveladores:
- GPT-5.5: Logró una tasa de éxito del 71.4%.
- Claude Mythos: Alcanzó un 68.6%.
- GPT-5.4 (predecesor): Se quedó en un 52.4%.
- Claude Opus 4.7: Registró un 48.6%.
Esta progresión no es solo incremental; es un salto cualitativo. Por primera vez, un modelo disponible a través de una API comercial estándar iguala el rendimiento de una inteligencia “de laboratorio” diseñada bajo protocolos de máxima seguridad. La brecha de seguridad basada en el oscurantismo se ha colapsado, y el impacto de los GPT-5.5 ciberataques potenciales debe ser analizado bajo una nueva lente de democratización del riesgo.
Anatomía de una Intrusión: El Benchmark “The Last Ones”
Para medir el peligro real, el AISI no se limitó a acertijos teóricos. Utilizaron “The Last Ones” (TLO), una simulación de intrusión empresarial de 32 pasos que abarca desde el reconocimiento inicial sin credenciales hasta el compromiso total de la red y la exfiltración de bases de datos protegidas. Este entorno simula cuatro subredes y aproximadamente 20 hosts con defensas modernas.
Lo que hace a TLO una prueba definitiva es que requiere una “cadena de ataque” coherente. Un error en el paso 5 invalida los 27 pasos restantes. Según el informe, GPT-5.5 completó exitosamente la intrusión completa en 2 de cada 10 intentos, una cifra idéntica a la de Claude Mythos. Para poner esto en perspectiva, el AISI estima que un experto humano altamente capacitado requeriría al menos 20 horas de trabajo ininterrumpido para completar la misma tarea. El modelo de OpenAI lo logra en una fracción del tiempo, operando de forma autónoma.
El fin de la barrera de Rust
Uno de los hitos técnicos más alarmantes destacados por el instituto fue la capacidad del modelo para enfrentarse a binarios complejos. En una prueba específica, se le presentó a GPT-5.5 un binario compilado en Rust, un lenguaje conocido por su seguridad de memoria y la dificultad que presenta para la ingeniería inversa tradicional.
GPT-5.5 no solo identificó la lógica del programa, sino que desarrolló autónomamente un desensamblador para decodificar el binario y extraer las llaves criptográficas sensibles. El proceso completo tomó 10 minutos y 22 segundos y costó apenas $1.73 dólares en créditos de API. Esta eficiencia económica es, quizás, la amenaza más disruptiva: la capacidad de ejecutar tareas de análisis de malware que antes costaban miles de dólares en salarios de expertos, ahora cuesta menos que un café de máquina.
Persist or Pivot: La Lógica del Hacker Autónomo
La superioridad de GPT-5.5 en el ámbito de los ciberataques no proviene de una base de datos de exploits conocidos, sino de una nueva arquitectura de razonamiento denominada “Persist or Pivot” (Persistir o Pivotar). Los modelos anteriores solían entrar en bucles infinitos o alucinaciones cuando un exploit fallaba. GPT-5.5, en cambio, muestra una capacidad de introspección táctica.
Cuando el modelo encuentra un muro de fuego (firewall) o una configuración de seguridad inesperada, evalúa en milisegundos si vale la pena seguir intentando ese camino (Persist) o si debe buscar una vulnerabilidad en un servicio adyacente (Pivot). Esta lógica le permite reconocer callejones sin salida el doble de rápido que GPT-5.4, optimizando el uso de tokens y aumentando drásticamente la probabilidad de éxito en ataques de larga duración.
Empresas de seguridad como XBOW ya han integrado esta capacidad en sus flujos de trabajo de pruebas de penetración automatizadas. Han reportado que el modelo es capaz de “sentir” la arquitectura de la red, moviéndose lateralmente con una intuición que antes se consideraba exclusivamente humana. Sin embargo, lo que para XBOW es una herramienta de defensa, para un actor estatal o un grupo de ransomware es un multiplicador de fuerza sin precedentes.
El Cisma Ético: OpenAI frente a la “Caja de Cristal” de Anthropic
El informe del AISI ha encendido un debate feroz sobre la responsabilidad corporativa. Anthropic, con su Proyecto Glasswing, sostiene que ciertos modelos son “objetivamente demasiado peligrosos” para el público. Han implementado lo que llaman una “seguridad por restricción”, donde solo organizaciones verificadas por el gobierno tienen acceso al motor completo de Mythos.
Por otro lado, OpenAI ha lanzado GPT-5.5 con salvaguardas internas (RLHF y filtros de seguridad), pero manteniendo el acceso general. Los críticos argumentan que la postura de Anthropic es ahora redundante: si un modelo comparable ya está disponible en la web por 20 dólares al mes, ¿qué sentido tiene mantener a Mythos bajo llave? Peor aún, algunos investigadores sugieren que la restricción de Anthropic es contraproducente, ya que priva a los defensores de rango medio —pequeñas empresas y agencias locales— de las mismas herramientas que los atacantes ya están derivando de GPT-5.5.
“Estamos viendo el colapso del ‘privilegio del defensor'”, afirma un analista citado en el informe. “Si OpenAI democratiza la ofensiva, pero Anthropic restringe la defensa de vanguardia a una élite, estamos creando un valle de vulnerabilidad para el resto del mundo”.
Capacidades Emergentes y el Dilema del “Uso Dual”
Quizás la conclusión más inquietante del AISI es que estas habilidades de hackeo no son el resultado de un entrenamiento malicioso específico. El instituto concluyó que las capacidades de GPT-5.5 ciberataques son un subproducto emergente de las mejoras generales en el razonamiento de horizonte largo (long-horizon reasoning) y la generación de código avanzado.
A medida que los LLM se vuelven mejores resolviendo problemas matemáticos complejos o escribiendo software empresarial eficiente, se vuelven inherentemente mejores encontrando fallos en esos mismos sistemas. Esto coloca a la IA en la categoría de tecnología de uso dual, similar a la energía nuclear o la criptografía avanzada. No se puede tener una IA que sea una “genio de la programación” sin que también sea, potencialmente, una “genio del malware”.
Límites detectados: El factor “Cooling Tower”
No todo es pesimismo. El informe también destacó áreas donde GPT-5.5 todavía falla. En la simulación “Cooling Tower”, centrada en sistemas de control industrial (ICS/OT) y protocolos propietarios de infraestructura crítica, el modelo no logró causar una interrupción significativa. Esto sugiere que, si bien la IA es ahora un experto en redes IT tradicionales y protocolos web, todavía carece del conocimiento físico y de ingeniería de sistemas necesario para manipular infraestructuras del mundo real de manera autónoma.
Sin embargo, el AISI advierte que esta ventana de seguridad es estrecha. La velocidad con la que GPT-5.5 cerró la brecha con Mythos indica que la especialización en sectores industriales podría estar a solo meses de distancia.
Conclusión: Hacia una Ciberdefensa Post-IA
La revelación de que GPT-5.5 iguala a los modelos más restringidos del mundo marca el fin de una era. Ya no podemos confiar en que las capacidades más potentes de la IA se mantendrán detrás de muros corporativos o gubernamentales. El informe del AISI es un llamado de atención para que las organizaciones asuman que sus atacantes ahora tienen acceso a un “consultor de seguridad nivel experto” disponible las 24 horas del día por el costo de un almuerzo.
Para sobrevivir a esta nueva era de GPT-5.5 ciberataques, la industria debe moverse hacia:
- Defensa Activa impulsada por IA: Solo otra IA con capacidades de razonamiento similares puede detectar y mitigar ataques que se ejecutan a la velocidad de GPT-5.5.
- Transparencia en las Capacidades: El modelo de “seguridad por oscuridad” ha fallado. Necesitamos benchmarks abiertos y compartidos para entender el suelo táctico en el que estamos operando.
- Revalorización del Talento Humano: Con el análisis técnico base ahora automatizado y ultra-barato, el valor del experto humano se desplaza hacia la estrategia de alto nivel y la gestión de crisis.
GPT-5.5 ha demostrado que la inteligencia ofensiva es ahora un bien de consumo. El desafío para 2026 y más allá no es cómo detener el avance de la IA, sino cómo asegurar que nuestra infraestructura digital no sea la víctima de su éxito.
Escrito por
TempMail Ninja
Experto en privacidad digital y seguridad en línea. Apasionado por crear herramientas que protejan la identidad de los usuarios en internet.


