TempMail Ninja
//

Vulnerabilidad en LMDeploy: Explotación Zero-Day SSRF Crítica

6 min de lectura
TempMail Ninja
Vulnerabilidad en LMDeploy: Explotación Zero-Day SSRF Crítica

El panorama de la ciberseguridad en 2026 ha alcanzado un punto de inflexión crítico, donde la velocidad de la innovación en Inteligencia Artificial solo es superada por la rapidez de su explotación maliciosa. El caso más reciente y alarmante involucra una vulnerabilidad en LMDeploy, un marco de trabajo (framework) de código abierto fundamental para el despliegue de modelos de lenguaje de gran escala (LLM). Identificada bajo el registro CVE-2026-33626, esta falla de seguridad tipo Server-Side Request Forgery (SSRF) ha pasado de la divulgación pública a la explotación activa en menos de 13 horas, marcando un récord de peligrosidad en la infraestructura de IA moderna.

Anatomía técnica de la vulnerabilidad en LMDeploy (CVE-2026-33626)

La vulnerabilidad en LMDeploy no es un error de lógica complejo, sino una falla fundamental en la validación de entradas dentro del módulo de visión-lenguaje del framework. Específicamente, el problema reside en la función load_image() ubicada en el archivo lmdeploy/vl/utils.py. Esta función fue diseñada para permitir que los modelos multimodales (como InternVL2 o Qwen2-VL) procesen imágenes mediante la descarga de archivos desde URLs proporcionadas por el usuario.

Sin embargo, en las versiones anteriores a la 0.12.3, el sistema fallaba al no implementar controles estrictos sobre el esquema (scheme), el host o la dirección IP de las peticiones salientes. Un atacante puede enviar un prompt de inferencia que contenga una URL maliciosa en el parámetro de imagen. En lugar de apuntar a una imagen legítima (como un archivo .jpg o .png), la URL puede dirigirse a:

  • Servicios de metadatos de la nube (IMDS): Direcciones como http://169.254.169.254 en entornos AWS, Azure o Google Cloud.
  • Interfaces de red internas: Bases de datos (Redis, MySQL) o paneles de administración que no están expuestos a internet.
  • Servicios de loopback: El propio localhost (127.0.0.1) para sondear puertos abiertos y servicios en ejecución en el nodo de inferencia.

Al procesar la solicitud, el servidor de LMDeploy actúa como un proxy involuntario, realizando una petición interna con sus propios privilegios de red y devolviendo la respuesta (o confirmando la existencia del recurso) al atacante externo.

El Vector de Ataque: De la inferencia a la brecha de infraestructura

Lo que hace que la vulnerabilidad en LMDeploy sea especialmente letal es el entorno donde suelen ejecutarse estos servidores. A diferencia de las aplicaciones web tradicionales, los nodos de inferencia de IA suelen estar equipados con GPUs de alto rendimiento y, lo que es más grave, con roles de IAM (Identity and Access Management) con privilegios elevados. Estos roles son necesarios para que el servidor pueda descargar pesos de modelos desde buckets de S3 o escribir registros en almacenes de datos centralizados.

Un atacante que explota con éxito el SSRF en el componente de visión puede realizar las siguientes acciones críticas:

  1. Exfiltración de credenciales temporales: Al solicitar http://169.254.169.254/latest/meta-data/iam/security-credentials/, el atacante puede obtener claves de acceso secretas y tokens de sesión de la instancia de cómputo.
  2. Mapeo de la red interna: Utilizando el cargador de imágenes como un escáner de puertos, los criminales pueden identificar servicios adyacentes como instancias de Redis utilizadas para el almacenamiento en caché de prompts (prompt caching).
  3. Acceso a datos propietarios: Una vez obtenidas las credenciales de la nube, el atacante puede moverse lateralmente para acceder a los datasets de entrenamiento, la propiedad intelectual más valiosa de cualquier organización de IA.

Cronología de una explotación relámpago

La rapidez con la que se ha movido esta amenaza es un testimonio de la automatización en el submundo del cibercrimen. Según reportes de equipos de respuesta a incidentes (como el TRT de Sysdig), el primer intento de explotación contra sistemas trampa (honeypots) ocurrió exactamente 12 horas y 31 minutos después de que se publicara el aviso de seguridad en GitHub. El ataque provino de la IP 103.116.72.119, localizada en Hong Kong, y no requirió de un exploit público preexistente; la simple descripción técnica en el aviso de seguridad fue suficiente para que herramientas de escaneo basadas en IA generaran el vector de ataque de forma automática.

¿Por qué la vulnerabilidad en LMDeploy es un caso de estudio para 2026?

El impacto de la vulnerabilidad en LMDeploy resalta una realidad incómoda: la superficie de ataque de la IA es radicalmente distinta y, a menudo, más amplia que la del software tradicional. Los modelos multimodales, que aceptan texto, imágenes y video, introducen canales de entrada que los firewalls de aplicaciones web (WAF) convencionales no siempre pueden inspeccionar eficazmente.

LMDeploy, siendo una de las herramientas más eficientes para servir modelos como InternLM-XComposer2 y InternVL, ha sido adoptada masivamente por empresas que buscan optimizar el rendimiento de sus modelos de visión. No obstante, esa misma eficiencia en la gestión de recursos de red es lo que permitió que la falta de validación pasara desapercibida durante varios ciclos de actualización.

El papel de las herramientas de IA en la creación de exploits

Es irónico que una vulnerabilidad en LMDeploy (un framework de IA) sea explotada con tanta rapidez gracias a otras herramientas de IA. Los atacantes están utilizando LLMs privados para analizar rápidamente los Security Advisories y convertir las descripciones de errores en código de explotación funcional. Este fenómeno, denominado “AI-assisted weaponization”, reduce el tiempo de reacción de los defensores de días a solo unas pocas horas.

Medidas de mitigación y respuesta inmediata

Si su organización utiliza LMDeploy para el servicio de modelos de lenguaje o visión, la acción inmediata es obligatoria. La vulnerabilidad en LMDeploy ha sido corregida en la versión 0.12.3 del repositorio oficial. El parche introduce una función denominada is_safe_url(), la cual implementa una lista negra de direcciones IP privadas y esquemas prohibidos.

Protocolo de remediación recomendado:

  • Actualización forzosa: Migrar todas las instancias de producción a LMDeploy v0.12.3 o superior inmediatamente.
  • Implementación de IMDSv2: En entornos AWS, configurar las instancias para que requieran obligatoriamente el servicio de metadatos versión 2, el cual utiliza un mecanismo de sesión basado en tokens que mitiga la mayoría de los ataques SSRF.
  • Segmentación de red: Colocar los nodos de inferencia en subredes aisladas con políticas de salida (egress) restrictivas, bloqueando específicamente el acceso al rango 169.254.169.254/32 a menos que sea estrictamente necesario.
  • Rotación de credenciales: Si se sospecha que una instancia fue vulnerable durante el periodo de explotación activa, se deben invalidar y rotar todos los roles de IAM y claves de acceso asociadas a ese nodo de cómputo.

Detección de compromisos previos

Para identificar si ha sido víctima de la vulnerabilidad en LMDeploy, los equipos de seguridad deben auditar sus registros de acceso a la API de inferencia. Busque peticiones en los endpoints de visión que contengan cadenas de texto relacionadas con direcciones IP locales o dominios de metadatos. Adicionalmente, el monitoreo de DNS (Out-of-band exfiltration) puede revelar intentos de los servidores de IA por conectarse a servidores de comando y control (C2) externos después de una prueba exitosa de SSRF.

Conclusión: La seguridad de la IA no es opcional

El descubrimiento y la explotación masiva de la vulnerabilidad en LMDeploy sirven como una advertencia severa para la industria tecnológica. A medida que las empresas integran capacidades multimodales en sus productos, la seguridad de los “pipelines” de datos de entrada se vuelve tan crítica como la protección del modelo en sí. No basta con tener el modelo más inteligente si la infraestructura que lo sostiene permite que un simple enlace a una imagen se convierta en la llave maestra para toda la red corporativa.

La ciberseguridad en la era de la IA exige una vigilancia proactiva y una cultura de parcheo inmediato. En un mundo donde los atacantes aprovechan la misma tecnología que intentamos proteger, la complacencia es el mayor riesgo de seguridad.

TN

Escrito por

TempMail Ninja

Experto en privacidad digital y seguridad en línea. Apasionado por crear herramientas que protejan la identidad de los usuarios en internet.