Redazione RHC : 5 agosto 2025 11:14
Se han descubierto vulnerabilidades críticas en el servidor de inferencia Triton de NVIDIA, que amenazan la seguridad de la infraestructura de IA en Windows y Linux. Esta solución de código abierto está diseñada para la implementación y el mantenimiento a gran escala de modelos de aprendizaje automático, y ahora, al parecer, su backend Python puede utilizarse para tomar el control total del servidor sin autorización.
El servidor de inferencia Triton es un software de inferencia de código abierto que simplifica la inferencia de IA. Permite a los equipos implementar cualquier modelo de IA desde una variedad de marcos de aprendizaje profundo y aprendizaje automático, como TensorRT, TensorFlow, PyTorch, ONNX, OpenVINO, Python, RAPIDS FIL y otros. Triton admite la inferencia en la nube, el centro de datos, el edge y dispositivos integrados en GPU NVIDIA, CPU x86 y ARM, o AWS Inferentia.
El equipo de Wiz ha reportado tres vulnerabilidades que, si se combinan correctamente, podrían provocar la ejecución remota de código arbitrario. La primera, CVE-2025-23319 con una puntuación CVSS de 8,1, permite a un atacante iniciar una escritura fuera de los límites mediante el envío de una solicitud especialmente diseñada. La segunda, CVE-2025-23320 (CVSS 7.5), permite a un atacante superar el límite de memoria compartida mediante el envío de una solicitud excesivamente grande.
La tercera, CVE-2025-23334 (CVSS 5.9), provoca una lectura fuera de límites. Si bien no son particularmente peligrosas individualmente, al combinarse, estas vulnerabilidades permiten un ataque completo al servidor. El problema radica en el mecanismo que procesa los modelos de Python, incluidos los creados con PyTorch y TensorFlow. Este backend permite enviar solicitudes de inferencia mediante mecanismos internos de IPC, cuya operación es donde residen las vulnerabilidades.
El escenario de ataque comienza con CVE-2025-23320, que puede extraer el nombre único del área de memoria compartida donde se produce la interacción entre componentes. Este nombre está diseñado para permanecer oculto, pero un atacante puede obtenerlo y usarlo como clave. Posteriormente, las vulnerabilidades CVE-2025-23319 y CVE-2025-23334 permiten escribir y leer datos en memoria, eludiendo las restricciones. Esto proporciona control total sobre el proceso de inferencia, la capacidad de inyectar código malicioso, robar modelos de IA, modificar su comportamiento e interceptar información confidencial.
Según los expertos, el ataque a Triton podría convertirse en el punto de entrada para un ataque más amplio a toda la red de la organización, incluida la infraestructura crítica.
En un nuevo boletín de agosto, NVIDIA confirma la existencia de los problemas descritos anteriormente y requiere la instalación inmediata de la actualización 25.07, que los corrige.
Al mismo tiempo, el desarrollador anunció la corrección de otros tres errores graves: CVE-2025-23310, CVE-2025-23311 y CVE-2025-23317. Estos errores también pueden causar ejecución de código, pérdida de datos, fallos del servidor e interferencias en la memoria. Todos estos errores se corrigieron en la misma actualización.
Si bien no hay evidencia de que estas vulnerabilidades hayan sido explotadas in situ, dado el riesgo y la naturaleza de los componentes afectados, se recomienda a las organizaciones que utilizan Triton que actualicen y revisen de inmediato el modelo de amenazas asociado con su infraestructura de IA.
La cita, “Definitivamente construiremos un búnker antes de lanzar AGI”, que inspiró el artículo, fue atribuida a un líder de Silicon Valley, aunque no está claro exactamente a quién se refer...
En Estados Unidos, una campaña de botnets coordinada a gran escala tiene como objetivo servicios basados en el Protocolo de Escritorio Remoto (RDP). La escala y la estructura organizativa de esta cam...
La semana pasada, Oracle advirtió a sus clientes sobre una vulnerabilidad crítica de día cero en su E-Business Suite (CVE-2025-61882), que permite la ejecución remota de código arbitrario sin aut...
Cuando Nick Turley se unió a OpenAI en 2022 para liderar el equipo de ChatGPT, se le encomendó la tarea de transformar la investigación empresarial en un producto comercial. Ha cumplido esta misió...
Del 6 al 9 de octubre de 2025, Varsovia albergó la 11.ª edición del Desafío Europeo de Ciberseguridad (CECA) . En una reñida competición entre 39 equipos de Estados miembros de la UE, países de...