
Gaia Russo : 24 noviembre 2025 07:23
Este otoño, hemos tenido un gran problema con la nube , no sé si lo han notado. Es decir, AWS, Azure y luego Cloudflare . Todos cayeron, uno tras otro.
Una serie de caídas que nos mostraron algo muy grave: hoy en día, un estúpido error de configuración interna o un desorden de metadatos es el equivalente moderno de un apagón masivo .
Sí, así es.
En cuatro semanas, los tres gigantes se cayeron, y cada vez el problema provenía de dentro , de la propia infraestructura de los proveedores. No se trataba de exceso de personal, ni del pico estacional, ni de algún tipo de ataque a la red.
Lo absurdo, y un poco inquietante, es que pone de relieve lo frágiles que son estos sistemas, gigantescos pero delicados como el cristal , donde un cambio minúsculo en un componente puede desatar un infierno de consecuencias.
Los ingenieros de AWS fueron los primeros en iniciar la cadena de eventos el 20 de octubre. Se trataba de un problema del servicio DNS en la región US-EAST-1 ; siempre el mismo, por cierto, quién sabe por qué siempre ocurre allí, pero bueno. Y a partir de ahí, amigos, se desató una reacción en cadena.
El problema del DNS ha trascendido el clúster único y se ha extendido. Mensajería, juegos, plataformas de streaming… todo está caído. Un fallo en un componente clave te golpea en la cara, justo cuando miles de empresas, y todos nosotros, dependemos del funcionamiento interno de la nube. Eso no es nada tranquilizador.
Nueve días después, aquí estamos de nuevo. Es el turno de Azure . Era el 29 de octubre, si no recuerdo mal. Todo empezó con un cambio erróneo en el sistema de entrega de contenido. La nube global de Microsoft se descontroló.
Sus servicios, incluidos los propietarios como la herramienta de automatización 365 Copilot , también dejaron de funcionar, al igual que todas las aplicaciones de terceros que usan Azure para computación y autorización. Un pequeño problema de configuración provocó la caída de toda la red distribuida que gestiona numerosos flujos de trabajo.
Pero el incidente más, no sé, quizás el más sensacional fue el apagón de Cloudflare . También en otoño, ¿no? La causa fue un archivo de configuración . El que se supone filtra el tráfico extraño y sospechoso. Este archivo, por alguna razón, se volvió enorme , algo descomunal.
De hecho, el módulo interno que gestiona la red ha fallado. Cloudflare redirige el tráfico de una gran cantidad de recursos, ¿sabes? Y si una sola sección falla, bueno… X, ChatGPT, IKEA y Canva . Todas las cosas importantes se cayeron debido a este archivo. Un error interno que se llevó por delante la mitad de internet.
La esencia de toda esta historia, el denominador común , es que el problema no surgió por sí solo. Nada externo. Solo cambios internos , ocurridos en procesos automatizados , rutinarios.
Internet se ha transformado hoy, dicen los expertos –y tienen razón, en mi opinión– en un sistema de sistemas interdependientes : DNS, planos de control en la nube, servicios de autenticación… Todo funciona sobre la misma infraestructura de proveedor.
Si uno desaparece, el otro se ve afectado inmediatamente. Se observa el efecto cascada sin siquiera esperar: es instantáneo .
El alto nivel de automatización y la altísima densidad de potencia informática concentrada en manos de estos gigantes (¡son tan pocos!) implican que una pequeña intervención, que quizá parezca apropiada a un solo nivel, puede convertirse en el detonante de una reacción en cadena disruptiva. Todo sucede tan rápido que no hay tiempo para intervenir manualmente.
Por eso, dicen los expertos del sector –y es una imagen preciosa–, estos errores de configuración se están convirtiendo, de hecho, en los apagones de la era de la informática distribuida: un paso en falso , sólo uno, y todo se cae, en diferentes servicios.
En resumen, estos incidentes han revelado algo simple pero profundamente preocupante: la resiliencia de los sistemas en la nube no está a la altura de su escalabilidad . La infraestructura se asemeja cada vez más a una red eléctrica de alta tensión, donde, al cruzar un umbral, se desencadena una reacción en cadena.
Las empresas necesariamente tendrán que cambiar la forma en que construyen sus arquitecturas.
Utilice varios proveedores independientes , no solo uno, para equilibrar y proteger su rendimiento. Estos enfoques ayudan a evitar situaciones en las que una sola falla provoque la interrupción total de procesos críticos.
Y no queremos eso, ¿verdad? No, no lo queremos.
Gaia Russo
La empresa israelí NSO Group apeló un fallo de un tribunal federal de California que le prohíbe utilizar la infraestructura de WhatsApp para distribuir su software de vigilancia Pegasus. El caso, q...

Se ha identificado una vulnerabilidad de omisión de autenticación en Azure Bastion (descubierta por RHC gracias a la monitorización constante de CVE críticos en nuestro portal), el servicio gestio...

El panorama del ransomware está cambiando. Los actores más expuestos —LockBit, Hunters International y Trigona— han pagado el precio de la sobreexposición, incluyendo operaciones internacionale...

Hace exactamente 40 años, el 20 de noviembre de 1985, Microsoft lanzó Windows 1.0 , la primera versión de Windows, que intentó transformar el entonces ordenador personal, una máquina con una lín...

18 de noviembre de 2025 – Tras horas de interrupciones generalizadas , el incidente que afectó a la red global de Cloudflare parece estar cerca de resolverse. La compañía anunció que impleme...