Durante la mañana del 26 de marzo, Espanix, el principal punto neutro de intercambio de tráfico IP en España, ha experimentado una caída significativa y fluctuaciones inusuales en su tráfico, tal como se observa en los gráficos oficiales publicados en su portal. La bajada comenzó alrededor de las 09:30 horas (hora local), con un descenso brusco desde los habituales 1,3-1,4 Tbps a niveles inferiores a los 600 Gbps, seguido de oscilaciones hasta la estabilización poco después de las 10:30 horas.
La caída coincidió con reportes en redes sociales de usuarios que experimentaron interrupciones en la conectividad y dificultades para acceder a servicios críticos como Gmail, aunque no se puede establecer una relación directa entre la caída en Espanix y la inaccesibilidad de estos servicios. Como es habitual en incidentes de este tipo, las rutas BGP se reconfiguran dinámicamente para redirigir tráfico hacia otros puntos de intercambio o rutas alternativas, minimizando el impacto global. Sin embargo, durante estos re-enrutamientos, es frecuente que se experimenten aumentos en la latencia y pérdidas de paquetes momentáneas.

Desde el punto de vista técnico, este tipo de caída podría estar asociada a problemas en la infraestructura de switching de Espanix, mantenimiento no anunciado o un fallo en la propagación de rutas BGP. También podría haber ocurrido un error en los sistemas de monitorización o un reinicio forzado de nodos críticos. El gráfico de tráfico muestra picos y caídas anómalas durante un periodo sostenido, lo que indica que no se trató de un simple corte puntual, sino de un comportamiento inestable prolongado.
Para los administradores de sistemas y redes, esta situación es un recordatorio de la importancia de implementar redundancia multihoming con distintos carriers y puntos neutros, así como de contar con mecanismos de failover y monitorización activa sobre la estabilidad de las rutas BGP.
Aunque la recuperación del tráfico se ha producido de forma gradual y en estos momentos los niveles se encuentran dentro de la normalidad, sería recomendable que Espanix publicase un informe post-mortem detallando las causas y las medidas correctivas aplicadas para evitar futuras incidencias.
Hasta entonces, el incidente sirve como caso práctico para revisar las políticas de re-enrutamiento, las configuraciones de Graceful Restart y la dependencia excesiva de un único punto neutro, sobre todo para organizaciones que gestionan servicios críticos y requieren alta disponibilidad.
Fuente: Revista cloud