El sistema de alimentación ininterrumpida de Google provoca una interrupción de seis horas en la nube

El sistema de alimentación ininterrumpida de Google provoca una interrupción de seis horas en la nube

Interrupciones recientes en los principales servicios en la nube: Microsoft y Google

La semana pasada, Microsoft 365 sufrió una interrupción importante el día 9, causada por una interrupción en el Centro de administración de Exchange (EAC).Para agravar el problema, tan solo un día después, los usuarios informaron que se les había bloqueado el acceso a sus suscripciones familiares debido a un error que afectaba a la plataforma.

De igual forma, Google Cloud no es inmune a las interrupciones. A finales del mes pasado, la plataforma sufrió un incidente importante cuando su sistema de alimentación ininterrumpida (SAI) dejó de funcionar correctamente, lo que provocó una interrupción prolongada de casi seis horas y media. Esta interrupción afectó principalmente a la zona «us-east5-c» ubicada en Columbus, Ohio, que utiliza sistemas con procesadores AMD EPYC e Intel Xeon.

Entendiendo la interrupción de Google Cloud

En un artículo de soporte detallado, Google aclaró la cronología y la causa de este incidente:

El sábado 29 de marzo de 2025, varios servicios de Google Cloud en la zona us-east5-c experimentaron un servicio degradado o falta de disponibilidad durante 6 horas y 10 minutos.

La causa principal de la interrupción del servicio se debió a un corte del suministro eléctrico en esa zona, lo que provocó una falla en cascada en el sistema de alimentación ininterrumpida (SAI).Este sistema, diseñado para mantener la energía durante los cortes del suministro eléctrico, sufrió una falla crítica de la batería, lo que le impidió cumplir su función esencial.

Como resultado directo de esta falla del SAI, las instancias de máquinas virtuales en la zona afectada se quedaron sin suministro eléctrico, lo que provocó interrupciones del servicio para numerosos clientes. Esta interrupción también causó problemas secundarios, como la pérdida de paquetes, que afectó la comunicación y el rendimiento de la red, además de la indisponibilidad de un número limitado de discos de almacenamiento.

Respuesta y resolución

Desde entonces, Google ha compartido las medidas correctivas adoptadas para solucionar la interrupción:

Para minimizar el impacto en ciertos servicios, los ingenieros de Google desviaron el tráfico de la ubicación afectada. Desviaron con éxito el SAI averiado y restauraron la energía mediante un generador a las 14:49 hora del Pacífico (EE. UU.) del sábado 29 de marzo.

La mayoría de los servicios de Google Cloud se recuperaron poco después, aunque algunos requirieron un tiempo de restauración más prolongado debido a la necesidad de intervención manual.

Compromiso con la mejora

En un mensaje sincero a sus clientes de la nube, Google ofreció disculpas por la interrupción y describió los pasos proactivos para prevenir incidentes futuros:

A nuestros clientes de Google Cloud cuyos servicios se vieron afectados durante esta interrupción, les ofrecemos nuestras más sinceras disculpas. Este no es el nivel de calidad y confiabilidad que nos esforzamos por ofrecerles, y estamos tomando medidas inmediatas para mejorar el rendimiento y la disponibilidad de la plataforma.

Google está decidido a evitar que este problema se repita y se ha comprometido a tomar las siguientes medidas:

  • Fortalecer el protocolo de recuperación ante cortes de energía para garantizar una restauración del servicio más rápida y confiable luego de que se recupere el suministro eléctrico.
  • Realizar una auditoría de los sistemas que no conmutaban por error de manera automática y abordar cualquier brecha que obstruyera esta funcionalidad.
  • Colaborar con nuestro proveedor de UPS para investigar y resolver los problemas encontrados dentro del sistema de respaldo de batería.

Nos dedicamos a mejorar continuamente nuestra tecnología y operaciones para evitar futuras interrupciones del servicio. Agradecemos enormemente su paciencia y nos disculpamos una vez más por el impacto que este incidente haya tenido en su organización. Agradecemos su continuo apoyo.

Para más información

Puede encontrar detalles completos sobre la interrupción reciente en el artículo de soporte aquí en el sitio web de estado de la nube de Google.

Fuente e imágenes

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *