L’alimentazione elettrica “ininterrotta” di Google causa un’interruzione del servizio cloud di sei ore

L’alimentazione elettrica “ininterrotta” di Google causa un’interruzione del servizio cloud di sei ore

Recenti interruzioni nei principali servizi cloud: Microsoft e Google

La scorsa settimana, il 9, Microsoft 365 ha subito un’interruzione significativa, causata da un’interruzione nell’Exchange Admin Center (EAC).A peggiorare ulteriormente la situazione, solo il giorno dopo, gli utenti hanno segnalato di essere stati bloccati dai loro abbonamenti familiari a causa di un bug che interessava la piattaforma.

Allo stesso modo, Google Cloud non è immune alle interruzioni. Alla fine del mese scorso, la piattaforma ha subito un grave incidente quando il suo sistema di alimentazione elettrica ininterrotta (UPS) non ha funzionato correttamente, causando un’interruzione prolungata di quasi sei ore e mezza. Questa interruzione ha interessato principalmente la zona “us-east5-c” situata a Columbus, Ohio, che utilizza sistemi basati su processori AMD EPYC e Intel Xeon.

Comprendere l’interruzione di Google Cloud

In un articolo di supporto dettagliato, Google ha chiarito la cronologia e la causa di questo incidente:

Sabato 29 marzo 2025, diversi servizi Google Cloud nella zona us-east5-c hanno subito un calo del servizio o sono rimasti indisponibili per una durata di 6 ore e 10 minuti.

La causa principale dell’interruzione del servizio è stata un’interruzione della corrente elettrica in quella zona, che ha innescato un guasto a cascata nel sistema di alimentazione elettrica ininterrotta (UPS).Questo sistema è progettato per mantenere l’alimentazione durante le interruzioni di corrente, ma ha subito un guasto critico della batteria, rendendolo incapace di svolgere il suo ruolo essenziale.

Come conseguenza diretta di questo guasto dell’UPS, le istanze delle macchine virtuali nella zona interessata hanno perso l’alimentazione, causando tempi di inattività per numerosi clienti. Questa interruzione ha causato anche problemi secondari, come la perdita di pacchetti che ha compromesso la comunicazione e le prestazioni di rete, oltre alla mancata disponibilità di un numero limitato di dischi di archiviazione.

Risposta e risoluzione

Google ha successivamente condiviso le azioni correttive intraprese per risolvere il problema:

Per ridurre l’impatto su alcuni servizi, i tecnici di Google hanno deviato il traffico dalla sede interessata. Sono riusciti a bypassare il guasto dell’UPS e a ripristinare l’alimentazione tramite generatore entro le 14:49 ora USA/Pacifico di sabato 29 marzo.

La maggior parte dei servizi Google Cloud è stata ripristinata poco dopo, anche se alcuni hanno richiesto tempi di ripristino più lunghi a causa della necessità di un intervento manuale.

Impegno al miglioramento

In un messaggio sincero ai suoi clienti Cloud, Google ha espresso le sue scuse per l’interruzione e ha delineato misure proattive per prevenire futuri incidenti:

Ci scusiamo sinceramente con i nostri clienti Google Cloud i cui servizi sono stati interessati da questa interruzione. Questo non è il livello di qualità e affidabilità che ci impegniamo a offrirvi e stiamo adottando misure immediate per migliorare le prestazioni e la disponibilità della piattaforma.

Google è determinata a evitare che questo problema si ripeta e si è impegnata a intraprendere le seguenti azioni:

  • Rafforzare il protocollo di ripristino in caso di interruzione di corrente per garantire un ripristino del servizio più rapido e affidabile una volta ripristinata l’alimentazione.
  • Esecuzione di un audit dei sistemi che non hanno eseguito il failover automatico, affrontando eventuali lacune che ostacolavano questa funzionalità.
  • Collaboriamo con il nostro fornitore UPS per indagare e risolvere i problemi riscontrati nel sistema di backup della batteria.

Ci impegniamo a migliorare costantemente la nostra tecnologia e le nostre operazioni per prevenire future interruzioni del servizio. Apprezziamo molto la vostra pazienza e ci scusiamo ancora una volta per l’impatto che questo incidente potrebbe aver avuto sulla vostra organizzazione. Vi ringraziamo per il vostro continuo supporto.

Per ulteriori informazioni

Per informazioni più dettagliate sulla recente interruzione, consultate l’articolo di supporto qui sul sito web sullo stato del cloud di Google.

Fonte e immagini

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *