„Nieprzerwany” zasilacz Google’a powoduje sześciogodzinną przerwę w działaniu chmury

„Nieprzerwany” zasilacz Google’a powoduje sześciogodzinną przerwę w działaniu chmury

Ostatnie awarie w głównych usługach w chmurze: Microsoft i Google

W zeszłym tygodniu Microsoft 365 doświadczył poważnych zakłóceń 9-go, spowodowanych awarią w Exchange Admin Center (EAC).Problem pogorszył się, zaledwie dzień później, użytkownicy zgłosili, że zostali zablokowani w swoich subskrypcjach rodzinnych z powodu błędu wpływającego na platformę.

Podobnie Google Cloud nie jest odporny na przerwy w dostawie prądu. Pod koniec zeszłego miesiąca platforma doświadczyła poważnego incydentu, gdy jej system zasilania awaryjnego (UPS) nie działał zgodnie z przeznaczeniem, co doprowadziło do przedłużającej się przerwy w dostawie prądu trwającej prawie sześć i pół godziny. Ta przerwa w dostawie prądu dotyczyła przede wszystkim strefy „us-east5-c” zlokalizowanej w Columbus w stanie Ohio, która wykorzystuje systemy oparte na procesorach AMD EPYC i Intel Xeon.

Zrozumienie awarii Google Cloud

W szczegółowym artykule pomocy technicznej Google wyjaśniło oś czasu i przyczynę tego incydentu:

W sobotę 29 marca 2025 r.wiele usług Google Cloud w strefie us-east5-c doświadczyło pogorszenia jakości usług lub ich niedostępności trwającej 6 godzin i 10 minut.

Podstawową przyczyną zakłócenia usług była utrata zasilania sieciowego w tej strefie, co spowodowało kaskadową awarię w systemie zasilania bezprzerwowego (UPS).System ten jest zaprojektowany do utrzymywania zasilania podczas przerw w dostawie prądu, ale uległ krytycznej awarii baterii, co uniemożliwiło mu wypełnienie jego zasadniczej roli.

W wyniku awarii UPS-a instancje maszyn wirtualnych w strefie dotkniętej awarią utraciły zasilanie, co spowodowało przerwy w świadczeniu usług dla wielu klientów. Ta awaria spowodowała również problemy wtórne, takie jak utrata pakietów wpływająca na komunikację sieciową i wydajność, a także niedostępność ograniczonej liczby dysków pamięci masowej.

Reakcja i rozwiązanie

Firma Google podała już informacje o działaniach naprawczych podjętych w celu usunięcia awarii:

Aby zmniejszyć wpływ na niektóre usługi, inżynierowie Google przekierowali ruch z dotkniętej lokalizacji. Udało im się ominąć uszkodzony UPS i przywrócić zasilanie za pomocą generatora do godziny 14:49 US/Pacific w sobotę 29 marca.

Większość usług Google Cloud szybko odzyskała sprawność, jednak w przypadku niektórych czas przywracania był dłuższy ze względu na konieczność ręcznej interwencji.

Zaangażowanie w doskonalenie

W szczerym przesłaniu do klientów korzystających z usług w chmurze firma Google przeprosiła za utrudnienia i przedstawiła proaktywne kroki mające na celu zapobieganie podobnym incydentom w przyszłości:

Do naszych klientów Google Cloud, których usługi zostały zakłócone podczas tej przerwy, szczerze przepraszamy. To nie jest poziom jakości i niezawodności, jaki staramy się Państwu zaoferować, i podejmujemy natychmiastowe kroki w celu zwiększenia wydajności i dostępności platformy.

Google dokłada wszelkich starań, aby zapobiec ponownemu wystąpieniu tego problemu, dlatego zobowiązało się do podjęcia następujących działań:

  • Wzmocnienie protokołu odzyskiwania po awarii zasilania w celu zapewnienia szybszego i bardziej niezawodnego przywrócenia usług po przywróceniu zasilania.
  • Przeprowadzenie audytu systemów, które nie przełączają się automatycznie po awarii, i usunięcie wszelkich luk, które utrudniają tę funkcjonalność.
  • Współpracujemy z naszym dostawcą UPS w celu zbadania i rozwiązania problemów napotkanych w systemie zasilania bateryjnego.

Jesteśmy oddani ciągłemu ulepszaniu naszej technologii i operacji, aby zapobiec przyszłym przerwom w świadczeniu usług. Bardzo doceniamy Twoją cierpliwość i przepraszamy raz jeszcze za wpływ, jaki ten incydent mógł mieć na Twoją organizację. Dziękujemy za Twoje ciągłe wsparcie.

Więcej informacji

Szczegółowe informacje dotyczące niedawnej awarii można znaleźć w artykule pomocy technicznej na stronie internetowej Google Cloud Status.

Źródło i obrazy

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *