Wczoraj po południu przez prawie godzinę znaczna część sieci dosłownie stanęła. ChatGPT, X (Twitter), Discord, Spotify, Zoom, Canva, kilka banków i tysiące mniejszych stron jednocześnie zaczęły wyrzucać błędy 500 albo w ogóle przestały odpowiadać. Powód? Globalna awaria Cloudflare – firmy, przez którą przechodzi obecnie mniej więcej co piąta strona w internecie.
Około 14:30 czasu polskiego użytkownicy na całym świecie zaczęli masowo zgłaszać problemy. DownDetector wyglądał jak choinka, a na samym DownDetectorze… też była awaria, bo oczywiście sam korzysta z Cloudflare nic więcej niż „xD” nie sunie się na język
Co dokładnie się zepsuło?
Cloudflare oficjalnie przyznał: winny był plik konfiguracyjny systemu odpowiedzialnego za wykrywanie botów i zagrożeń. Po zwykłej, rutynowej zmianie ten plik urósł do rozmiaru, którego wewnętrzne oprogramowanie kompletnie się nie spodziewało. Efekt? Procesy zaczęły się wywalać kaskadowo, co wywołało błąd w całej globalnej infrastrukturze.
„To nie był atak. To był nasz własny, głupi błąd” – można w skrócie streścić komunikat od zespołu Cloudflare.
Firma przeprosiła w dość mocnych słowach:
Przepraszamy naszych klientów i cały internet, że dziś Was zawiedliśmy. Przy skali usług Cloudflare każda przerwa jest niedopuszczalna.
Skala dramatu
Problemy dotknęły dosłownie wszystkiego, co stoi za Cloudflare:
- X pokazywał „Something went wrong” albo klasyczny błąd 500
- ChatGPT wyrzucał challenge „Odblokuj cloudflare.com, żeby kontynuować”
- Spotify i Discord nie ładowały się w ogóle
- Nawet panel administracyjny Cloudflare i API przez chwilę były niedostępne
W pewnym momencie firma musiała nawet ręcznie wyłączyć usługę WARP (swoje VPN) w Londynie, żeby ograniczyć dalsze problemy.
Dlaczego to w ogóle możliwe?
Bo Cloudflare stał się takim internetowym „wujkiem dobre rady” – wszyscy go lubią, bo jest darmowy w podstawowej wersji, szybki i skutecznie blokuje ataki. W efekcie co piąta strona na świecie siedzi za jego tarczą.
Alp Toker z NetBlocks trafnie to ujął dla BBC:
Cloudflare powstał po to, żeby chronić internet przed atakami DDoS. Ironią losu jest to, że sam stał się największym pojedynczym punktem awarii w sieci.
Jak szybko „internet” wrócił do żywych?
Poprawka poszła w kilkanaście minut, większość serwisów wróciła do życia w ciągu godziny. Do wieczora wszystko działało już normalnie, choć jeszcze przez kilka godzin niektórzy zgłaszali problemy z panelem zarządzania albo API.
Cena akcji Cloudflare spadła chwilowo o około 3 %, ale szybko odrobiła straty – rynek najwyraźniej uznał, że „zdarza się najlepszym”.
Na co na pewno zwrócić uwagę?
- Nawet „mała zmiana konfiguracji” w krytycznym systemie może dosłownie rozwalić pół internetowego świata.
- Poleganie w 100 % na jednym dostawcy CDN/chmury to proszenie się o kłopoty – warto mieć plan B (multi-CDN, fallbacki).
