Awaria serwerowni OVH – gdzie przez 3 dni podziewało się Android.com.pl?

3 minuty czytania
Komentarze

W czwartek rano rano doszło do ogromnej awarii zasilania w serwerowni OVH, wskutek czego znikła znaczna część stron internetowych, w tym Android.com.pl. Obecnie problem jest już przeszłością, jednak warto wyjaśnić co się tak naprawdę stało.

Awaria zasilania w serwerowni OVH

W czwartek rano w serwerowni OVH położonej w Strasburgu doszło do awarii dwóch linii zasilania 20 kV. Serwerownia teoretycznie była przygotowana na taką ewentualność – przewidziano dwa generatory, które powinny uruchomić się w razie takiej awarii. Niestety, zawiodły. O godzinie 10:55 OVH wydało komunikat, według którego jedna z linii zasilania została naprawiona, rozpoczęło się uruchamianie sprzętu. O godzinie 12:04 poinformowano o uruchomieniu 30% adresów IP. W tym momencie pojawiło się małe zamieszanie, część stron dotkniętych awarią działała poprawnie, reszta (np. Android.com.pl) nadal nie dawała znaku życia. Wszystko wyjaśnił kolejny komunikat, według którego restart sprzętu mógł trwać nawet do 4 godzin. Dlaczego więc Android.com.pl powróciło dopiero po 3 dniach?

https://www.facebook.com/androidcompl/photos/a.408004182462.197439.345969442462/10155843626552463/?type=3&permPage=1

Otóż nasz serwer uruchomił się, działał poprawnie, jednak nie wystartowały usługi. Z tego powodu OVH ustawiło go w kolejce do interwencji techników, jednocześnie blokując dostęp zdalny. Nie pomagały próby odwołania interwencji, zostaliśmy z niczym. Ostatecznie zapadła decyzja o zmianie usługodawcy, portal został przywrócony z backupu wykonanego kilka godzin przed awarią.

To nie jedyna awaria OVH

Tego samego dnia pojawił się inny, niezależny problem w serwerowni OVH położonej we Francuskiej miejscowości Roubaix. Tam z powodu awarii sprzętu sieciowego doszło do utraty konfiguracji i zerwania połączenia, pozwalającego na komunikację z innymi serwerowniami. Problem został naprawiony, nie wiemy jaki miał wpływ na niedostępność usług.

Jak duża była skala problemu?

Poza Android.com.pl padło wiele dużych stron internetowych, takich jak Wirtualne Media, PKP.pl i biedronka.pl. Nie działały też niektóre aplikacje pobierające dane z zewnętrznych serwerów, jak np. Moja Gazetka i Jakdojade. Oberwał także wykop, jednak w tym przypadku problem objawił się nieco inaczej – w serwisie przestały wyświetlać się obrazki. Prawdopodobnie ze względu na skalę serwisu administratorzy przenieśli je na inne serwery, które znajdowały się w feralnej serwerowni OVH.

Jakie będą skutki awarii?

Bez wątpienia OVH straci wielu klientów, takie awarie są wręcz niedopuszczalne. Portale internetowe mogą oberwać jeszcze bardziej. Niedostępność przez kilka godzin oznacza ogromne straty klientów lub czytelników, tutaj mówimy o 3 dniach. Powód jest prosty – strona A nie działa? Idę do konkurencji. Taka awaria może także zawalić długo budowaną pozycję w wyszukiwarkach. Android.com.pl jest jedną z najbardziej poszkodowanych stron w Polsce, konsekwencje 3-dniowej niedostępności będziemy odczuwali przez bardzo długi czas. Poza pozycjonowaniem w Google awaria wpłynęła na naszą reputację. Czytelnicy wielokrotnie pytali nas o termin przywrócenia portalu, a my nie potrafiliśmy podać żadnego konkretnego terminu. Jest nam z tego powodu przykro, wdrażamy właśnie rozwiązania, które mają definitywnie zapobiec tego typu sytuacjom w przyszłości. Obecnie na uruchomienie oczekuje forum, zgodnie z planem zostanie uruchomione dziś wieczorem. Pamiętajmy jednak, że jest weekend, pewne terminy mogą ulec przesunięciu.

Motyw