Awaria serwerowni OVH – gdzie przez 3 dni podziewało się Android.com.pl?

Adrian Celej Artykuły 2017-11-12

W czwartek rano rano doszło do ogromnej awarii zasilania w serwerowni OVH, wskutek czego znikła znaczna część stron internetowych, w tym Android.com.pl. Obecnie problem jest już przeszłością, jednak warto wyjaśnić co się tak naprawdę stało.

Awaria zasilania w serwerowni OVH

W czwartek rano w serwerowni OVH położonej w Strasburgu doszło do awarii dwóch linii zasilania 20 kV. Serwerownia teoretycznie była przygotowana na taką ewentualność – przewidziano dwa generatory, które powinny uruchomić się w razie takiej awarii. Niestety, zawiodły. O godzinie 10:55 OVH wydało komunikat, według którego jedna z linii zasilania została naprawiona, rozpoczęło się uruchamianie sprzętu. O godzinie 12:04 poinformowano o uruchomieniu 30% adresów IP. W tym momencie pojawiło się małe zamieszanie, część stron dotkniętych awarią działała poprawnie, reszta (np. Android.com.pl) nadal nie dawała znaku życia. Wszystko wyjaśnił kolejny komunikat, według którego restart sprzętu mógł trwać nawet do 4 godzin. Dlaczego więc Android.com.pl powróciło dopiero po 3 dniach?

OFICJALNE STANOWISKO W SPRAWIE NIEDOSTĘPNOŚCI ANDROID.COM.PLPo ogromnej awarii w serwerowniach OVH nasza maszyna od 2…

Publié par Android.com.pl sur samedi 11 novembre 2017

Otóż nasz serwer uruchomił się, działał poprawnie, jednak nie wystartowały usługi. Z tego powodu OVH ustawiło go w kolejce do interwencji techników, jednocześnie blokując dostęp zdalny. Nie pomagały próby odwołania interwencji, zostaliśmy z niczym. Ostatecznie zapadła decyzja o zmianie usługodawcy, portal został przywrócony z backupu wykonanego kilka godzin przed awarią.

To nie jedyna awaria OVH

Tego samego dnia pojawił się inny, niezależny problem w serwerowni OVH położonej we Francuskiej miejscowości Roubaix. Tam z powodu awarii sprzętu sieciowego doszło do utraty konfiguracji i zerwania połączenia, pozwalającego na komunikację z innymi serwerowniami. Problem został naprawiony, nie wiemy jaki miał wpływ na niedostępność usług.

Jak duża była skala problemu?

Poza Android.com.pl padło wiele dużych stron internetowych, takich jak Wirtualne Media, PKP.pl i biedronka.pl. Nie działały też niektóre aplikacje pobierające dane z zewnętrznych serwerów, jak np. Moja Gazetka i Jakdojade. Oberwał także wykop, jednak w tym przypadku problem objawił się nieco inaczej – w serwisie przestały wyświetlać się obrazki. Prawdopodobnie ze względu na skalę serwisu administratorzy przenieśli je na inne serwery, które znajdowały się w feralnej serwerowni OVH.

Jakie będą skutki awarii?

Bez wątpienia OVH straci wielu klientów, takie awarie są wręcz niedopuszczalne. Portale internetowe mogą oberwać jeszcze bardziej. Niedostępność przez kilka godzin oznacza ogromne straty klientów lub czytelników, tutaj mówimy o 3 dniach. Powód jest prosty – strona A nie działa? Idę do konkurencji. Taka awaria może także zawalić długo budowaną pozycję w wyszukiwarkach. Android.com.pl jest jedną z najbardziej poszkodowanych stron w Polsce, konsekwencje 3-dniowej niedostępności będziemy odczuwali przez bardzo długi czas. Poza pozycjonowaniem w Google awaria wpłynęła na naszą reputację. Czytelnicy wielokrotnie pytali nas o termin przywrócenia portalu, a my nie potrafiliśmy podać żadnego konkretnego terminu. Jest nam z tego powodu przykro, wdrażamy właśnie rozwiązania, które mają definitywnie zapobiec tego typu sytuacjom w przyszłości. Obecnie na uruchomienie oczekuje forum, zgodnie z planem zostanie uruchomione dziś wieczorem. Pamiętajmy jednak, że jest weekend, pewne terminy mogą ulec przesunięciu.



  • radrakan82

    Gdzie……..w dupie.

  • morpheus

    Kara za wielbienie iOS 😛

  • PavelOS

    No i strona wróciła do żywych. Bardzo fajnie. Przez te ostatnie 3 dni, ciężko było mi znaleźć poradniki, na konkurencyjnych stronach.

  • Daniel Kurkowski

    Miło że wróciliście😊 Choć z moimi odczuciami co do portalu bywało różnie, to jedno się nie zmienia: lubię Was😉

  • krystian

    Mentalność polaka – jest awaria, więc idę do konkurencji. I tak będę w kółko latać, bo awarie zdarzają się wszędzie. Także bądźcie profesjonalni i nie obrażajcie się jak małe dzieciaki. Sam mam stronę na OVH i nie będę płakać, że strona nie działała.

    • Adrian Celej

      To nie jest strona, która od tak może sobie przestać działać. Awaria trwająca 3 dni jest niedopuszczalna.

      • gumis

        Tylko, ze u mnie dość często był problem z wejsciem na Wasza stronę. Istna loteria. Czasem ze dwa dni, czasem kilka godzin.

        • Adrian Celej

          Problem musi leżeć to twojej stronie, być może ISP coś blokuje. Pisząc teksty (bezpośrednio w edytorze portalu) od kilku miesięcy nie spotkałem się z żadnymi problemami.

  • stark2991

    Miło, że wyjaśniliście sprawę zamiast po prostu wrócić do pracy. I powiem wam, że zacząłem myśleć, że ktoś zapomniał o backupie i próbujecie przez te 3 dni jakoś stronę posklejać ze starych plików 😀
    A co do OVH to dlaczego nie wydaje mi się to zwykłą, przypadkową awarią? 🙂

    • Adrian Celej

      No cóż, stanie dużo tych zbiegiem

    • Adrian Celej

      No cóż, strasznie dużo tych zbiegów okoliczności. Ale jeśli OVH wykryje jakiś sabotaż, to się pochwalą, choćby w celu obrony.

  • mickey93

    Fajnie że już problemy za wami,
    tylko dlaczego nie napisaliście wyjaśnienia na facebooku itp.
    nie jestem zwolenianinem ani aktywnym użytkownikiem Facebooka, ale jak wasza strona niedziałała więcej niż te 4 godziny to zacząłem szukać wyjaśnienia, którego nie znalazłem do teraz

    • Lookso

      to chyba słabo szukałeś 😉 było kilka informacji na ten temat 🙂

      • mickey93

        Chyba nie,

      • Karls

        Fakt, były. Może trochę po prostu ukryły się w innych wpisach. Tak czy siak, nie ma co drążyć tematu. Wpadka była ale ważne, że się podnieśli.

      • May Czos

        Niestety obszerniejsze wyjaśnienie pojawiło się na FB dopiero wczoraj wieczorem, gdy awaria trwała dobre dwa dni.

        • Lookso

          No tak, ale donosy były już wcześniej. Obszerniej mogli się wypowiedzieć dopiero we właściwym momencie. I tak jak poniżej porze Karls nie ma co drążyć tematu. Ważne że się podnieśli. Ja przez te trzy dni dałem radę. A tym którym tak bardzo brakowało dostępu do portalu polecił bym wyjście na spacer i kontakt z rodziną ;p

          • Qba

            Ale to jakieś jaja żeby przywracać stronę z backupu trzy dni.

  • haker69

    Szanowna Redakcjo to może pomożecie: jaki w takim razie wybrać hosting dla serwisu na około 40 tys UU w ciągu miesiąca? Serwer współdzielony? VPS? Dedyk? Z góry dziękuję za wskazówki.

  • iHusky

    Wiadomo, kiedy będzie działał forum.android.com.pl od kilku dni nie ma w ogóle tego forum?

    • Araa

      Trochę cierpliwości, forum również niebawem powróci. Forum trochę dłużej się instaluje niż portal, i na pewno administratorzy techniczni dokładają wszelkich starań by wystartowała jak najszybciej.

  • Patryk Marcin Zieliński

    A co ze stroną forum android z opisami jak zrobić root gdzie są wszystkie dostępne ROM na konkretny telefon? Jestem wielkim fanem i tego mi brakuje.

    • linar10

      Czytanie nie boli, wszystko jest opisane w artykule

  • Proszę, o to powód awarii podany przez Net-Speak: „W dniu dzisiejszym od około godziny 8:15 cała sieć OVH w Europie jest niedostępna, jest to efekt odpowiedzi klientów OVH na ponowną podwyżkę cen usług, tym razem za ochronę DDoS która zdaniem OVH była nie do pokonania, a jak pokazało życie jest całkiem inaczej.”

    • Adrian Celej

      Czytam to trzeci raz.
      Że co!?

      • Że cała awaria byłą spowodowana wielkim DDoS-em. OVH podniosło ceny, bo przecież mają tak zajebiste zabezpieczenia przeciw DDoS. Skończyło się DDoS-em, który dosłownie, wyjebał wszystko. 🙂

        • Adrian Celej

          No spoko, a skąd oni takie informacje biorą? Już chyba aszdziennik jest rzetelniejszy.
          Aha, nie używaj tutaj takich słów.

          • Może z tego, że sami mają tam serwery? Oficjalne stanowisko OVH nie mówi co spowodowało to wszystko. Znamy skutki, nie przyczyny.

          • Adrian Celej

            Otóż nie, według oficjalnego stanowiska OVH przyczyną była awaria zasilania, opisali nawet szczegóły dotyczące zasilania serwerowni.

  • Ament

    Ta strona od zawsze dziala dokladnie tak jak system o ktorym traktuje.

  • Jack Gral

    Inne portale jak np. tabletowo.pl były a android.com.pl nie było. Straty będą.

    • stark2991

      Tabletowo też padło, ale oni byli akurat w tej grupie, która wstała jako pierwsza 😉

      • Jack Gral

        No to musiało szybko wstać bo nie zauważyłem tego. 😉

        • Qba

          Większość padniętych stron została uruchomiona w ciągu kilku godzin.

    • Daniel Kurkowski

      Słabo kolego… Tabletowo ma renomę – być może – ale do android.com.pl brakuje i brakować będzie, baaaardzo dużo.

      • Qba

        Raczej odwrotnie, szczególnie po tej kompromitacji i przy nadgotliwych moderatora na forum.

      • Jack Gral

        A czy ja coś wspomniałem o „renomie”? Chyba raczej nie więc p. Danielu Kurkowski… piszmy na temat, OK?

      • Adrian Celej

        Nasz portal razem z forum pod względem ruchu zjada większość tego typu portali, wbrew pozorom straty będę ogromne.

  • Karol Makowski

    Ja szukałem newsów o telefonach na konkurencyjnej stronie ( takiej z niebieskim motywem strony) ale co kilka godzin sprawdzałem czy Wasza strona działa. Jednak (tak … jednak ) zostanę tutaj z jednego ważnego dla Mnie powodu, Tamta strona jest chaotyczna, wolę Waszą, która jest prostsza w znalezieniu ciekawych/nowych informacji. Teraz wymazuję to co czytałem w weekend 😉

  • Wojtek Dziedzic

    Rozumiem powody zmiany operatora ze względu na długi czas oczekiwania ale moim zdaniem w dłuższej perspektywie zmiana nie ma sensu z prostego powodu. Takie sytuacje jak w ostatni czwartek zdarzają się i będą się zdarzały bez względu czy to będzie OVH, AVS, Azure czy Google Cloud. Warto dodatkowo przed całą konfiguracją postawić CloudFlare dzięki temu mimo że serwery są nieczynne to strona działa ponieważ jest uruchamiana z cache chmury.
    To co się stało w OVH jest bardzo cennym doświadczeniem które pozwala im się przygotować w przyszłości na podobne sytuacje. Moim zdaniem właśnie dzięki tym doświadczeniom należy zostać u dostawcy ponieważ w takich okolicznościach jeszcze mocniej dostosuje standardy bezpieczeństwa.
    To tak trochę jak inwestujemy na giełdzie i jak zaczyna spadać kurs naszych akcji to w obawie o większa stratę sprzedajemy co mamy akceptując przy tym mniejszą stratę. A w takich sytuacjach trzeba mieć „jaja ze stali” i przeczekać i później zebrać korzyści.

    Opisuję to historię opierając się na własnych doświadczeniach które miałem w ostatni czwartek w związku z awarią OVH i moje komentarze opieram też na radach firm które zajmują się profesjonalnie administrowaniem serwerami dla wielu firm i instytucji.

    • Adrian Celej

      Nowy dostawca jest nieco mniejszą, polską firmą. Wyróżnia go to, że możemy liczyć na lepszy kontakt w przypadku takich sytuacji.

      • maxprzemo

        Backup forum z jakiego dnia będzie?

        • Araa

          Napisane było że kilka godzin przed awarią, więc dużej straty nie ma.

        • Adrian Celej

          Tego samego

    • Araa

      Owszem, zgodzę się z Tobą. Ale nie poważne jest absencja 3 dni i brak reakcji ovh. Awarie są i będą, najważniejsze w tym wszystkim jest to, jak provider sobie radzi w sytuacji kryzysowej, tu niestety słabo wypadł. Po 3 dniach czekania dalej cisza…

  • matmsz

    Adres ip android.com.pl dalej wskazuje na serwer OVH

    • Adrian Celej

      Trudno mi to wyjaśnić, z tego co wiem klamka zapadła i bezwzględnie kończymy współpracę z OVH. Dlaczego domena nadal jest skierowana na OVH? Nie mam pojęcia.

      • Qba

        A może masz pojęcie dlaczego przywracanie backupu trwało trzy dni?

        • Adrian Celej

          Były problemy z dostępem do niego

          • Qba

            Ale czemu tylko u was.

          • Adrian Celej

            Nie wiem. Byłoby dobrze, gdyby OVH nie zablokowało dostępu do serwera, portal działałby na nowym hostingu po około dobie, kiedy to zapadła decyzja o zmianie usługodawcy. Wyszło jak wyszło.

          • Qba

            Większość stron które padły ruszyło w ciągu kilku godzin.