08/09/2019
Co wspólnego mają ścieki wpływające do Wisły ze światem IT? 🤔
Jak już zapewne wiecie, po 12 dniach awaryjnego zrzutu nieczystości do Wisły, oczyszczalnia "Czajka" znów odbiera ścieki lewobrzeżnej Warszawy.
Temat zapewne wróci za 3-4 miesiące, gdyż tymczasowa konstrukcja mostu pontonowego nie bardzo współgra z ujemnymi temperaturami, niosącymi z sobą kry lodowe, ale to już będzie po wyborach i mam dziwne przeczucie, że jego ranga już nieco spadnie. Ale nie o tym.
Nie będziemy wnikać szczegółowo w przyczyny tej awarii, tym bardziej że w obiegu jest kilka różnych wersji, ale sam jej casus może być idealnym przykładem zagrożeń dotykających szerokiego zakresu branż, nie tylko "wod-kan" :)
Wg informacji płynących z mediów, ścieki wpływały do Wisły z prędkością 3m^3/s (3000 litrów na sekundę). Może nie było by w tym nic dziwnego, gdyby nie fakt, że rurociąg, którym dotychczas płynęły ma średnicę 1.6 m! Sześć wielkich wanien na sekundę to chyba dość sporo jak na taki przekrój...? Szczególnie, że trasa fragmentem jest poprowadzona niemal pionowo...
No, ale pękło to pękło, nie ma co drążyć założeń projektowych (przynajmniej na razie). Ciekawsza, a na pewno z naszego punktu widzenia, jest inna kwestia.
Niezależnie, czy przyczyna leży po stronie projektowej (źle obliczone obciążenie), czy wykonawczej (obejmy) trzeba przyznać, że takie wypadki się na świecie zdarzają. Być może niekoniecznie niecałe 10 lat po kosztującej pół miliarda złotych modernizacji, no ale złośliwość rzeczy martwych...
Dlatego właśnie została w tym celu poprowadzona druga nitka rurociągu, która miała przejąć na siebie ciężar pracy w przypadku awarii tej pierwszej. (Swoją drogą, one serio nie były tak skonstruowane, aby równoważyć na bieżąco obciążenie między sobą??). Jak to zwykle bywa w takich przypadkach, skoro coś jest z założenia zapasowe to znaczy, że zaczniemy się tym martwić dopiero, gdy ten zapas nam będzie potrzeby. Nawet jeśli to ma nastąpić dopiero po 10 latach.
Także przepływ, który rozwarstwił nitkę A został przełączony na nieużywaną od wielu wielu lat niktę B, która po kilkunastu godzinach pracy... również uległa rozwarstwieniu.
No dobra, ale co to wszystko ma wspólnego z profilem doradztwa informatycznego i dlaczego w ogóle o tym piszę?
Ano dlatego, że to jest klasyczny, książkowy wręcz "fak-up" występujący też bardzo często w branży IT.
Ilekroć rozpoczynam współpracę z nowym klientem, na pytanie o backup w 9 na 10 przypadków otrzymuję odpowiedź twierdzącą. Po szybkiej weryfikacji okazuje się jednak, że w połowie z nich kopie te okazują się niezdatną do niczego fikcją. Przyczyny bywają różne, a to ktoś nie przewidział, że kiedyś zapchają się dyski i brakuje mechanizmów rotacji, a to ustawione do archiwizacji zostały miejsca, które od dawna nie są używane (np. bazy starych aplikacji). Czasem po prostu program wymaga od użytkownika jakiejś interakcji, aktualizacji, etc.
Podobne historie zdarzają się z zapasowymi łączami internetowymi, maszynami wirtualnymi czy całymi serwerami. Na pierwszy rzut oka niby wszystko jest OK, ale o tym, czy na pewno jest OK przekonamy się gdy padnie nasz własny rurociąg A.
Może być też tak, że wszystko działa jak należy, ale brakuje nam praktyki (i procedur) w takich sytuacjach, a w stresie nasz mózg pracuje zupełnie inaczej.
("Serwer leży, firma stoi, 100 osób nie może się dostać do głównego programu, a Ty masz w rękach jedyny backup, GO!")
Jeśli coś jest w założeniu zapasowe to po to, aby miało PEŁNĄ SPRAWNOŚĆ w możliwie jak najkrótszym czasie od wykrycia awarii. Nie da się tego zrealizować bez okresowych testów i symulacji. Gdy dochodzi czynnik stresu musimy mieć 100% pewności, że to co mamy w rękach pozwoli nam przywrócić sprawność systemów bez uronienia kropli potu. (Pomijając już automatyzację takich sytuacji).
Przyznajcie się z ręką na sercu, kto regularnie wykonuje kopie zapasowe i okresowo je testuje na większą skalę? Która firma posiada "księgę dobrych praktyk", która opisuje sposób postępowania w przypadku awarii? To niewiele, a może uchronić Wasze firmy przed sporymi problemami.
W przypadku "Czajki", w roku wyborczym i z udziałem wojska, odzyskanie doraźnej(!) sprawności zajęło 12 dni. Która firma może sobie pozwolić na taki przestój w pracy? No dobra, chociaż tydzień. 3 dni?
A w między czasie do Wisły wpłynęło łącznie jakieś 26 000 000 hektolitrów ścieków (dla wartości w litrach dodajcie dwa zera) i co prawda stanowiło to ok. 1% stanu rzeki, ale wartości bezwzględne nadal mimo wszystko robią wrażenie...
https://codasolutions.pl
Źródła:
https://wiadomosci.wp.pl/kulisy-awarii-oczyszczalni-czajka-inzynier-wskazuje-inna-przyczyne-niz-rafal-trzaskowski-6420867343136385a
https://inzynieria.com/wpis-branzy/wiadomosci/2/56491,awaria-kolektora-w-warszawie-jest-wstepna-przyczyna-i-dymisja
https://www.polsatnews.pl/wiadomosc/2019-09-02/awaria-oczyszczalni-czajka-kamera-polsat-news-byla-przy-uszkodzonych-kolektorach/
https://www.rmf24.pl/fakty/polska/news-awaria-w-oczyszczalni-czajka-zakonczyla-sie-budowa-mostu-pon,nId,3183646
https://www.tvp.info/44240662/ekspert-o-awarii-czajki-to-bylo-do-przewidzenia-ostrzegalem