Tag Archive for 'zarzadzanie'

Planowy downtime a SLA

SLA, jako umowa między usługodawcą, a klientem może zawierać szereg uzgodnień dot. jakości usług. Jedną z nich jest, moim zdaniem bardzo ważna, definicja planowego downtime‘u.

Czym jest planowy downtime? Jest to czas, najczęściej w środku nocy, jaki jest wymagany przez administratorów systemów do instalacji nowego oprogramowania czy łatania już istniejącego, zmian konfiguracyjnych sprzętu i oprogramowania, które wymagają ponownego rozruchu i inne elementy, które w znaczny sposób zakłócą pracę serwisów, za które płaci klient (co oznacza obniżenie czasu dostępności usług).

Wiemy, że nasze systemy wymagają downtime’u od czasu do czasu. W przypadku Microsoftu, jest to min. raz w miesiącu (tzw. patch Tuesday), kiedy ukazują się krytyczne bądź ważne poprawki do systemów i aplikacji, które najczęściej wymagają restartu “łatanego” systemu. Przy założeniu, że byłoby to 10 minut w skali miesiąca na restart jednej maszyny daje to całkiem przyzwoity poziom 99.97717% dostępności w skali roku. To jest jednak sytuacja idealna, kiedy łatamy tylko system operacyjny. Gorzej jeśli po drodze mamy jeszcze Exchange, SQL, IIS i inne systemy. Czas potrzebny do zainstalowania wszystkich poprawek sięga wtedy 20 minut, 30 minut, etc, a nasz czas dostępności coraz bardziej się kurczy, a wydłuża się czas, kiedy aplikacja klienta nie działa.

Co zatem robić w przypadku, kiedy musimy poprawki instalować, a jednocześnie musimy zapewnić określoną przez SLA i bardzo wyżyłowaną dostępność na poziomie 99.99%? Można poradzić sobie dwojako: poprzez odpowiednią klauzulę w umowie o poziomie usług albo poprzez rozwiązania techniczne (clustering).

Opcja pierwsza dla klienta końcowego wygląda dość kuriozalnie: system nie działa, ale o tym wiem i się na to zgodziłem (planowy downtime) albo system nie działa, ale się na to nie godziłem (nieplanowany downtime) - tak czy inaczej, w obu przypadkach usługa kliencka jest niedostępna. To tak, jak kupić samochód i godzić się, że co miesiąc nasz silnik się wyłączy na 5 minut (lepiej byśmy nie byli wtedy na autostradzie).

Zawieranie klauzuli planowego downtime‘u w umowie SLA jest wg. mnie po prostu nieeleganckie i wprost pokazuje, że firma tnie koszty i nie chce inwestować w rozwiązania zapewniające ciągłą dostępność (jak wspomniany przeze mnie wyżej clustering). Jeśli jednak, usługodawcy zdecydują się na wykorzystanie technik HA (high availability), mogą szczycić się w umowach z klientami poziomem 5*9, czyli 99,999%, gdzie 0,001% jest już jedynie współczynnikiem ryzyka.

A co mają zrobić administratorzy i menedżerowie IT? Zasiąść za arkuszem kalkulacyjnym i zobaczyć czy ich firmę stać na rozwiązania HA i kiedy poniesiony koszt się zwróci. A zapewniam, prędzej czy później się zwróci.

Elastyczne SLA

Dziś natknąłem się na informację, która z jednej strony mnie rozśmieszyła, a z drugiej poważnie zaniepokoiła. W tejże informacji było użyte następujące sformułowanie:

SLA is lower this week due to [...] impacting our system performance.

Ktoś pomylił sobie słówko availability z pojęciem SLA, które oznacza Service Level Agreement. I to ostatnie jest porozumieniem między klientem a usługodawcą o poziomie świadczonych usług, więc nie może ulegać zmianie bez re-negocjacji z klientem!

SLA jest wyznacznikiem świadczenia usług, jest poziomem którego dotrzymywanie jest bardzo ważnym elementem jakości tychże usług. W najgorszym przypadku jest celem, do którego usługodawcy dążą. Tym bardziej SLA, które zmienia się co tydzień jest wielkim nieporozumieniem!

P.S. Jeśli ktoś myśli, że to był Eircom, jest w błędzie :)

Czas a SLA

W analizie ryzyka dla swojego projektu oceniałem ostatnio możliwy do zaakceptowania czas downtime’u serwerów. Poza analizowaniem zajętości łącza, planowaniem zużycia pamięci, zajętości dysków (stosunek wielkości do czasu, skala: 6, 12, 24 miesiące) musiałem też przyjąć pewne akceptowalne wartości uptime. Niektórzy nazywają to po prostu SLA, ja nazywam to jedynie składową SLA (Teoria dążenia do doskonałości).

W celu dokładnej analizy ile czasu możemy poświęcić na downtime i jaki odpowiada temu poziom SLA przydatna może być poniższa tabelka. Oszczędza trochę czasu i liczenia.

Uptime Daily Monthly Yearly
95% 72.00 minutes   36 hours   18.26 days  
99% 14.40 minutes   7 hours   3.65 days  
99.9% 86.40 seconds   43 minutes   8.77 hours  
99.99% 8.64 seconds   4 minutes   52.60 minutes  
99.999% 0.86 seconds 26 seconds 5.26 minutes

Tabelka pochodzi z dokumentu Planning and architecture for Office SharePoint Server 2007, Part 2.

Firmy hostingowe, czy ogólnie usługodawcy IT, których uptime jest na poziomie 99.9% (czyli w środku tej tabeli) mogą pozwolić sobie na jedynie 86.4 sekund (minutę i 26.4 sekundy) dziennie niedziałającej usługi. Za taki poziom płaci się dużo. Wyobraźcie sobie zatem poziom 99.999% - 5.26 minuty w skali roku!

The IT Room

Ponad dwa lata temu, widziałem od środka jaka panikę i niezrozumienie wśród kadry zarządzającej Dell’a w Irlandii wywoływało słówko blog czy rss. Oba te słowa były kojarzone ze spadkiem produktywności, obciążeniem sieci, problemami z prawem, pracownikami którzy zamiast pracować blogują o niczym, albo piszą rzeczy, których Dell nie chciałby by wydostały się “na zewnątrz”.

Dwa lata temu Dell dojrzewał do pomocy technicznej w postaci chat’a na stronie www. Później, zupełnie nieoczekiwanie pokazała się strona Direct2Dell.com zawierająca posty pracowników Dell’a. Brakowało mi jednak czegoś, jakiegoś pazura, wyrazistości i siły przebicia.

Dziś zobaczyłem The IT Room. I choć jest to w moim mniemaniu odgrzewany kotlet, w dodatku spóźniony, jednak jest to powiew świeżego powietrza, nowego spojrzenia na IT, które Dell próbuje pokazać na rynku. Good job guys! IT nie jest śmiertelnie poważne i nie samą pomocą techniczną człowiek żyje…

3, a właściwie to 2.5

Jest sobie taka sieć komórkowa, 3 albo three. Jak sama nazwa wskazuje jest siecią 3-ciej generacji, W-CDMA. Są obecni w kilku krajach na całym świecie: Australia, Dania, UK, Włochy, Austria, Szwecja, HK i Irlandia.

Zdarzyło się, że zostałem klientem sieci 3 w Irlandii. Ale to nie tanie rozmowy ani koszt wiadomości były dla mnie powodem do zmiany mojego dotychczasowego operatora, Meteor, na nowego. To Internet przez komórkę był magnesem. Za 19.99€/miesiąc mam pakiet 10GB. Jak dla komórki, 10GB to wirtualny brak limitu przesyłu danych. Dla poważniejszych zastosowań mam w domu, jak i w pracy wystarczające łącza. Potrzebowałem Internetu w komórce dla emaili i RSS głównie, wszystko inne to już margines.

Wraz z nowym operatorem dostałem też nowy telefon, Motorola v3xx. Bez telefonu nie mogłem mieć tego co chciałem - nowej SIM karty i Internetu w komórce, więc za 0€ wziąłem co dawali. Dałem sobie kilka tygodni by znaleźć dobry PDA (o tym w innym odcinku).

Dostałem do testów na kilka dni troszkę już wysłużony HTC Tytn. Zsynchronizowałem z laptopem wszystko co chciałem zsynchronizować i postanowiłem, że dalsze synchronizację będę przeprowadzał przez Internet za pomocą 3.

Przejrzałem ich stronę, by znaleźć informacje dot. konfiguracji dostępu do sieci Internet przez GSM, nie znalazłem nic. Postanowiłem zadzwonić do ich pomocy technicznej. Znajduje się w Indiach. W jakiś magiczny sposób czułem co się święci.

Po krótkim przedstawieniu sytuacji zostałem zweryfikowany jako prawidłowy właściciel swojego telefonu. Oto mocno okrojona wersja mojej konwersacji z pomocą techniczną 3 (oryginał w wersji angielskiej, pozwoliłem sobie przetłumaczyć na moją łamaną polszczyznę):

- Potrzebuję ustawień dla dostępu do Internetu
- Potrzebuje pan ustawień przeglądarki?
- Nie, konkretnie potrzebuję nazwy punktu dostępowego (access point name), DNS i podobnych
- (dłuższa cisza) rozumiem, czy mogę zadzwonić do pana na inny numer?
- Dlaczego?
- Będę chciała przesłać panu ustawienia telefonu, będzie pan musiał uruchomić go ponownie…
- Ale ja potrzebuję tych ustawień dla innego telefonu
- (cisza)
- Halo?
- Mogę zapytać co to za telefon?
- HTC Tytn
- (dłuższa cisza) ale ja nie mam ustawień dla tego telefonu
- Ustawienia, o które proszę są takie same dla wszystkich telefonów, poproszę o ustawienia dla dowolnego telefonu
- Czy jest to telefon 3G?
- Tak, jest to telefon 3G
- Ale czy został zakupiony w 3?
- Nie, został zakupiony w innym sklepie
- Niestety nie mogę panu pomóc, z usługi Internetu w komórce można korzystać tylko w komórkach sprzedawanych w sieci 3…

Dalsza rozmowa przebiegała mniej więcej takim torem: ja pytam się dlaczego, w odpowiedzi słyszę że tak jest w umowie, proszę więc o pokazanie mi, najlepiej na stronie gdzie tak jest napisane, bo ja takiego zapisu nie widzę, pani twierdzi, że nie ma umowy przed sobą ale to jest na stronie http://www.three.ie (oczywiście spelowanie) pod linkiem Terms & Conditions. Zaglądam, czytam, nic nie ma o zakazie/nakazie korzystania z innego aparatu. Pani twierdzi, że ona znajdzie mi inny dokument, gdzie to jest napisane. Pani odsyła mnie na inną stronę. Pani twierdzi, że w punkcie 9.1 jest napisane, iż używanie innych, SIM-free aparatów może spowodować zablokowanie usług. Ja nie mogę się doszukać związku między moją sytuacją a przepisami, które są mi podawane (we reasonably believe you have permitted your Handset to be unlocked via any unauthorised manner). Pytam o związek, Pani wraca do swojej formułki o zakazie używania Internetu na innych aparatach. Proszę o rozmowę z jej szefem, bo nie widzę dalszej możliwości kontynuowania tej rozmowy. Pani menedżer informuje mnie, że nie zna Terms & Conditions na pamięć, ale takie są przepisy firmy i nic z tym nie będzie dało się zrobić. Proszę o napisanie do mnie listu z takim oświadczeniem. Zostaję poinformowany, że firma nie ma takiej praktyki i nie dostanę żadnego listu. Rozmowa stała się jałowa i ją zakończyłem.

W międzyczasie znalazłem na boards.ie ustawienia, o które prosiłem.

Co poszło źle?

  1. W kontakcie z pomocą techniczną jakiejkolwiek firmy wymaga się, by obsługa znała sprzedawane przez firmę, która ich zatrudnia (dla której pracują), znała produkty i usługi oferowane przez firmę. W moim przypadku: brak wiedzy co to jest access point i serwery DNS.
  2. Pomoc Techniczna musi wiedzieć w jakich obwarowaniach prawnych się porusza, a co najważniejsze powinna znać takowe przepisy dla klientów firmy i mieć dostęp do wszystkich dokumentów firmy, do których ma dostęp klient. W moim przypadku ani pani asystentka, ani jej menedżerka nie miały dostępu do stron, do których byłem odsyłany, więc nie były w stanie wskazać mi jaki punkt mógłbym potencjalnie złamać używając Internetu na innym telefonie.
  3. Przepisy firmy powinny być dla ludzi, a nie odwrotnie. Podobnie powinna działać też pomoc techniczna. Jeśli kupuję telefon, to chciałbym się dowiedzieć jak go skonfigurować i definitywnie nie chcę, by firma ukrywała tę konfigurację przede mną. Jeśli kupujesz samochód, to nawet jeśli nie wymagasz, by sprzedawca wytłumaczył ci jak wymienić świece, to przynajmniej oczekujesz, że taka informacja będzie dostępna w książce serwisowej producenta, bądź dostępna na półkach w księgarniach.
  4. Klienci często wymagają, by pomoc techniczna każdej firmy była w stanie wykonać coś, co nierzadko wykracza poza rygory zajęcia jakie wykonują, czy wiedzę jaka była od nich wymagana przy zatrudnianiu na dane stanowisko. Ja prosiłem o prostą rzecz, która sprowadza się do tego: Access Point Name: 3ireland.ie, bez hasła, bez nazwy użytkownika, IP & DNS: automatycznie nadawane. Niestety, ludzie czytający skrypt nie są w stanie wykonać tego dodatkowego kroku.

Co sprawia, że kontakt z pomocą techniczną traktuje się jak przyjemność porozmawiania ze specjalistą a nie jak zmorę, której się unika wszelkimi możliwymi sposobami? Wszystko co napisałem powyżej. Firma, która zrozumie, że dział pomocy technicznej przez niekompetencję i brak wyobraźni swoich pracowników może narazić się na utratę zaufania klientów, odniesie sukces. Tego nie da się zrobić przez tanich pracowników z innego kontynentu i nawet najbardziej inteligentne skrypty. Tego nie da się zrobić poprzez ustawianie działu pomocy technicznej po stronie kosztów w rachunku finansowym, pomoc techniczna też może generować przychody, pośrednio (poprzez odesłanie klienta do działu sprzedaży) lub bezpośrednio (poprzez płatne usługi). Powoli uczy się tego także Dell…

A ja po raz kolejny pokazałem, że jestem najgorszym klientem, jakiego każda firma może sobie wyobrazić…




Disclaimer

All postings are provided "AS IS" with no warranties, and confer no rights. This weblog does not represent the thoughts, intentions, plans or strategies of Microsoft or any other company or organization. Because a weblog is intended to provide a semi-permanent point-in-time snapshot, you should not consider out of date posts to reflect current thoughts and opinions.
All software used by author of this blog come from legal sources.

Add to Technorati Favorites