SUCCESS STORIES


 
Implementace monitorovací a reportovací platformy

Realizace: CETIN, Česká telekomunikační infrastruktura, a.s.

Cíl projektu

Česká telekomunikační společnost CETIN, která poskytuje služby v oblasti síťové infrastruktury, se rozhodla vybudovat monitoring postavený na open source projektu Icinga2. Hlavní potřebou klienta bylo vytvoření nástroje pro monitorování infrastruktury, poskytnutí grafického rozhraní pro různá oddělení (helpdesk, SL2), notifikace a eskalace problémů. Projekt jsme převzali od původního dodavatele, jehož řešení nebylo vyhovující.

 

Realizace projektu

Navrhli a zprovoznili jsme funkční řešení pro implementaci požadavků:

  • Synchronizace s CMDB (iTOP)
  • Napojení na notifikační služby CETIN (email, SMS, VOIP)
  • Bezvýpadková konfigurace monitoringu
  • Notifikace problémů na základě uživatele, konfigurace pohotovostí a priority problémů
  • Reporty monitoringu (počty notifikací a problémů, počet kritických chyb)
  • Napojení na stávající systémy (Graylog, Grafana)
  • Synchronizace kontaktů z Active Directory
  • HA konfigurace a možnost škálování monitoringu
  • Konfigurace relační databáze MySQL do replikačního módu

 

Monitoring jsme předali do produkce za 3 měsíce od zadání.

Bylo instalováno rozšíření Director, které umožnuje nahrání nebo úpravu konfigurace serverů a služeb přes REST API.

Byl vytvořen synchronizační proces, který na základě konfigurace (periodického spouštění) synchronizuje servery a služby z CMDB iTOP. Součástí procesu je synchronizace kontaktů a skupin z Active Directory. Adaptér je napojený na systém zajišťující pohotovosti pro výběr konkrétní osoby při nočních výpadcích.

Konfigurace notifikací Icinga2 byla upravena pro vyhodnocování jednotlivých notifikací. Na základě priority, denní doby a dalších parametrů může být skupině uživatelů odeslán email, případně poslána SMS, VOIP o vzniklém incidentu. Zároveň je zde pro možnost vytvoření tiketu do servis desku.

Pro ukládání informací ze sond (metrik) slouží databáze InfluxDB. Zákazník si data zobrazuje pomocí projektu Grafana, informace z logu získá skrze projekt GrayLog.

Reporty statistik (incidenty) byly vytvořeny v projektu JasperReport.

 

Výsledek projektu

Zákazník si veškeré instalované komponenty převzal do provozu a spravuje je sám. Zároveň má k dispozici zdrojové kódy a má možnost upravovat adaptéry na iTOP.

V našich kompetencích zůstal vývoj složitějších úprav komponent a konzultace nastavení systému.

V poslední fázi projektu proběhla realizace napojení všech systémů (IcingaWeb2, Grafana, GrayLog) na jednotné SSO (Kerberos).

Aktuálně systém monitoruje přes 1000 serverů a kolem 6000 služeb.

 

 

PF 2024