Järjestelmämonitoroinnin kehittäminen: Palvelutasodatan keräämisen, säilyttämisen, käsittelemisen ja esittämisen uusiminen
Riikonen, Toni (2020)
Riikonen, Toni
2020
Johtamisen ja tietotekniikan DI-ohjelma - Master's Programme in Management and Information Technology
Tekniikan ja luonnontieteiden tiedekunta - Faculty of Engineering and Natural Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2020-12-09
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-202012078574
https://urn.fi/URN:NBN:fi:tuni-202012078574
Tiivistelmä
Palvelutasosopimus on nykyään tavallinen osa asiakkaalle toimitetussa palvelussa. Sopimuksen kriteerien täyttymisen todistamiseen ja vikatiedoista nopean tiedon saamiseksi tarvitaan järjestelmämonitorointia. Tätä varten kohdeyrityksen SyncWare-ohjelmaan kuuluu siihen toteutettu oma järjestelmämonitorointi, joka on kuitenkin todettu puutteelliseksi. Dataa saadaan liian harvalla syklillä, kerätystä datasta muodostettava raportti sisältää käsin tehtäviä toimintoja, johon kuluu aikaa, uusien kerättävien raporttitietojen konfiguroiminen on monimutkaista ja ilmoituksen voi saada ainoastaan sähköpostilla tai tekstiviestillä. Tässä diplomityössä tälle vanhalle järjestelmämonitoroinnille toteutettiin korvaava versio. Tutkimuskysymyksissä selvitettiin, millä tehokkaammilla järjestelmämonitorointityökaluilla uusi järjestelmämonitorointi toteutettaisiin ja paljonko vanhasta toiminnasta voidaan siirtää näille uusille työkaluille. Jäljelle jäävät toiminnot yhdistettiin uuden järjestelmämonitorointikokonaisuuden kanssa. Datasta piti myös pystyä muodostamaan kuvaajia niin, että niitä voi käyttää raporteissa. Lisäksi hälytyksistä pitää myös pystyä lähettämään ilmoitus keskusteluohjelma Slackiin ja tehtävä tehtävien hallinta järjestelmään Jiraan. Toteutusta varten perustettiin demo versio omalle työkoneelle ja uudelle palvelimelle, jolloin saatiin kerättyä dataa omasta koneesta ja siinä olevasta SyncWare-testiympäristöstä. Käytettäviksi työkaluiksi valittiin datan keräämisen ja raportoinnin palvelu Telegraf, aikasarjatietokanta InfluxDB, datan prosessoinnin runko Kapacitor, käyttöliittymä ja haku- sekä visualisointityökalu Chronograf ja datan haku-, visualisointi- ja hälytystyökalu Grafana. Toteutuksessa saatiin yleinen ympäristöstä kerättävä data kuten prosessorin, kovalevyn ja muistin tilat sekä Java-koodin ajamiseen WWW-palvelimen ympäristössä tarkoitetun Tomcatin muistin ja säikeiden käyttö kerättäväksi Telegrafille. SyncWarelle itselleen jäi edelleen kerättäväksi tietokannan, klusterin, replikoinnin ja sanomien data. Lokin sisältö jätettiin toistaiseksi toteuttamatta, koska sillä ei ole väliä hälytysten kannalta ja keräämiselle joko ei ole toteutusta tai siinä on sopimuksellisia ongelmia. Palvelimien lokien ja tietokannan datan kerääminen odottaa sitä, että niille tulee toteutus Telegrafiin. Testauksen yhteydessä tarkistettiin, että data siirtyy InfluxDB:hen, sitä saadaan nopealla syklillä ja arvot vastaavat muiden monitorointi keinojen antamia arvoja samasta asiasta. Samalla testattiin raporttien muodostamista kerätystä datasta. Lisäksi katsottiin, että ilmoitus Slackiin ja tehtävä Jiraan toiminnot toimivat hälytystilanteissa. Uudesta toteutuksesta tehtiin konsepti toteutus mitä voidaan käyttää pohjan uuden järjestelmämonitoroinnin asentamiseen asiakkailla. Tulevaisuudessa tämä uusi järjestelmämonitorointikokonaisuus on tarkoitus ottaa käyttöön asiakkaiden ympäristöissä. Parannettavaa on hälytys komentosarjojen toteutuksessa niin, että ne olisivat helposti kaikkien määritettävissä. Mahdollisesti on luotava ympäristöstä yksi iso komentosarja, joka sitten on kopioitavissa uudelle ympäristölle ja otettavissa käyttöön säätämällä komentosarjan alussa olevia muuttujia. Alustavan version esittelyssä kuukausipalaverissa palautteena oli, että viestinnän täytyisi olla mahdollista myös tavalla, mikä on täysin erillään muista viestintäkanavista niin kuin tekstiviestit olivat vanhassa järjestelmässä. Tähän sopiva keino voisi olla Pushover-ilmoitussovellus. Järjestelmämonitorointi kokonaisuudesta on myös tulossa uusi versio InfluxDB 2.0, joka tulee tarkoittamaan isoja muutoksia, mikäli se pyritään ottamaan käyttöön tulevaisuudessa. Siinä on kuitenkin luvattu, että vanhan version hakujen ja hälytyskomentosarjojen migraatio olisi mahdollista.