Poikkeamien tunnistaminen jätevesipumppaamon mittausdatasta
Jyrkönen, Paula (2022)
Jyrkönen, Paula
2022
Automaatiotekniikan DI-ohjelma - Master's Programme in Automation Engineering
Tekniikan ja luonnontieteiden tiedekunta - Faculty of Engineering and Natural Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2022-04-19
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-202204042981
https://urn.fi/URN:NBN:fi:tuni-202204042981
Tiivistelmä
Tässä työssä tutkittiin koneoppimisen käyttöä häiriötilanteiden tunnistamisessa jätevesipumppaamoiden mittausdatasta. Työn tavoitteena oli selvittää, miten mittausdatassa esiintyviä poikkeamia voidaan tunnistaa ja mikä olisi tähän tarkoitukseen sopivin menetelmä. Poikkeamien tunnistamisen algoritmeista tuotettuja malleja voitaisiin käyttää apuna jätevedenpumppaamoiden kunnonvalvonnassa. Malli tunnistaisi pumppaamolla esiintyvän poikkeavan toiminnan ja siitä tehtävän ilmoituksen perusteella operaattori voisi tarkistaa, onko kyseessä todellinen häiriö ja päättää mahdollisista jatkotoimenpiteistä. Tällä hetkellä häiriöiden löytäminen vaatii operaattorien aktiivista mittausarvojen ja niistä tehtyjen graafisten esitysten tarkkailua.
Menetelmien testaamiseen ja arviointiin oli käytettävissä jätevesipumppaamoiden mittausten historiadataa. Pumppaamoilta ei kuitenkaan ollut saatavilla tarkkoja tietoja mahdollisista tapahtuneista häiriötilanteista, joten työssä päädyttiin käyttämään ohjaamattoman oppimisen poikkeamien tunnistamisen menetelmiä. Datan tuomien rajoitusten, mallin lopullisen käyttötarkoituksen sekä eri menetelmien tutkimisen jälkeen päädyttiin kokeilemaan ja arvioimaan neljää eri poikkeamien tunnistamiseen käytettävää algoritmia. DBSCAN-klusteroinnin, K-means klusteroinnin, isolation forestin sekä local outlier factorin algoritmeista opetettiin erilaisia malleja, joiden tunnistamia poikkeamia vertailtiin ja analysoitiin tarkoitukseen sopivimman algoritmin löytämiseksi.
Poikkeamien tunnistamisen mallien luominen algoritmien avulla on melko suoraviivaista. Mallin luomiseen käytettävä opetusdata on esikäsiteltävä, käytettävät piirteet valittava ja mallille annettavat parametrit määriteltävä, jonka jälkeen algoritmi suorittaa mallin opettamisen. Malli luokittelee jokaisen opetusdatajoukon pisteen joko poikkeamaksi tai normaaliksi pisteeksi. Haasteena työssä oli kunkin mallin antamien tulosten oikeellisuuden ja tunnistettujen poikkeamien oleellisuuden arvioiminen, sillä ohjaamattomille menetelmille ei voida laskea selkeitä mallien suorituskykyä kuvaavia tunnuslukuja. Eri algoritmien löytämiä poikkeamia arvioitiin ja analysoitiin muodostamalla samoista opetusdatajoukoista useita eri malleja ja vertailemalla niiden saamia tuloksia. Tämän lisäksi käytettiin erilaisia graafisia esityksiä mallien saamien tulosten tarkastelemiseen.
Algoritmien ja mallien arvioinnin lisäksi työssä pohdittiin erilaisia koneoppimisen algoritmien käyttämisen sekä työkalun toteuttamisen ja sen toimimisen tuomia vaatimuksia ja haasteita. Yksi selkeimmistä ongelmista on jokaisen koneoppimismallia käyttävän tapauksen yksilöllisyys, minkä takia jokainen tapaus on käsiteltävä erikseen. Kaikki käytettävä data on esikäsiteltävä erikseen, parametrit on optimoitava käytettävään dataan ja tapaukseen sopivaksi sekä työkalun toimintaa tulisi tarkastella aina käyttökohteessa tapahtuvien muutosten jälkeen uudestaan.
Tutkimus osoittaa, että ohjaamattoman koneoppimisen poikkeamien tunnistamisen menetelmiä voidaan käyttää apuna jätevedenpumppaamoiden kunnonvalvonnassa. Työssä käytetyt algoritmit löysivät pumppaamon mittausdatan seasta selkeitä poikkeamia. Tutkituista algoritmeista DBSCAN sekä iForest toimivat työssä tehtyjen analyysien perusteella parhaiten, joten niitä voidaan suositella harkittavaksi lopullisessa pumppaamoiden häiriöiden tunnistamiseen tarkoitetussa työkalussa käytettäväksi.
Menetelmien testaamiseen ja arviointiin oli käytettävissä jätevesipumppaamoiden mittausten historiadataa. Pumppaamoilta ei kuitenkaan ollut saatavilla tarkkoja tietoja mahdollisista tapahtuneista häiriötilanteista, joten työssä päädyttiin käyttämään ohjaamattoman oppimisen poikkeamien tunnistamisen menetelmiä. Datan tuomien rajoitusten, mallin lopullisen käyttötarkoituksen sekä eri menetelmien tutkimisen jälkeen päädyttiin kokeilemaan ja arvioimaan neljää eri poikkeamien tunnistamiseen käytettävää algoritmia. DBSCAN-klusteroinnin, K-means klusteroinnin, isolation forestin sekä local outlier factorin algoritmeista opetettiin erilaisia malleja, joiden tunnistamia poikkeamia vertailtiin ja analysoitiin tarkoitukseen sopivimman algoritmin löytämiseksi.
Poikkeamien tunnistamisen mallien luominen algoritmien avulla on melko suoraviivaista. Mallin luomiseen käytettävä opetusdata on esikäsiteltävä, käytettävät piirteet valittava ja mallille annettavat parametrit määriteltävä, jonka jälkeen algoritmi suorittaa mallin opettamisen. Malli luokittelee jokaisen opetusdatajoukon pisteen joko poikkeamaksi tai normaaliksi pisteeksi. Haasteena työssä oli kunkin mallin antamien tulosten oikeellisuuden ja tunnistettujen poikkeamien oleellisuuden arvioiminen, sillä ohjaamattomille menetelmille ei voida laskea selkeitä mallien suorituskykyä kuvaavia tunnuslukuja. Eri algoritmien löytämiä poikkeamia arvioitiin ja analysoitiin muodostamalla samoista opetusdatajoukoista useita eri malleja ja vertailemalla niiden saamia tuloksia. Tämän lisäksi käytettiin erilaisia graafisia esityksiä mallien saamien tulosten tarkastelemiseen.
Algoritmien ja mallien arvioinnin lisäksi työssä pohdittiin erilaisia koneoppimisen algoritmien käyttämisen sekä työkalun toteuttamisen ja sen toimimisen tuomia vaatimuksia ja haasteita. Yksi selkeimmistä ongelmista on jokaisen koneoppimismallia käyttävän tapauksen yksilöllisyys, minkä takia jokainen tapaus on käsiteltävä erikseen. Kaikki käytettävä data on esikäsiteltävä erikseen, parametrit on optimoitava käytettävään dataan ja tapaukseen sopivaksi sekä työkalun toimintaa tulisi tarkastella aina käyttökohteessa tapahtuvien muutosten jälkeen uudestaan.
Tutkimus osoittaa, että ohjaamattoman koneoppimisen poikkeamien tunnistamisen menetelmiä voidaan käyttää apuna jätevedenpumppaamoiden kunnonvalvonnassa. Työssä käytetyt algoritmit löysivät pumppaamon mittausdatan seasta selkeitä poikkeamia. Tutkituista algoritmeista DBSCAN sekä iForest toimivat työssä tehtyjen analyysien perusteella parhaiten, joten niitä voidaan suositella harkittavaksi lopullisessa pumppaamoiden häiriöiden tunnistamiseen tarkoitetussa työkalussa käytettäväksi.