Kontaminaation havaitseminen talousvesiverkostoissa
Pesonen, Eemeli (2019)
Pesonen, Eemeli
2019
Ympäristö- ja energiatekniikka
Tekniikan ja luonnontieteiden tiedekunta - Faculty of Engineering and Natural Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2019-05-31
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tty-201906111868
https://urn.fi/URN:NBN:fi:tty-201906111868
Tiivistelmä
Varhaisvaroitusjärjestelmät (EWS) ovat järjestelmiä, jotka pyrkivät talous- tai raakavettä monitoroimalla havaitsemaan veteen päässeitä vieraita aineita. EWS:n tehtävänä on seurata veden laatuparametrejä erilaisilla sensoreilla, tulkita sensorien mittaamaa dataa ja auttaa päätöksenteossa ja kommunikoinnissa kontaminaation tapahtuessa. Tapahtumanhavaitsemisjärjestelmä (EDS) on EWS:n osa, joka tulkitsee reaaliajassa talousveden laatuparametrejä ja pyrkii havaitsemaan vedestä vieraiden aineiden aiheuttamat kontaminaatiot. EDS:t voivat hyödyntää esimerkiksi erilaisia koneoppimisalgoritmeja, jotka havaitsevat laatuparametrien normaalista poikkeavan käytöksen kontaminaation tapahtuessa. EDS:n tulisi havaita kontaminaatio mahdollisimman suurella todennäköisyydellä samalla, kun todennäköisyys väärälle hälytykselle on mahdollisimman pieni. Tässä työssä tutkitaan kolmea eri EDS-sovellutusta ja verrataan niiden suorituskykyjä keskenään. Työ on kirjallisuuskatsaus ja EDS:ien suorituskyvyt on selvitetty tutkimusartikkeleista. Työssä pohditaan sopivatko EDS:t sellaisinaan talousveden monitorointiin, vai tarvitaanko vielä lisää tutkimusta esimerkiksi erilaisilla kontaminaatioilla ja eri tavalla optimoiduilla algoritmeilla.
Tutkittavat EDS:t ovat painotettu tukivektorikone (SVM), pienimmän tilavuuden ellipsoidi -lajittelumalli (MVE) ja kanoninen korrelaatioanalyysi (CCA). EDS:istä SVM ja MVE ovat koneoppimisalgoritmeja. SVM ja MVE eroavat toisistaan muun muassa siten, että SVM:n harjoitus tapahtuu ohjatusti, kun taas MVE:n harjoitus tapahtuu ohjaamattomasti. CCA on tilastollinen menetelmä, jossa uusien mittaustulosten korrelaatiota verrataan vanhaan dataan. SVM:n ja MVE:n testaamiseen käytetty data on saatu oikean talousvesivarkoston normaalista ajosta, johon on lisätty keinotekoisia sattumanvaraisia kontaminaatioita. CCA:n testaamiseen on käytetty dataa laboratoriokokeesta, jossa normaaliin veteen on lisätty vieraana aineen akryyliamidia.
EDS:ien suorituskykyjen perusteella paras EDS on CCA. CCA ei aiheuttanut testauksessa ainuttakaan väärää hälytystä ja sen todennäköisyys havaita kontaminaatio vaihteli välillä 0,990 – 0,998. MVE:n todennäköisyys havaita kontaminaatio vaihteli välillä 0,61 – 1,00, ja mikäli MVE:n vääriä hälytyksiä saadaan karsittua, se voi olla varteenotettava vaihtoehto CCA:lle. EDS:istä huonoimmat suorituskyvyn arvot sai SVM. SVM:llä todennäköisyys kontaminaation havaitsemiseen oli välillä 0,44 – 0,98 ja vääriä hälytyksiä tuli enemmän kuin CCA:lla ja MVE:llä. Vaikka CCA vaikuttaa suorituskykyjen perusteella parhaalta EDS:ltä, CCA:n tuloksia on verrattava muihin EDS:iin varautuen, sillä CCA:n testaukseen käytettiin huomattavasti vähemmän dataan kuin MVE:n ja SVM:n testaukseen. Lisäksi CCA:n testauksen normaali vesi oli raakavettä talousveden sijaan. Tämä tarkoittaa sitä, että erityisesti CCA tarvitsee vielä jatkotutkimusta, jos menetelmää aiotaan käyttää talousveden monitorointiin. Jatkotutkimuksissa voisi tutkia muun muassa CCA:n suorituskykyä erilaisella puhtaalla vedellä ja eri lisättävillä vierailla aineilla. Tulosten perusteella SVM:ää ei todennäköisesti kannata tutkia enempää.
Tutkittavat EDS:t ovat painotettu tukivektorikone (SVM), pienimmän tilavuuden ellipsoidi -lajittelumalli (MVE) ja kanoninen korrelaatioanalyysi (CCA). EDS:istä SVM ja MVE ovat koneoppimisalgoritmeja. SVM ja MVE eroavat toisistaan muun muassa siten, että SVM:n harjoitus tapahtuu ohjatusti, kun taas MVE:n harjoitus tapahtuu ohjaamattomasti. CCA on tilastollinen menetelmä, jossa uusien mittaustulosten korrelaatiota verrataan vanhaan dataan. SVM:n ja MVE:n testaamiseen käytetty data on saatu oikean talousvesivarkoston normaalista ajosta, johon on lisätty keinotekoisia sattumanvaraisia kontaminaatioita. CCA:n testaamiseen on käytetty dataa laboratoriokokeesta, jossa normaaliin veteen on lisätty vieraana aineen akryyliamidia.
EDS:ien suorituskykyjen perusteella paras EDS on CCA. CCA ei aiheuttanut testauksessa ainuttakaan väärää hälytystä ja sen todennäköisyys havaita kontaminaatio vaihteli välillä 0,990 – 0,998. MVE:n todennäköisyys havaita kontaminaatio vaihteli välillä 0,61 – 1,00, ja mikäli MVE:n vääriä hälytyksiä saadaan karsittua, se voi olla varteenotettava vaihtoehto CCA:lle. EDS:istä huonoimmat suorituskyvyn arvot sai SVM. SVM:llä todennäköisyys kontaminaation havaitsemiseen oli välillä 0,44 – 0,98 ja vääriä hälytyksiä tuli enemmän kuin CCA:lla ja MVE:llä. Vaikka CCA vaikuttaa suorituskykyjen perusteella parhaalta EDS:ltä, CCA:n tuloksia on verrattava muihin EDS:iin varautuen, sillä CCA:n testaukseen käytettiin huomattavasti vähemmän dataan kuin MVE:n ja SVM:n testaukseen. Lisäksi CCA:n testauksen normaali vesi oli raakavettä talousveden sijaan. Tämä tarkoittaa sitä, että erityisesti CCA tarvitsee vielä jatkotutkimusta, jos menetelmää aiotaan käyttää talousveden monitorointiin. Jatkotutkimuksissa voisi tutkia muun muassa CCA:n suorituskykyä erilaisella puhtaalla vedellä ja eri lisättävillä vierailla aineilla. Tulosten perusteella SVM:ää ei todennäköisesti kannata tutkia enempää.
Kokoelmat
- Kandidaatintutkielmat [8421]