Variations on a Theme: The Classification of Benthic Macroinvertebrates
Joutsijoki, Henry (2012)
Joutsijoki, Henry
Tampere University Press
2012
Tietojenkäsittelyoppi - Computer Science
Informaatiotieteiden yksikkö - School of Information Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Väitöspäivä
2012-11-09
Julkaisun pysyvä osoite on
https://urn.fi/urn:isbn:978-951-44-8953-2
https://urn.fi/urn:isbn:978-951-44-8953-2
Tiivistelmä
Vain murto-osa maailman vesivarannoista on makeaa vettä. Jokapäiväisessä ympäristössämme olevat vesistöt, kuten joet, purot, lammet ja järvet ovat vain osajoukko makean veden kokonaismäärästä. Vesistöt kohtaavat nykyään enenevässä määrin erilaisia ympäristöpaineita muun muassa kemikaalipäästöjen muodossa. Tästä syystä vesistöjen tilojen tarkkailuun on viime vuosikymmenten aikana panostettu yhä enemmän. Vesistöjen tilojen seuranta voidaan suorittaa lyhyt- tai pitkäaikaisena. Lyhytaikaisessa seurannassa hyödynnetään usein kerättyjen vesinäytteiden kemiallista analyysia, kun taas pitkäaikaisten seurantojen yhteydessä käytetään apuna pohjaeläimiä, sillä ne reagoivat veden laadun muutoksiin hyvin ja niitä löytyy kaikista vesistöistä.
Pohjaeläimet ovat pieniä selkärangattomia eläimiä, jotka ovat riippuvaisia vedenalaisesta alustastaan jossain vaiheessa niiden elinkaarta. Pohjaeläinten hyödyntäminen vesistön tilan seurannassa on monivaiheinen prosessi. Ensimmäiseksi vesistöstä kerätään lukuisia näytteitä, joista pohjaeläimet erotellaan ja säilötään yksitellen. Toiseksi biologi tai lajintunnistukseen erikoistunut taksonomisti määrittää näytteistä saatujen pohjaeläinten lajit tai yleisesti ottaen niiden taksonomiset ryhmät yksitellen. Näytteistä saatujen lajitietojen ja muun analysoinnin perusteella pystytään selvittämään vesistön tilan muuttuminen pitkältä aikaväliltä. Prosessin työläimpiä vaiheita on pohjaeläinten tunnistaminen, jonka automatisointi säästäisi huomattavasti resursseja.
Väitöskirjassa keskitytään pohjaeläinten tunnistamiseen laskennallisin menetelmin, mikä on erittäin vähän tutkittu alue hahmontunnistuksen saralla. Pohjaeläinten laskennallinen tunnistaminen palautuu kuvien luokittelemiseen. Tutkimusaineistoina väitöskirjassa on käytetty kahta pohjaeläinkuva-aineistoa, joista ensimmäinen käsittää 1350 kuvaa yhteensä kahdeksasta taksonomisesta ryhmästä ja toinen kuvakokoelma pitää sisällään yli 4800 kuvaa yhteensä 50 pohjaeläinlajista. Väitöskirja koostuu viidestä artikkelista, joissa on sovellettu yhteensä 16:ta eri menetelmää pohjaeläinten tunnistamiseen. Käytetyistä menetelmistä 15 on kirjallisuudesta tuttuja ja väitöskirjassa esitetään yksi uusi luokittelumenetelmä. Erityinen painoarvo väitöskirjassa annetaan 1990-luvulla kehitetylle luokittelumenetelmälle nimeltään tukivektorikone.
Tukivektorikone on suunniteltu alun perin ainoastaan kahden luokan luokittelutehtäviin. Väitöskirjassa sovelletaan neljää tukivektorikoneelle kehitettyä moniluokkalaajennosta pohjaeläinluokitteluun ja kolmea näistä menetelmistä käytetään ensimmäistä kertaa pohjaeläinten luokittelussa. Lisäksi väitöskirjassa keskitytään tukivektorikoneen laajennuksissa esiintyviin teoreettisiin ongelmiin (tasapelitilanteet joissa uuden näytteen luokka ei ole yksikäsitteisesti määritetty ja luokkien jakamiseen optimaalisesti kahteen ryhmään) ja annetaan niihin uusia ratkaisumalleja. Käytettäessä tukivektorikonetta luokittelutehtävissä sen tehokkuus riippuu suuresti ns. kernel-funktion ja siihen liittyvien parametriarvojen valinnasta. Väitöskirjassa käytettiin seitsemää kirjallisuudesta entuudestaan tuttua kernel-funktiota ja suoritettiin laajat empiiriset tutkimukset sopivien parametriarvojen löytämiseksi. Näiden lisäksi useita erilaisia kuvista laskettuja piirrejoukkoja testattiin luokittelussa.
Väitöskirjassa saavutettujen tulosten perusteella tukivektorikone osoittautui erittäin hyväksi vaihtoehdoksi pohjaeläinten automaattiseen luokitteluun. Pienemmän aineiston kohdalla saavutettiin yli 97% luokittelutarkkuus ja suuremman aineiston kohdalla luokittelutarkkuus oli yli 80%. Saatujen tutkimustulosten perusteella voidaan sanoa, että pohjaeläinten automaattinen tunnistaminen on mahdollista toteuttaa vähintään yleisimpien taksonomisten ryhmien tapauksessa. Lisäksi ratkaisumallit tukivektorikonetta koskeviin teoreettisiin ongelmiin osoittautuivat menestyksekkäiksi ja niitä voidaan hyödyntää käytettäessä tukivektorikonetta luokittelutehtävissä, joissa on enemmän kuin kaksi luokkaa.
Pohjaeläimet ovat pieniä selkärangattomia eläimiä, jotka ovat riippuvaisia vedenalaisesta alustastaan jossain vaiheessa niiden elinkaarta. Pohjaeläinten hyödyntäminen vesistön tilan seurannassa on monivaiheinen prosessi. Ensimmäiseksi vesistöstä kerätään lukuisia näytteitä, joista pohjaeläimet erotellaan ja säilötään yksitellen. Toiseksi biologi tai lajintunnistukseen erikoistunut taksonomisti määrittää näytteistä saatujen pohjaeläinten lajit tai yleisesti ottaen niiden taksonomiset ryhmät yksitellen. Näytteistä saatujen lajitietojen ja muun analysoinnin perusteella pystytään selvittämään vesistön tilan muuttuminen pitkältä aikaväliltä. Prosessin työläimpiä vaiheita on pohjaeläinten tunnistaminen, jonka automatisointi säästäisi huomattavasti resursseja.
Väitöskirjassa keskitytään pohjaeläinten tunnistamiseen laskennallisin menetelmin, mikä on erittäin vähän tutkittu alue hahmontunnistuksen saralla. Pohjaeläinten laskennallinen tunnistaminen palautuu kuvien luokittelemiseen. Tutkimusaineistoina väitöskirjassa on käytetty kahta pohjaeläinkuva-aineistoa, joista ensimmäinen käsittää 1350 kuvaa yhteensä kahdeksasta taksonomisesta ryhmästä ja toinen kuvakokoelma pitää sisällään yli 4800 kuvaa yhteensä 50 pohjaeläinlajista. Väitöskirja koostuu viidestä artikkelista, joissa on sovellettu yhteensä 16:ta eri menetelmää pohjaeläinten tunnistamiseen. Käytetyistä menetelmistä 15 on kirjallisuudesta tuttuja ja väitöskirjassa esitetään yksi uusi luokittelumenetelmä. Erityinen painoarvo väitöskirjassa annetaan 1990-luvulla kehitetylle luokittelumenetelmälle nimeltään tukivektorikone.
Tukivektorikone on suunniteltu alun perin ainoastaan kahden luokan luokittelutehtäviin. Väitöskirjassa sovelletaan neljää tukivektorikoneelle kehitettyä moniluokkalaajennosta pohjaeläinluokitteluun ja kolmea näistä menetelmistä käytetään ensimmäistä kertaa pohjaeläinten luokittelussa. Lisäksi väitöskirjassa keskitytään tukivektorikoneen laajennuksissa esiintyviin teoreettisiin ongelmiin (tasapelitilanteet joissa uuden näytteen luokka ei ole yksikäsitteisesti määritetty ja luokkien jakamiseen optimaalisesti kahteen ryhmään) ja annetaan niihin uusia ratkaisumalleja. Käytettäessä tukivektorikonetta luokittelutehtävissä sen tehokkuus riippuu suuresti ns. kernel-funktion ja siihen liittyvien parametriarvojen valinnasta. Väitöskirjassa käytettiin seitsemää kirjallisuudesta entuudestaan tuttua kernel-funktiota ja suoritettiin laajat empiiriset tutkimukset sopivien parametriarvojen löytämiseksi. Näiden lisäksi useita erilaisia kuvista laskettuja piirrejoukkoja testattiin luokittelussa.
Väitöskirjassa saavutettujen tulosten perusteella tukivektorikone osoittautui erittäin hyväksi vaihtoehdoksi pohjaeläinten automaattiseen luokitteluun. Pienemmän aineiston kohdalla saavutettiin yli 97% luokittelutarkkuus ja suuremman aineiston kohdalla luokittelutarkkuus oli yli 80%. Saatujen tutkimustulosten perusteella voidaan sanoa, että pohjaeläinten automaattinen tunnistaminen on mahdollista toteuttaa vähintään yleisimpien taksonomisten ryhmien tapauksessa. Lisäksi ratkaisumallit tukivektorikonetta koskeviin teoreettisiin ongelmiin osoittautuivat menestyksekkäiksi ja niitä voidaan hyödyntää käytettäessä tukivektorikonetta luokittelutehtävissä, joissa on enemmän kuin kaksi luokkaa.
Kokoelmat
- Väitöskirjat [4850]