Geeniekspressioluokittimen toteutus Keras-kirjastolla
Pohja, Oskari (2018)
Pohja, Oskari
2018
Tietotekniikka
Tieto- ja sähkötekniikan tiedekunta - Faculty of Computing and Electrical Engineering
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2018-04-04
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tty-201803131349
https://urn.fi/URN:NBN:fi:tty-201803131349
Tiivistelmä
Konvolutiivisten neuroverkkojen sovellutuksien määrä on kasvussa muiden koneoppimismenetelmien tavoin. Tämä kandidaatintyö pyrkii tutkimaan konvolutiivisen neuroverkkoarkkitehtuurin toteutusta Python-kielisellä Keras-kirjastolla. Toteutettava neuroverkko toimii luokittimena geenien korkealle ja matalalle aktiivisuudelle histonimodikaatiodatasta. Toteuttu arkkitehtuuri pohjautuu jo tunnettuun DeepChrome-arkkitehtuuriin.
Työ jakatuu kolmeen osaan. Ensimmäinen osa tutkii työssä vaadittavaa teoreettista taustaa, esittellen luokittimen rakenteen osineen. Toinen osa tutkii luokittimen toteutusta Keras-kirjastolla, tutkien toteutuksen yksityiskohtia pohjautuen ensimmäisen osan teoreettiseen taustaan. Kolmas osa käsittelee luokittimen optimointia ja tulosten validointia, missä luokittimelle tehdään optimointi etsien sille parhaan suorituskyvyn toteuttavat parametrit käyttäen ristiinhakua ja -validointia.
Tutkimus osoittaa Keraksen soveltuvan DeepChrome-luokittimen toteutukseen, sekä tutkitun luokittimen olevan suorituskyvyltään vastaava kuin alkuperäinen Lua-kielinen DeepChrome-toteutus vastaavalla data-aineistoilla. Tutkimus vahvistaa alkuperäisen DeepChrome-toteutuksen parametrivalinnat optimaaliselle luokittimen suorituskyvylle.
Työ jakatuu kolmeen osaan. Ensimmäinen osa tutkii työssä vaadittavaa teoreettista taustaa, esittellen luokittimen rakenteen osineen. Toinen osa tutkii luokittimen toteutusta Keras-kirjastolla, tutkien toteutuksen yksityiskohtia pohjautuen ensimmäisen osan teoreettiseen taustaan. Kolmas osa käsittelee luokittimen optimointia ja tulosten validointia, missä luokittimelle tehdään optimointi etsien sille parhaan suorituskyvyn toteuttavat parametrit käyttäen ristiinhakua ja -validointia.
Tutkimus osoittaa Keraksen soveltuvan DeepChrome-luokittimen toteutukseen, sekä tutkitun luokittimen olevan suorituskyvyltään vastaava kuin alkuperäinen Lua-kielinen DeepChrome-toteutus vastaavalla data-aineistoilla. Tutkimus vahvistaa alkuperäisen DeepChrome-toteutuksen parametrivalinnat optimaaliselle luokittimen suorituskyvylle.
Kokoelmat
- Kandidaatintutkielmat [8918]