Vahvistusoppimisen metodit ja sovellutukset robotiikassa
Pollari, Väinö (2022)
Pollari, Väinö
2022
Teknisten tieteiden kandidaattiohjelma - Bachelor's Programme in Engineering Sciences
Tekniikan ja luonnontieteiden tiedekunta - Faculty of Engineering and Natural Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2022-10-04
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-202209267263
https://urn.fi/URN:NBN:fi:tuni-202209267263
Tiivistelmä
Vahvistusoppiminen on nopeasti kehittyvä koneoppimisen ratkaisutekniikka, jonka suosio on kasvanut viime vuosina. Tekniikan suosio perustuu pääasiassa siihen, että se mahdollistaa agentin itsenäisen oppimisen ja ongelmanratkaisun sekä inhimillisen yritys-erehdys oppimiskaavan kaltaisen prosessin. Vahvistusoppimisen suurena vahvuutena on, että sen avul la pystytään ratkaisemaan erityisesti robotiikan alalla sellaisia ongelmia, joihin muut koneoppi misen metodit eivät välttämättä pysty. Robotiikkaan vahvistusoppimisen metodeista soveltuvat parhaiten politiikkahakumetodit, arvofunktiometodit ja toimija-kriitikko -metodit.
Tämän kandidaatintyön pääasiallinen tavoite on kirjallisuuskatsauksen avulla luoda silmäys vahvistusoppimisen metodeihin ja joihinkin sen sovellutuksiin. Työssä käydään läpi vahvistus oppimisen pääpiirteet ja taustoitetaan lyhyesti sen lähtökohtia osana koneoppimista.
Vahvistusoppimisessa keskeisin huomio on siinä, miten ihmisten ja eläinkunnan hallitsemat oppimismekanismit ja ongelmanratkaisutaidot voidaan siirtää robotin hallittavaksi. Perinteisesti näitä taitoja on pidetty inhimillisinä voimavaroina, joten niiden tuominen myös osaksi tekniikan maailmaa ja järjestelmiä tuo samalla täysin uusia mahdollisuuksia ja haasteita mukanaan.
Vahvistusoppimisen lukuisista sovellutuksista esittelen työssäni kaksi, mobiilirobotiikan ja työkonesovellukset. Olen valinnut käsitellä nimenomaan näitä kahta, koska niistä on saatavilla eniten tutkimustietoa ja esimerkkejä ja ne ovat siten ainakin toistaiseksi käytetyimpiä alan sovel lutuksista. Mobiilirobotiikassa vahvistusoppimista käytetään erityisesti mobiilirobotin navigointiin liittyvien ongelmien ratkaisuun ja työkonesovellutuksissa työkoneen turvallisuuden ja tuottavuu den edistämiseen. Esimerkkinä jälkimmäisestä on muun muassa robottikouran tarttuminen ja otteen kehittäminen.
Työssäni olen joutunut tekemään rajauksia sen suhteen, mitä osa-alueita otan huomioon. Vahvistusoppiminen on aihealueena niin laaja ja monelle eri alalle ulottuva tekniikka, että sen täydellinen käsittely kandidaatintyön puitteissa ei ole mahdollista. Olen kuitenkin pyrkinyt perus telemaan ratkaisuni alan muiden tutkimusten avulla ja käsittelemään työssäni vahvistusoppimis ta mahdollisimman kattavasti.
Tämän kandidaatintyön pääasiallinen tavoite on kirjallisuuskatsauksen avulla luoda silmäys vahvistusoppimisen metodeihin ja joihinkin sen sovellutuksiin. Työssä käydään läpi vahvistus oppimisen pääpiirteet ja taustoitetaan lyhyesti sen lähtökohtia osana koneoppimista.
Vahvistusoppimisessa keskeisin huomio on siinä, miten ihmisten ja eläinkunnan hallitsemat oppimismekanismit ja ongelmanratkaisutaidot voidaan siirtää robotin hallittavaksi. Perinteisesti näitä taitoja on pidetty inhimillisinä voimavaroina, joten niiden tuominen myös osaksi tekniikan maailmaa ja järjestelmiä tuo samalla täysin uusia mahdollisuuksia ja haasteita mukanaan.
Vahvistusoppimisen lukuisista sovellutuksista esittelen työssäni kaksi, mobiilirobotiikan ja työkonesovellukset. Olen valinnut käsitellä nimenomaan näitä kahta, koska niistä on saatavilla eniten tutkimustietoa ja esimerkkejä ja ne ovat siten ainakin toistaiseksi käytetyimpiä alan sovel lutuksista. Mobiilirobotiikassa vahvistusoppimista käytetään erityisesti mobiilirobotin navigointiin liittyvien ongelmien ratkaisuun ja työkonesovellutuksissa työkoneen turvallisuuden ja tuottavuu den edistämiseen. Esimerkkinä jälkimmäisestä on muun muassa robottikouran tarttuminen ja otteen kehittäminen.
Työssäni olen joutunut tekemään rajauksia sen suhteen, mitä osa-alueita otan huomioon. Vahvistusoppiminen on aihealueena niin laaja ja monelle eri alalle ulottuva tekniikka, että sen täydellinen käsittely kandidaatintyön puitteissa ei ole mahdollista. Olen kuitenkin pyrkinyt perus telemaan ratkaisuni alan muiden tutkimusten avulla ja käsittelemään työssäni vahvistusoppimis ta mahdollisimman kattavasti.
Kokoelmat
- Kandidaatintutkielmat [8798]