Rubikin kuution ratkaiseminen vahvistavan koneoppimisen avulla
Tohni, Patrik (2019)
Tohni, Patrik
2019
Teknis-luonnontieteellinen
Tekniikan ja luonnontieteiden tiedekunta - Faculty of Engineering and Natural Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2019-03-07
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tty-201903081287
https://urn.fi/URN:NBN:fi:tty-201903081287
Tiivistelmä
Tässä työssä tutkittiin vahvistavalla oppimisella koulutetun tiheän neuroverkon kykyä oppia ratkaisemaan Rubikin kuutio -pulmalelu. Kuutiolle rakennettiin matemaattinen malli, jonka perusteella koodattiin kuutiota simuloiva ympäristö koneoppiagentin käytettäväksi. Työssä selvitettiin agentin pohjana olevan deep Q-learning -neuroverkkotekniikan toimintaperiaatteita ja parametrejä. Lisäksi tutkittiin muita oppimiseen vaikuttavia tekniikoita: one hot encoding, replay memory ja monimutkaisuuden vaiheittainen lisääminen. Toteutettu agentti saavutti tavoitteensa, joka oli kolmella liikkeellä sekoitetun kuution ratkaiseminen.
Kokoelmat
- Kandidaatintutkielmat [8314]