Käyttäjätyytyväisyyden ennustaminen tekstimuotoisista arvosteluista
Hämäläinen, Lassi (2018)
Hämäläinen, Lassi
2018
Tietotekniikka
Informaatioteknologian ja viestinnän tiedekunta - Faculty of Information Technology and Communication Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2019-05-18
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tty-201810032345
https://urn.fi/URN:NBN:fi:tty-201810032345
Tiivistelmä
Tässä työssä hyödynnetään piirteenirrotus- ja luokittelumenetelmiä ja testataan niiden toimivuutta käyttäjätyytyväisyyden arviointiin tekstimuotoisesta aineistosta. Piirteiden irrottamiseen tekstistä käytetään TF-IDF-algoritmia, jonka antamat piirteet syötetään vertailtaville koneoppimismenetelmille. Käytettävät koneoppimismenetelmät ovat satunnainen metsä ja tukivektorikone, josta käytetään lineaarista ja radiaalista kerneliä käyttäviä toteutuksia. Koneoppimismenetelmistä vertaillaan sekä luokitteluun että regressioon perustuvia versioita menetelmistä. Valitut menetelmät ovat alan julkaisujen perusteella yleisesti käytössä tekstin merkityksen ja sävyn analysointiin liittyvissä ongelmissa.
Algoritmien esittelyn lisäksi käydään läpi aineiston käsittelystä alkaen koko aiheeseen liittyvä koneoppimisprosessi. Työssä esitellään algoritmien testauksen tulokset ja arvioidaan niiden pohjalta käytettyjen menetelmien soveltuvuutta käyttäjätyytyväisyyden ennustamiseen tekstimuotoisten arvostelujen pohjalta.
Algoritmien esittelyn lisäksi käydään läpi aineiston käsittelystä alkaen koko aiheeseen liittyvä koneoppimisprosessi. Työssä esitellään algoritmien testauksen tulokset ja arvioidaan niiden pohjalta käytettyjen menetelmien soveltuvuutta käyttäjätyytyväisyyden ennustamiseen tekstimuotoisten arvostelujen pohjalta.
Kokoelmat
- Kandidaatintutkielmat [8253]