Tiedonlouhinta opintojen ohjauksen ja suunnittelun apuna
Raerinne, Enna (2020)
Raerinne, Enna
2020
Tietojenkäsittelyopin maisteriohjelma - Master's Programme in Computer Science
Informaatioteknologian ja viestinnän tiedekunta - Faculty of Information Technology and Communication Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2020-05-19
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-202005155379
https://urn.fi/URN:NBN:fi:tuni-202005155379
Tiivistelmä
Korkeakouluilla on nykyään kiinnostusta hyödyntää toiminnoistaan muodostuvaa dataa näiden toimintojensa, kuten opetuksen, kehittämiseen tiedonlouhinnan avulla. Tässä tutkielmassa tehtiin katsaus tutkimuksiin tiedonlouhinnan käytöstä koulutusympäristössä ja havaittiin, ettei näissä tutkimuksissa ollut juurikaan hyödynnetty tiedonlouhintamenetelmiä opiskelijoiden opintoihin kiinnittymisen tutkimiseen. Myös opiskelijan koko opintopolkuun liittyvää tutkimusta tiedonlouhintaa hyödyntäen oli tehty vähemmän kuin yksittäisiin kursseihin liittyvää tutkimusta. Tässä työssä myös tutkittiin tiedonlouhinnan avulla opiskelijoiden kiinnittymistä opintoihinsa ja kurssien suosittelua opiskelijoille heidän ensimmäisenä lukuvuotenaan. Opiskelijoiden kiinnittymistä opintoihinsa selvitettiin jakamalla opiskelijat sopiviin, todellisuutta vastaaviin opiskelijaryhmiin klusteroinnin avulla heidän suoritustensa perusteella. Klusteroinnissa kokeiltiin kolmea klusterointimenetelmää, K-means ja EM-algoritmeja sekä hierarkkista klusterointia. Opintoihin kiinnittymistä tutkittiin myös assosiaatioanalyysin avulla etsimällä suosittuja kurssihahmoja opiskelijoiden ensimmäisen lukuvuoden suorituksista Apriori-algoritmilla. Kurssien suosittelua kokeiltiin luokittelupohjaisella menetelmällä, jossa käytettiin C4.5-päätöspuualgoritmia, ja klusteroinnin ja assosiaatioanalyysin yhdistelmällä, jossa oli käytössä K-means ja FP-growth -algoritmit. Louhinta tehtiin tiedonlouhintatyökaluilla Orange ja Weka.
Louhinnan tuloksista kävi ilmi, että klusteroimalla opiskelijat heidän suoritustensa perusteella saadaan esiin opiskelijaryhmiä, joista voidaan havainnoida opintoihin kiinnittymistä. Parhaiten eri opiskelijaryhmiä pystyi tarkastelemaan Orangessa hierarkkisella klusteroinnilla. Kurssihahmoista pystyttiin myös tarkastelemaan opintoihin kiinnittymistä ja vertailemaan erilaisista lähtökohdista aloittavien opiskelijoiden suorituksia. Opiskelijoiden ensimmäisen lukuvuoden suoritukset eivät riitä kurssien suosittelun perusteelliseen tutkimiseen, vaan dataa tarvittaisiin enemmän, mutta eri louhintamenetelmiä pystyttiin silti testaamaan. Tässä työssä tutkitut tiedonlouhintamenetelmät soveltuvat myös myöhempien opiskeluvuosien suoritusten analysointiin.
Louhinnan tuloksista kävi ilmi, että klusteroimalla opiskelijat heidän suoritustensa perusteella saadaan esiin opiskelijaryhmiä, joista voidaan havainnoida opintoihin kiinnittymistä. Parhaiten eri opiskelijaryhmiä pystyi tarkastelemaan Orangessa hierarkkisella klusteroinnilla. Kurssihahmoista pystyttiin myös tarkastelemaan opintoihin kiinnittymistä ja vertailemaan erilaisista lähtökohdista aloittavien opiskelijoiden suorituksia. Opiskelijoiden ensimmäisen lukuvuoden suoritukset eivät riitä kurssien suosittelun perusteelliseen tutkimiseen, vaan dataa tarvittaisiin enemmän, mutta eri louhintamenetelmiä pystyttiin silti testaamaan. Tässä työssä tutkitut tiedonlouhintamenetelmät soveltuvat myös myöhempien opiskeluvuosien suoritusten analysointiin.