Urheiluotteluiden tulosten ennustaminen koneoppimisella
Mäkinen, Tuomas (2024)
Mäkinen, Tuomas
2024
Tieto- ja sähkötekniikan kandidaattiohjelma - Bachelor's Programme in Computing and Electrical Engineering
Informaatioteknologian ja viestinnän tiedekunta - Faculty of Information Technology and Communication Sciences
Hyväksymispäivämäärä
2024-12-08
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-2024121611256
https://urn.fi/URN:NBN:fi:tuni-2024121611256
Tiivistelmä
Urheiluotteluista kerätään suuria määriä dataa, jota voidaan hyödyntää koneoppimisen avulla. Koneoppimista voidaan soveltaa urheilussa monin eri tavoin, kuten loukkaantumisten ennustamiseen, tärkeiden suorituskyvyn attribuuttien tunnistamiseen sekä tulosten ennustamiseen, johon tämä työ keskittyy. Verkossa tapahtuvan vedonlyönnin kasvun myötä kiinnostus tulosten ennustamiseen on lisääntynyt.
Tämän työn tavoitteena on tutkia urheiluotteluiden tulosten ennustamista yleisten koneoppimismallien näkökulmasta. Tulosten ennustaminen on tyypillisesti binäärinen luokittelutehtävä, ellei lajissa ole tasapelin mahdollisuutta. Ennustamisessa keskeisiä osa-alueita ovat piirteiden keräys ja -valinta, sopivan koneoppimismallin valinta sekä mallin testaus.
Piirteiden valinta -algoritmien avulla parannettiin ennustustarkkuutta. Yleisten koneoppimismallien suoriutumisen vertailu on haastavaa, koska suorituskyky riippuu lajista ja tutkimuksessa käytetystä datasta. Mallien testauksessa data jaetaan opetus- ja testiaineistoon, yleensä k-ristinvalidoinnin tai segmentoinnin avulla. Ennustetarkkuus osoittautuu sopivaksi suorituskykymittariksi tulosten ennustamisessa.
Tämän työn tavoitteena on tutkia urheiluotteluiden tulosten ennustamista yleisten koneoppimismallien näkökulmasta. Tulosten ennustaminen on tyypillisesti binäärinen luokittelutehtävä, ellei lajissa ole tasapelin mahdollisuutta. Ennustamisessa keskeisiä osa-alueita ovat piirteiden keräys ja -valinta, sopivan koneoppimismallin valinta sekä mallin testaus.
Piirteiden valinta -algoritmien avulla parannettiin ennustustarkkuutta. Yleisten koneoppimismallien suoriutumisen vertailu on haastavaa, koska suorituskyky riippuu lajista ja tutkimuksessa käytetystä datasta. Mallien testauksessa data jaetaan opetus- ja testiaineistoon, yleensä k-ristinvalidoinnin tai segmentoinnin avulla. Ennustetarkkuus osoittautuu sopivaksi suorituskykymittariksi tulosten ennustamisessa.
Kokoelmat
- Kandidaatintutkielmat [8918]