Katsaus koneoppimiseen : Koneoppimismallin kehitysprosessi
Grönberg, Toni (2023)
Grönberg, Toni
2023
Tietojenkäsittelytieteiden kandidaattiohjelma - Bachelor's Programme in Computer Sciences
Informaatioteknologian ja viestinnän tiedekunta - Faculty of Information Technology and Communication Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2023-05-23
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-202305035059
https://urn.fi/URN:NBN:fi:tuni-202305035059
Tiivistelmä
Koneoppimismallin kehittämisen tavoitteena on rakentaa matemaattinen malli, joka kykenee edistykselliseen ongelmanratkaisuun ja pystyy tekemään tarkkoja päätelmiä uuden tai tuntemattoman datan perusteella. Tässä tutkielmassa esitellään koneoppimismallin kehitysprosessin eri vaiheet datan siivoamisesta mallin arviointiin. Tutkielman tavoitteena on tutustua koneoppimismalli kehitysprosessiin ja selvittää, kuinka koneoppimismalli koulutetaan.
Työ on kirjallisuuskatsaus, joka jakautuu kahteen osaan. Ensimmäisessä osassa esitellään tutkielman kannalta oleellisia koneoppimisen algoritmeja, sekä koneoppimismallin eri tyyppejä. Osan tarkoitus on esitellä tyypit, joihin koneoppimismallit yleisimmin jaotellaan, sekä tarkastella koneoppimismallien tunnetuimpia algoritmeja. Koneoppimismallit voidaan jaotella tyyppeihin monella eri tapaa, mutta yleisimmin mallit jaotellaan käytettävän datajoukon perusteella. Koneoppimisalgoritmit voidaan koneoppimismallin tapaa jaotella eri tyyppeihin tai luokkiin. Näistä luokista tarkastellaan tarkemmin tapausperustaisia algoritmeja. Tutkielman toisessa osassa perehdytään itse koneoppimismallin kehittämisen vaiheisiin suoraviivaisessa järjestyksessä.
Koneoppimismallin kehittäminen on monivaiheinen prosessi, jonka jokainen vaihe vaikuttaa lopullisen mallin tarkkuuteen ja tehokkuuteen. Tutkielmassa koneoppimismallin kehitysprosessi jaotellaan datan valmisteluun, mallin valintaan ja kouluttamiseen, sekä koulutetun mallin arviointiin ja optimointiin. Datanjoukon keruuta tutkielmassa ei käsitellä. Kerätty raaka datajoukko ei suoraan sovi käytettäväksi koneoppimismallia kouluttaessa, vaan raaka data tulee valmistella. Malli, jonka kouluttamiseen käytetään raakaa, jäsentämätöntä, tai muuten huonokuntoista dataa ei pysty tekemään tarkkoja päätelmiä, ja malli, joka käyttää datan ja ongelman tyypille sopimattomia algoritmeja, voi johtaa pitkiin prosessointi aikoihin ja resurssien tuhlaukseen. Työn lopussa on lyhyt yhteenveto koneoppimismallin kehitysprosessista
Työ on kirjallisuuskatsaus, joka jakautuu kahteen osaan. Ensimmäisessä osassa esitellään tutkielman kannalta oleellisia koneoppimisen algoritmeja, sekä koneoppimismallin eri tyyppejä. Osan tarkoitus on esitellä tyypit, joihin koneoppimismallit yleisimmin jaotellaan, sekä tarkastella koneoppimismallien tunnetuimpia algoritmeja. Koneoppimismallit voidaan jaotella tyyppeihin monella eri tapaa, mutta yleisimmin mallit jaotellaan käytettävän datajoukon perusteella. Koneoppimisalgoritmit voidaan koneoppimismallin tapaa jaotella eri tyyppeihin tai luokkiin. Näistä luokista tarkastellaan tarkemmin tapausperustaisia algoritmeja. Tutkielman toisessa osassa perehdytään itse koneoppimismallin kehittämisen vaiheisiin suoraviivaisessa järjestyksessä.
Koneoppimismallin kehittäminen on monivaiheinen prosessi, jonka jokainen vaihe vaikuttaa lopullisen mallin tarkkuuteen ja tehokkuuteen. Tutkielmassa koneoppimismallin kehitysprosessi jaotellaan datan valmisteluun, mallin valintaan ja kouluttamiseen, sekä koulutetun mallin arviointiin ja optimointiin. Datanjoukon keruuta tutkielmassa ei käsitellä. Kerätty raaka datajoukko ei suoraan sovi käytettäväksi koneoppimismallia kouluttaessa, vaan raaka data tulee valmistella. Malli, jonka kouluttamiseen käytetään raakaa, jäsentämätöntä, tai muuten huonokuntoista dataa ei pysty tekemään tarkkoja päätelmiä, ja malli, joka käyttää datan ja ongelman tyypille sopimattomia algoritmeja, voi johtaa pitkiin prosessointi aikoihin ja resurssien tuhlaukseen. Työn lopussa on lyhyt yhteenveto koneoppimismallin kehitysprosessista
Kokoelmat
- Kandidaatintutkielmat [8800]