Tiedonlouhintaprosessimalli pienten ja keskisuurten yritysten tarpeisiin : Case-tutkimus asiakassegmentoinnista K-Means klusterointia käyttäen
Saarimäki, Jenna (2024)
Saarimäki, Jenna
2024
Tietojohtamisen DI-ohjelma - Master's Programme in Information and Knowledge Management
Johtamisen ja talouden tiedekunta - Faculty of Management and Business
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2024-04-11
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-202403182948
https://urn.fi/URN:NBN:fi:tuni-202403182948
Tiivistelmä
Suuret yritykset ovat jo vuosia keränneet asiakkaistaan erilaista dataa ja käyttäneet dataa muun muassa asiakasklustereiden muodostamiseen. Yhä enenevissä määrin myös pienet ja keskisuuret yritykset (pk-yritykset) pyrkivät pysymään tiukassa kilpailussa mukana hyödyntämällä asiakkaista kerättyä dataa. Kerättyä dataa hyödynnetään erilaisissa tiedonlouhintaprosesseissa, joiden lopputuloksena yrityksellä on uudenlaista tietoa päätöksenteon tukena.
Yleinen tiedonlouhintaprosessi on asiakasklustereiden muodostaminen, jossa datan perusteella yritys voi tunnistaa asiakasryhmiä esimerkiksi demografisten tekijöiden tai asiakkaan kannattavuuden mukaan.
Tiedonlouhintaprosesseja varten on kehitetty useita tiedonlouhintaprosessimalleja (esim. CRISP-DM), joissa kuvataan prosessin tärkeimmät vaiheet. Näitä prosessimalleja on kuitenkin kehitetty ja käytetty paljon suurten yritysten kontekstissa, jolloin pienempien yrityksien erikoistarpeet ovat saattaneet jäädä huomioimatta. Tässä tutkimuksessa toteutetaan case-luontoisesti tiedonlouhintaprosessi pk-yritykselle, ja pyritään havaitse-maan, millaisia piirteitä pk-yritysten asiakasklusterointiprosessissa on.
Asiakasklusterointia päätettiin tehdä demografisten ominaisuuksien (sukupuoli, ikä) ja asiakkaan arvon perusteella. Asiakkaan arvon määrittämisessä käytettiin RFM-analyysia, jossa jokaista asiakasta kohti lasketaan kolme tunnuslukua: milloin asiakas on viimeksi tehnyt ostoksen, kuinka monta kertaa asiakas on ostanut yritykseltä ja kuin-ka suurella summalla asiakas on ostanut yritykseltä. Tiedonlouhintaprosessimallina päätettiin käyttää CRISP-DM-mallia, sillä se on laajasti käytössä ja tarjoaa hyvän pohjan prosessille. Klusterointitekniikaksi valittiin K-Means -klusterointi.
Tutkimuksessa havaittiin, että CRISP-DM:n tarjoamat prosessivaiheet toimivat pääosin hyvin pk-yritysten tarpeisiin. Prosessimalliin voisi kuitenkin lisätä yhden esivaiheen, jossa varmistetaan, että pk-yrityksellä on mahdollisuudet tiedonlouhintaprosessin toteuttamiseen. Pk-yrityksen tulisi muun muassa pohtia, onko toteuttava tiedonlouhinta-prosessi sille aidosti hyödyllinen, onko tarvittava data olemassa ja saatavilla, sekä onko sillä tarvittavat resurssit prosessin tekemiseen.
Yleinen tiedonlouhintaprosessi on asiakasklustereiden muodostaminen, jossa datan perusteella yritys voi tunnistaa asiakasryhmiä esimerkiksi demografisten tekijöiden tai asiakkaan kannattavuuden mukaan.
Tiedonlouhintaprosesseja varten on kehitetty useita tiedonlouhintaprosessimalleja (esim. CRISP-DM), joissa kuvataan prosessin tärkeimmät vaiheet. Näitä prosessimalleja on kuitenkin kehitetty ja käytetty paljon suurten yritysten kontekstissa, jolloin pienempien yrityksien erikoistarpeet ovat saattaneet jäädä huomioimatta. Tässä tutkimuksessa toteutetaan case-luontoisesti tiedonlouhintaprosessi pk-yritykselle, ja pyritään havaitse-maan, millaisia piirteitä pk-yritysten asiakasklusterointiprosessissa on.
Asiakasklusterointia päätettiin tehdä demografisten ominaisuuksien (sukupuoli, ikä) ja asiakkaan arvon perusteella. Asiakkaan arvon määrittämisessä käytettiin RFM-analyysia, jossa jokaista asiakasta kohti lasketaan kolme tunnuslukua: milloin asiakas on viimeksi tehnyt ostoksen, kuinka monta kertaa asiakas on ostanut yritykseltä ja kuin-ka suurella summalla asiakas on ostanut yritykseltä. Tiedonlouhintaprosessimallina päätettiin käyttää CRISP-DM-mallia, sillä se on laajasti käytössä ja tarjoaa hyvän pohjan prosessille. Klusterointitekniikaksi valittiin K-Means -klusterointi.
Tutkimuksessa havaittiin, että CRISP-DM:n tarjoamat prosessivaiheet toimivat pääosin hyvin pk-yritysten tarpeisiin. Prosessimalliin voisi kuitenkin lisätä yhden esivaiheen, jossa varmistetaan, että pk-yrityksellä on mahdollisuudet tiedonlouhintaprosessin toteuttamiseen. Pk-yrityksen tulisi muun muassa pohtia, onko toteuttava tiedonlouhinta-prosessi sille aidosti hyödyllinen, onko tarvittava data olemassa ja saatavilla, sekä onko sillä tarvittavat resurssit prosessin tekemiseen.