Neuroverkkopohjaisten asiakaspoistumamallien selittäminen päätöksenteon tueksi
Paukkeri, Sara-Päivi (2022)
Paukkeri, Sara-Päivi
2022
Tietojohtamisen DI-ohjelma - Master's Programme in Information and Knowledge Management
Johtamisen ja talouden tiedekunta - Faculty of Management and Business
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2022-12-12
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-202211218490
https://urn.fi/URN:NBN:fi:tuni-202211218490
Tiivistelmä
Organisaation asiakaskannan kokoon voidaan vaikuttaa joko uusasiakashankinnalla tai pyrkimällä vähentämään aktiivista asiakaspoistumaa, ja näistä kahdesta uuden asiakkaan hankinta on monta kertaa kalliimpaa. Asiakaspoistuman ennustamisessa neuroverkko on koneoppimismalli, joka pystyy sekä yleistämään hyvin oppimaansa että hyödyntämään suuria datamassoja. Ihmisen on kuitenkin usein mahdoton ymmärtää sen toimintaa. Organisaatiossa voi siten olla hankala luottaa neuroverkkopohjaisen asiakaspoistumamallin tuloksiin, vaikka luottamus on tiedon hyödynnettävyyden kannalta olennaista. Tässä diplomityössä tutkitaan, kuinka vakuutusalan asiakaspoistumaan liittyvää päätöksentekoa voidaan kehittää selittämällä neuroverkkopohjaisen asiakaspoistumamallin toimintaa yksinkertaisemman mallin avulla. Työhön liittyy niin asiakaspoistumaennusteen tarkentuminen ja asiakkaasta saatavan tiedon lisääntyminen neuroverkkoa selitettäessä kuin käytetyn mallin hyödyt verrattuna kohdeorganisaation aikaisempiin malleihin.
Työn aluksi organisaation nykytilaan ja liiketoimintaympäristöön perehdytään haastattelemalla organisaation asiantuntijoita. Neuroverkkopohjaisen asiakaspoistumamallin toimintaa selitetään LIME- ja SHAP-menetelmillä niin paikallisesti kuin koko mallin laajuisestikin. Saatuja tuloksia verrataan sekä selittäjien välisesti että aikaisempaan tutkimustietoon ja organisaation olemassa oleviin analyyseihin tukeutuen. Työn aikana havainnoista keskustellaan myös kohdeorganisaation asiantuntijoiden kanssa. Selittäminen perustuu samaan dataan, jolla myös neuroverkko on opetettu, validoitu ja testattu. Käytetty data koostuu pääosin kohdeorganisaation omasta asiakasdatasta.
Tutkimuksen tulosten perusteella neuroverkkopohjaista asiakaspoistumamallia selittämällä voidaan luoda luottamusta mallin toimintaa kohtaan. Lisäksi saadaan paljon eritasoista tietoa asiakkaiden käyttäytymisestä. Korkean tason tietoon sisältyy koko asiakaskantaa koskevat analyysit, joissa voidaan tutkia eri piirteiden merkityksiä asiakaspoistumassa ja niiden vaikutusten suuntia. Analyysia voidaan myös tarkentaa vertailemalla erilaisia asiakasryhmiä ja niiden käyttäytymistä keskenään. Tarkennusta voidaan tehdä jopa yksittäisen asiakkaan yksittäiseen piirteeseen asti. Mallia selittämällä voidaan siis tutkia, miten erilaisten piirteiden muutokset vaikuttavat asiakasryhmiin, ja tämän tiedon pohjalta voidaan esimerkiksi kohdentaa tai personoida markkinointia. Lisäksi on mahdollista tarkastella, miten organisaation erilaiset mittarit tai käytänteet vaikuttavat asiakaspoistumaan eri asiakasryhmillä.
Tämän työn tulokset vastaavat yhteneväisiltä osiltaan hyvin aikaisempaa tutkimusta ja kohdeorganisaation analyyseja. Kohdeorganisaation aikaisempiin malleihin verrattuna käytetty ennustemalli on yksityiskohtaisempi ja monipuolisempi. Selittäjistä SHAP toimii käytetylle datalle paremmin kuin LIME, minkä katsotaan johtuvan piirteistä, joissa on vain vähän nollasta poikkeavia arvoja. Kaiken kaikkiaan tutkimus tuo vakuutusalan asiakaspoistuman tutkimuskenttään uutta tietoa, sillä syväoppivia neuroverkkoja hyödyntäviä asiakaspoistumamalleja ei ole juurikaan tutkittu, puhumattakaan koneoppimismallia selittämällä saatavasta tiedosta ja sen hyödyntämisestä liiketoiminnassa. Tutkimus herättää myös monia uusia kysymyksiä jatkotutkimusaiheiksi.
Työn aluksi organisaation nykytilaan ja liiketoimintaympäristöön perehdytään haastattelemalla organisaation asiantuntijoita. Neuroverkkopohjaisen asiakaspoistumamallin toimintaa selitetään LIME- ja SHAP-menetelmillä niin paikallisesti kuin koko mallin laajuisestikin. Saatuja tuloksia verrataan sekä selittäjien välisesti että aikaisempaan tutkimustietoon ja organisaation olemassa oleviin analyyseihin tukeutuen. Työn aikana havainnoista keskustellaan myös kohdeorganisaation asiantuntijoiden kanssa. Selittäminen perustuu samaan dataan, jolla myös neuroverkko on opetettu, validoitu ja testattu. Käytetty data koostuu pääosin kohdeorganisaation omasta asiakasdatasta.
Tutkimuksen tulosten perusteella neuroverkkopohjaista asiakaspoistumamallia selittämällä voidaan luoda luottamusta mallin toimintaa kohtaan. Lisäksi saadaan paljon eritasoista tietoa asiakkaiden käyttäytymisestä. Korkean tason tietoon sisältyy koko asiakaskantaa koskevat analyysit, joissa voidaan tutkia eri piirteiden merkityksiä asiakaspoistumassa ja niiden vaikutusten suuntia. Analyysia voidaan myös tarkentaa vertailemalla erilaisia asiakasryhmiä ja niiden käyttäytymistä keskenään. Tarkennusta voidaan tehdä jopa yksittäisen asiakkaan yksittäiseen piirteeseen asti. Mallia selittämällä voidaan siis tutkia, miten erilaisten piirteiden muutokset vaikuttavat asiakasryhmiin, ja tämän tiedon pohjalta voidaan esimerkiksi kohdentaa tai personoida markkinointia. Lisäksi on mahdollista tarkastella, miten organisaation erilaiset mittarit tai käytänteet vaikuttavat asiakaspoistumaan eri asiakasryhmillä.
Tämän työn tulokset vastaavat yhteneväisiltä osiltaan hyvin aikaisempaa tutkimusta ja kohdeorganisaation analyyseja. Kohdeorganisaation aikaisempiin malleihin verrattuna käytetty ennustemalli on yksityiskohtaisempi ja monipuolisempi. Selittäjistä SHAP toimii käytetylle datalle paremmin kuin LIME, minkä katsotaan johtuvan piirteistä, joissa on vain vähän nollasta poikkeavia arvoja. Kaiken kaikkiaan tutkimus tuo vakuutusalan asiakaspoistuman tutkimuskenttään uutta tietoa, sillä syväoppivia neuroverkkoja hyödyntäviä asiakaspoistumamalleja ei ole juurikaan tutkittu, puhumattakaan koneoppimismallia selittämällä saatavasta tiedosta ja sen hyödyntämisestä liiketoiminnassa. Tutkimus herättää myös monia uusia kysymyksiä jatkotutkimusaiheiksi.