Asuntolainapäätösten tutkiminen logistisella regressiolla
Kuoppala, Elias (2024)
Kuoppala, Elias
2024
Tekniikan ja luonnontieteiden kandidaattiohjelma - Bachelor's Programme in Engineering and Natural Sciences
Tekniikan ja luonnontieteiden tiedekunta - Faculty of Engineering and Natural Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2024-05-17
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-202405025143
https://urn.fi/URN:NBN:fi:tuni-202405025143
Tiivistelmä
Tässä kandidaatintyössä sovelletaan logistista regressiota osana asuntolainapäätösprosessia. Tarkoituksena on selvittää, mitkä tekijät vaikuttavat lainapäätöksiin kaikista eniten. Työn soveltavassa osassa sovitetaan kaksi logistista regressiomallia asuntolainanhakemuspäätöksiä koskevaan aineistoon. Luotujen mallien avulla pyritään myös automatisoimaan lainahakemuspäätöksiä. Tämä on digitalisaation ja kasvavan volyymin johdosta erittäin olennaista. Pankkien on pyrittävä nopeaan ja kustannustehokkaaseen päätöksentekoon, jotta potentiaaliset lainanhakijat saataisiin omiksi asiakkaiksi.
Teoriaosuudessa käsitellään regressioanalyysia, eli matemaattista keinoa riippuvuuksien tutkimiseen vastemuuttujan ja selittäjien välillä. Ensimmäisenä käsitellään lineaarinen regressio, joka toimii regressioanalyysin pohjana. Lainapäätösprosessissa käytetään kuitenkin usein kategorisia muuttujia, kuten 'Kyllä' tai 'Ei' -vastauksia, jolloin mallin luomiseen ja tulkintaan tarvitaan logistista regressiota. Logistisen regression teoriaan liittyen käsitellään logit-muunnos ja sen mukanaan tuomat mahdollisuudet. Mallin parametrien estimointia varten esitellään suurimman uskottavuuden estimointi. Työssä käsitellään myös mallin valintaa varten eteenpäin- ja poistovalinta, sekä näitä yhdistelevä askeltava menetelmä. Luotujen mallien hyvyyttä arvioidaan Hosmer—Lemshow-testin avulla ja erottelukykyä testataan Receiver Operating Characteristic (ROC) -käyriä, sekä Area Under the Curve (AUC) -arvoja käyttäen.
Työssä saadut tulokset perustuvat pitkälti tilastolliseen merkitsevyyteen, sekä ainoastaan yhteen aineistoon. Tämän takia niihin tulisi suhtautua varauksella ja harkiten. Tästä huolimatta saadut keskeisimmät tulokset ovat yhteneviä aiheesta tehdyn aiemman tutkimuksen kanssa. Kummankin työssä luodun mallin, sekä tutkittujen korrelaatioiden perusteella hakijan luottohistorialla on selkeästi suurin merkitys lainapäätöksen kannalta. Muita merkittäväksi havaittuja tekijöitä ovat asunnon sijainti, jota varten lainaa haetaan, sekä se, onko hakija avioliitossa. Etenkin luottohistorian merkitys korostui myös muissa aiheesta tehdyissä tutkimuksissa. Luotujen mallien erottelukyvyt ovat kohtuullisia, mutta ne täytyisi testata vielä ulkopuolisella aineistolla.
Teoriaosuudessa käsitellään regressioanalyysia, eli matemaattista keinoa riippuvuuksien tutkimiseen vastemuuttujan ja selittäjien välillä. Ensimmäisenä käsitellään lineaarinen regressio, joka toimii regressioanalyysin pohjana. Lainapäätösprosessissa käytetään kuitenkin usein kategorisia muuttujia, kuten 'Kyllä' tai 'Ei' -vastauksia, jolloin mallin luomiseen ja tulkintaan tarvitaan logistista regressiota. Logistisen regression teoriaan liittyen käsitellään logit-muunnos ja sen mukanaan tuomat mahdollisuudet. Mallin parametrien estimointia varten esitellään suurimman uskottavuuden estimointi. Työssä käsitellään myös mallin valintaa varten eteenpäin- ja poistovalinta, sekä näitä yhdistelevä askeltava menetelmä. Luotujen mallien hyvyyttä arvioidaan Hosmer—Lemshow-testin avulla ja erottelukykyä testataan Receiver Operating Characteristic (ROC) -käyriä, sekä Area Under the Curve (AUC) -arvoja käyttäen.
Työssä saadut tulokset perustuvat pitkälti tilastolliseen merkitsevyyteen, sekä ainoastaan yhteen aineistoon. Tämän takia niihin tulisi suhtautua varauksella ja harkiten. Tästä huolimatta saadut keskeisimmät tulokset ovat yhteneviä aiheesta tehdyn aiemman tutkimuksen kanssa. Kummankin työssä luodun mallin, sekä tutkittujen korrelaatioiden perusteella hakijan luottohistorialla on selkeästi suurin merkitys lainapäätöksen kannalta. Muita merkittäväksi havaittuja tekijöitä ovat asunnon sijainti, jota varten lainaa haetaan, sekä se, onko hakija avioliitossa. Etenkin luottohistorian merkitys korostui myös muissa aiheesta tehdyissä tutkimuksissa. Luotujen mallien erottelukyvyt ovat kohtuullisia, mutta ne täytyisi testata vielä ulkopuolisella aineistolla.
Kokoelmat
- Kandidaatintutkielmat [10827]
