Mittavirheen vaikutus logistisessa regressiossa sovellettuna liikennekuoleman riskiin
Friman, Elli-Sofia (2023)
Friman, Elli-Sofia
2023
Matematiikan ja tilastotieteen kandidaattiohjelma - Bachelor's Programme in Mathematics and Statistics
Informaatioteknologian ja viestinnän tiedekunta - Faculty of Information Technology and Communication Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2023-05-16
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-202304264574
https://urn.fi/URN:NBN:fi:tuni-202304264574
Tiivistelmä
Tutkimuksen aiheena on tarkastella, miten selittävän muuttujan mittavirhe vaikuttaa tuloksiin, kun tutkitaan liikennekuoleman riskiä logistisella regressioanalyysilla. Tutkimuksessa käsitellään kahta tutkimuskysymystä: millainen yhteys ajoneuvon ylinopeudella on liikennekuoleman tapahtumiseen, ja miten ylinopeuden mahdollinen mittavirhe vaikuttaa mallin antamiin tuloksiin. Logistisen regressioanalyysin ja Berksonin mittavirhemallin avulla etsitään vastauksia näihin kysymyksiin.
Tutkimusaineisto koottiin kahdesta osasta. Ensimmäisen osan havainnot poimittiin Onnettomuustietoinstituutin (OTI) aineistosta, joka sisältää numeeriset tiedot tutkijalautakuntien tutkimista kuolemaan johtaneista liikenneonnettomuuksista. Yksittäisenä havaintona on ajoneuvon arvioitu nopeus juuri ennen onnettomuutta. Aineiston toisen osan havainnot poimittiin satunnaisotannalla liikenteen automaattisilta mittausasemilta. LAM-asemilta poimitut havainnot oletetaan tilanteiksi, joissa kuolemaan johtanutta liikenneonnettomuutta ei ole tapahtunut.
Tutkimusaineistosta muodostettiin logistinen regressiomalli, jonka avulla voidaan tutkia ajoneuvon ylinopeuden vaikutusta liikennekuoleman riskiin ja todennäköisyyteen. Mallin selittävänä muuttujana on ajoneuvon ylinopeus ja kaksiarvoisena vastemuuttujana on liikennekuoleman tapahtuminen. Mittavirheen vaikutuksen tutkimista varten muodostettiin uusi malli, jossa osa havainnoista sisältää kiinteällä varianssilla simuloitua mittavirhettä. Virhettä sisältävä malli vastaa muuten alkuperäistä logistista regressiomallia, mutta selittävänä muuttujana on virhettä sisältävä ylinopeus. Koska virheen varianssi on kiinteä, tehdään oletus todellisien arvojen jakautumisesta havaituilla arvoilla Berksonin mittavirhemallin mukaan.
Tuloksista voidaan tehdä johtopäätös, että ylinopeudella on selkeä yhteys liikennekuoleman todennäköisyyteen. Tuloksia tarkastellessa ja niiden luotettavuutta arvioitaessa tulee kuitenkin ottaa huomioon aineiston pieni koko, joka voi heikentää tulosten pätevyyttä. Tuloksista huomataan, että virhettä sisältävällä mallilla estimoidut keskivirheet ovat hieman suuremmat kuin alkuperäisellä mallilla. Ylinopeuden määrän kasvaessa liikennekuoleman todennäköisyys kasvaa virhettä sisältävällä mallilla nopeammin kuin alkuperäisellä mallilla, joten virhettä sisältävällä mallilla liikennekuoleman todennäköisyyden variaatio on suurempi.
Tutkimusaineisto koottiin kahdesta osasta. Ensimmäisen osan havainnot poimittiin Onnettomuustietoinstituutin (OTI) aineistosta, joka sisältää numeeriset tiedot tutkijalautakuntien tutkimista kuolemaan johtaneista liikenneonnettomuuksista. Yksittäisenä havaintona on ajoneuvon arvioitu nopeus juuri ennen onnettomuutta. Aineiston toisen osan havainnot poimittiin satunnaisotannalla liikenteen automaattisilta mittausasemilta. LAM-asemilta poimitut havainnot oletetaan tilanteiksi, joissa kuolemaan johtanutta liikenneonnettomuutta ei ole tapahtunut.
Tutkimusaineistosta muodostettiin logistinen regressiomalli, jonka avulla voidaan tutkia ajoneuvon ylinopeuden vaikutusta liikennekuoleman riskiin ja todennäköisyyteen. Mallin selittävänä muuttujana on ajoneuvon ylinopeus ja kaksiarvoisena vastemuuttujana on liikennekuoleman tapahtuminen. Mittavirheen vaikutuksen tutkimista varten muodostettiin uusi malli, jossa osa havainnoista sisältää kiinteällä varianssilla simuloitua mittavirhettä. Virhettä sisältävä malli vastaa muuten alkuperäistä logistista regressiomallia, mutta selittävänä muuttujana on virhettä sisältävä ylinopeus. Koska virheen varianssi on kiinteä, tehdään oletus todellisien arvojen jakautumisesta havaituilla arvoilla Berksonin mittavirhemallin mukaan.
Tuloksista voidaan tehdä johtopäätös, että ylinopeudella on selkeä yhteys liikennekuoleman todennäköisyyteen. Tuloksia tarkastellessa ja niiden luotettavuutta arvioitaessa tulee kuitenkin ottaa huomioon aineiston pieni koko, joka voi heikentää tulosten pätevyyttä. Tuloksista huomataan, että virhettä sisältävällä mallilla estimoidut keskivirheet ovat hieman suuremmat kuin alkuperäisellä mallilla. Ylinopeuden määrän kasvaessa liikennekuoleman todennäköisyys kasvaa virhettä sisältävällä mallilla nopeammin kuin alkuperäisellä mallilla, joten virhettä sisältävällä mallilla liikennekuoleman todennäköisyyden variaatio on suurempi.
Kokoelmat
- Kandidaatintutkielmat [8780]