Logistisen regressiomallin soveltaminen kasvuaineistoon ja luokittelukyvyn vertaaminen erotteluanalyysiin
Pietarinen, Atte (2023)
Pietarinen, Atte
2023
Matematiikan ja tilastotieteen kandidaattiohjelma - Bachelor's Programme in Mathematics and Statistics
Informaatioteknologian ja viestinnän tiedekunta - Faculty of Information Technology and Communication Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2023-05-16
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-202305024954
https://urn.fi/URN:NBN:fi:tuni-202305024954
Tiivistelmä
Tutkielman aiheena oli tutkia mitkä taustatekijät ja elämäntavat ennustavat lasten myöhemmän elämän ylipainoa. Tämä toteutettiin soveltamalla logistista regressiomallia lasten vanhemmilta kerättyyn kyselytutkimukseen. Logistisen regressiomallin tuloksia analysoitiin sekä sen luokittelukykyä arvioitiin ja verrattiin erotteluanalyysiin.
Lapsia oli kahdessa ikäryhmässä. Nuoremmassa ikäryhmässä oli 5-vuotiaat lapset, joiden ylipainoa tutkittiin 10-12-vuotiaina. Vanhemmassa ikäryhmässä oli 5-6. luokalla opiskelevat lapset, joiden ylipainoa tutkittiin 13-16-vuotiaina. Kummankin ikäryhmän molemmille sukupuolille rakennettiin kaksi mallia, joista ensimmäisessä oli mukana sekä elämäntapoja että taustatekijöitä käsitteleviä muuttujia, ja toisessa vain elämäntapoja käsitteleviä muuttujia.
Ikäryhmille nousi esiin eri taustamuuttujia. Vanhemmalla ikäryhmällä esiin nousi äidin raskauden ajan BMI-arvo, mutta muuttuja ei ollut merkitsevä nuoremmalla ikäryhmällä. Puolestaan asuinpaikka oli merkitsevä tekijä nuoremmalle muttei vanhemmalle ikäryhmälle. Suurimpana riskitekijänä lapsen myöhempään ylipainoon oli normaalia suurempi määrä rasvakudosta vyötärön ympärillä.
Mallit, jotka käsittelivät myös taustamuuttujia, olivat huomattavasti tehokkaampia luokittelussa kuin pelkästään elämäntapoja käsittelevät mallit. Erotteluanalyysi sai mallista riippuen joko vastaavia tai heikompia tuloksia kuin logistinen regressiomalli.
Lapsia oli kahdessa ikäryhmässä. Nuoremmassa ikäryhmässä oli 5-vuotiaat lapset, joiden ylipainoa tutkittiin 10-12-vuotiaina. Vanhemmassa ikäryhmässä oli 5-6. luokalla opiskelevat lapset, joiden ylipainoa tutkittiin 13-16-vuotiaina. Kummankin ikäryhmän molemmille sukupuolille rakennettiin kaksi mallia, joista ensimmäisessä oli mukana sekä elämäntapoja että taustatekijöitä käsitteleviä muuttujia, ja toisessa vain elämäntapoja käsitteleviä muuttujia.
Ikäryhmille nousi esiin eri taustamuuttujia. Vanhemmalla ikäryhmällä esiin nousi äidin raskauden ajan BMI-arvo, mutta muuttuja ei ollut merkitsevä nuoremmalla ikäryhmällä. Puolestaan asuinpaikka oli merkitsevä tekijä nuoremmalle muttei vanhemmalle ikäryhmälle. Suurimpana riskitekijänä lapsen myöhempään ylipainoon oli normaalia suurempi määrä rasvakudosta vyötärön ympärillä.
Mallit, jotka käsittelivät myös taustamuuttujia, olivat huomattavasti tehokkaampia luokittelussa kuin pelkästään elämäntapoja käsittelevät mallit. Erotteluanalyysi sai mallista riippuen joko vastaavia tai heikompia tuloksia kuin logistinen regressiomalli.
Kokoelmat
- Kandidaatintutkielmat [8381]