Nonparametric Methods for Multivariate Location Problems with Independent and Cluster Correlated Observations
Nevalainen, Jaakko (2007)
Nevalainen, Jaakko
Tampere University Press
2007
Tilastotiede - Statistics
Informaatiotieteiden tiedekunta - Faculty of Information Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Väitöspäivä
2007-01-12
Julkaisun pysyvä osoite on
https://urn.fi/urn:isbn:978-951-44-6812-4
https://urn.fi/urn:isbn:978-951-44-6812-4
Tiivistelmä
Tilastotiede antaa mahdollisuuden tiivistää kerätystä tutkimusaineistosta keskeisimmän tiedon sekä systemaattisesti arvioida sattuman osuutta tuloksiin. Klassinen tilastollinen päättely nojautuu oletuksiin aineiston havaintojen riippumattomuudesta ja jakaumasta. Käytännön tutkimusasetelmissa nämä oletukset ovat kuitenkin voimakkaita ja toteutuvat parhaimmillaankin likimääräisesti.
Tämän tutkimuksen tavoitteena on kehittää tehokkaita tilastollisia menetelmiä, jotka eivät perustu riippumattomuus- tai jakaumaoletukseen. Erityisen huomion kohteena on otantakokeissa ja pitkittäisaineistoissa tavallinen klusterointi. Klusterilla tarkoitetaan aineistoa ryhmittelevää tekijää, joka jakaa aineiston toisistaan riippumattomiin osiin. Samasta klusterista peräisin olevat havainnot puolestaan riippuvat toisistaan. Esimerkiksi perheenjäsenet samassa tutkimuksessa ovat sekä perimältään että elintavoiltaan samankaltaisia - heidän ominaisuutensa korreloivat. Eri perheet taas voidaan ajatella riippumattomiksi toisistaan; perhe siis muodostaa klusterin.
Tutkimus jakautuu kahteen pääosaan: Ensimmäisessä osassa tarkastellaan riippumattomia havaintoja yhden ja useamman otoksen tilanteessa. Toinen osa keskittyy klusteroituun aineistoon ja erityisen riippuvuuden tyypin - klusterin sisäisen korrelaation (intracluster correlation) - huomioimiseen osana tilastollista analyysia. Väitöskirjatyössä esitellään uusia epäparametrisia spatiaalisiin suunta- ja järjestyslukuvektoreihin perustuvia laskentamenetelmiä moniulotteisen aineiston symmetriapisteen estimoimiseksi, ja siihen liittyvien tilastollisten testien toteuttamiseksi. Oikein painottamalla voidaan testin tehokkuus ja estimointitarkkuus optimoida.
Spatiaalisten menetelmien merkittävimmät edut ovat niiden tehokkuus ja luotettavuus laajalla käyttöalueella: menetelmien avulla voidaan esimerkiksi lääketieteen tutkimuksessa saavuttaa sama määrä tietoa pienemmällä määrällä potilaita.
Tämän tutkimuksen tavoitteena on kehittää tehokkaita tilastollisia menetelmiä, jotka eivät perustu riippumattomuus- tai jakaumaoletukseen. Erityisen huomion kohteena on otantakokeissa ja pitkittäisaineistoissa tavallinen klusterointi. Klusterilla tarkoitetaan aineistoa ryhmittelevää tekijää, joka jakaa aineiston toisistaan riippumattomiin osiin. Samasta klusterista peräisin olevat havainnot puolestaan riippuvat toisistaan. Esimerkiksi perheenjäsenet samassa tutkimuksessa ovat sekä perimältään että elintavoiltaan samankaltaisia - heidän ominaisuutensa korreloivat. Eri perheet taas voidaan ajatella riippumattomiksi toisistaan; perhe siis muodostaa klusterin.
Tutkimus jakautuu kahteen pääosaan: Ensimmäisessä osassa tarkastellaan riippumattomia havaintoja yhden ja useamman otoksen tilanteessa. Toinen osa keskittyy klusteroituun aineistoon ja erityisen riippuvuuden tyypin - klusterin sisäisen korrelaation (intracluster correlation) - huomioimiseen osana tilastollista analyysia. Väitöskirjatyössä esitellään uusia epäparametrisia spatiaalisiin suunta- ja järjestyslukuvektoreihin perustuvia laskentamenetelmiä moniulotteisen aineiston symmetriapisteen estimoimiseksi, ja siihen liittyvien tilastollisten testien toteuttamiseksi. Oikein painottamalla voidaan testin tehokkuus ja estimointitarkkuus optimoida.
Spatiaalisten menetelmien merkittävimmät edut ovat niiden tehokkuus ja luotettavuus laajalla käyttöalueella: menetelmien avulla voidaan esimerkiksi lääketieteen tutkimuksessa saavuttaa sama määrä tietoa pienemmällä määrällä potilaita.
Kokoelmat
- Väitöskirjat [4996]