On invariant coordinate selection and nonparametric analysis of multivariate data
Nordhausen, Klaus (2008)
Nordhausen, Klaus
Tampere University Press
2008
Biometria - Biometry
Lääketieteellinen tiedekunta - Faculty of Medicine
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Väitöspäivä
2008-12-12
Julkaisun pysyvä osoite on
https://urn.fi/urn:isbn:978-951-44-7539-9
https://urn.fi/urn:isbn:978-951-44-7539-9
Tiivistelmä
Perinteiset tavat analysoida samanaikaisesti useita jatkuvia muuttujia nojaavat usein oletukseen, jonka mukaan havainnot ovat peräisin moniulotteisesta normaalijakaumasta. Joissakin perinteisissä analyyseissä (moniulotteinen varianssianalyysi ja regressioanalyysi, kanoninen korrelaatio) selvitetään muuttujien riippuvuutta toisistaaan, joissakin taas pyritään vähentämään tarkasteltavien muuttujien määrää (pääkomponenttianalyysi, faktorianalyysi, riippumattomien komponettien analyysi), ja joissakin pyritään yksilöt luokittelemaan mitattujen muuttujien avulla (klusterianalyysi, erotteluanalyysi). Perinteiset menetelmät ovat kuitenkin tyypillisesti herkkiä poikkeaville havainnoille ja menettävät tehokkuutensa, jos oletukset eivät pidä paikkaansa.
Tässä tutkimuksessa on kehitetty uusia työkaluja moniulotteisen aineiston analyysiin hyvin lievien oletusten vallitessa. Käyttämällä samanaikaisesti kahta hajontamatriisia ja kahta sijaintivektoria Moniulotteinen aineisto muunnetaan ensin uuteen koordinaatistoon, joka on riippumaton alkuperäisestä aineiston mittaustavasta (mittayksikkö, origo, rotaatiot). Uutta koordinaattisysteemiä kutsutaan tällöin invariantiksi koordinaattisysteemiksi. Kahden sijaintivektorin ja kahden hajontamatriisin samanaikainen käyttö tuottaa tällöin monipuolista tietoa moniulotteisen jakauman sijannista, hajonnasta, vinoudesta ja huipukkuudesta, jota edelleen voidaan käyttää erilaisten mallioletusten realistisuuden arviointiin. Invarianttia koordinaattisysteemiä voidaan käyttää myös aineiston luokittelun apuna (klusterianalyysi) ja poikkeavien havaintojen tunnistamiseen. Jos hajontamatriiseilla on niin sanottu riippumattomuusominaisuus, ja havainnot ovat peräisin riippumattomien komponenttien mallista, muuttujat uudessa koordinaattisysteemissä ovat riippumattomia. Runsaasti sovelluksia tähän klassiseen riippumattomien komponenttien ongelmaan löytyy esimerkiksi kuvan- ja signaalinkäsittelystä.
Jos aineiston jatkoanalyysissä käytetään invariantissa koordinaattisysteemissä mitattuja muuttujia, menetelmät ovat automaattisesti affinisti invariantteja (riippumattomia alkuperäisestä koordinaattisysteemistä). Tätä hyväksikäyttäen on mahdollista konstruoida esimerkiksi invariantteja moniulotteisia järjestyslukutestejä ja vastaavia estimaatteja. Väitöskirjan jälkimmäinen osa keskittyy tähän ongelmaan. Työssä on osoitettu muun muassa, että riippumattomien komponenttien mallissa on mahdollista löytää yhden otoksen järjestyslukutesti, jonka tehokkuus on aina vähintään yhtä hyvä kuin klassisen Hotellingin testin tehokkuus. Osana väitöskirjatyötä on kehitetty yleiseen käyttöön R-ohjelmistopaketti, jonka avulla kehitettyjä menetelmiä voidaan soveltaa mihin tahansa aineistoon. Esimerkkiaineistona tutkimuksessa on käytetty muun muassa aineistoa, jossa tutkitaan verenkiertoon liittyviä muuttujia ja signaaleja.
Tässä tutkimuksessa on kehitetty uusia työkaluja moniulotteisen aineiston analyysiin hyvin lievien oletusten vallitessa. Käyttämällä samanaikaisesti kahta hajontamatriisia ja kahta sijaintivektoria Moniulotteinen aineisto muunnetaan ensin uuteen koordinaatistoon, joka on riippumaton alkuperäisestä aineiston mittaustavasta (mittayksikkö, origo, rotaatiot). Uutta koordinaattisysteemiä kutsutaan tällöin invariantiksi koordinaattisysteemiksi. Kahden sijaintivektorin ja kahden hajontamatriisin samanaikainen käyttö tuottaa tällöin monipuolista tietoa moniulotteisen jakauman sijannista, hajonnasta, vinoudesta ja huipukkuudesta, jota edelleen voidaan käyttää erilaisten mallioletusten realistisuuden arviointiin. Invarianttia koordinaattisysteemiä voidaan käyttää myös aineiston luokittelun apuna (klusterianalyysi) ja poikkeavien havaintojen tunnistamiseen. Jos hajontamatriiseilla on niin sanottu riippumattomuusominaisuus, ja havainnot ovat peräisin riippumattomien komponenttien mallista, muuttujat uudessa koordinaattisysteemissä ovat riippumattomia. Runsaasti sovelluksia tähän klassiseen riippumattomien komponenttien ongelmaan löytyy esimerkiksi kuvan- ja signaalinkäsittelystä.
Jos aineiston jatkoanalyysissä käytetään invariantissa koordinaattisysteemissä mitattuja muuttujia, menetelmät ovat automaattisesti affinisti invariantteja (riippumattomia alkuperäisestä koordinaattisysteemistä). Tätä hyväksikäyttäen on mahdollista konstruoida esimerkiksi invariantteja moniulotteisia järjestyslukutestejä ja vastaavia estimaatteja. Väitöskirjan jälkimmäinen osa keskittyy tähän ongelmaan. Työssä on osoitettu muun muassa, että riippumattomien komponenttien mallissa on mahdollista löytää yhden otoksen järjestyslukutesti, jonka tehokkuus on aina vähintään yhtä hyvä kuin klassisen Hotellingin testin tehokkuus. Osana väitöskirjatyötä on kehitetty yleiseen käyttöön R-ohjelmistopaketti, jonka avulla kehitettyjä menetelmiä voidaan soveltaa mihin tahansa aineistoon. Esimerkkiaineistona tutkimuksessa on käytetty muun muassa aineistoa, jossa tutkitaan verenkiertoon liittyviä muuttujia ja signaaleja.
Kokoelmat
- Väitöskirjat [4848]