Principal Component Analysis (PCA), Factor Analysis and Independent Component Analysis (ICA) in the Analysis of Nutritional Data
IVORI, KIMMO (2006)
Tässä tietueessa ei ole kokotekstiä saatavilla Treposta, ainoastaan metadata.
IVORI, KIMMO
2006
Tilastotiede - Statistics
Informaatiotieteiden tiedekunta - Faculty of Information Sciences
Hyväksymispäivämäärä
2006-12-29Tiivistelmä
Tässä tilastotieteen pro gradu-työssä tarkastellaan Terveys 2000
-tutkimuksen ravitsemus aineistoa. Tavoitteena on löytää ravintotottumuksiltaan
poikkeavia ravinto klustereita, joiden välillä ravitsemustottumukset
ovat erilaisia.
Osana Kansanterveyslaitoksen tekemää Terveys 2000 -tutkimusta
kerättiin tietoa suomalaisten ruokailutottumuksista viimeisen 12 kk:n
ajalta. Tutkimus tehtiin lomakekyselynä.
Tähän aineistoon sovellettiin kolmea tilastollista monimuuttujamenetelmää:
pääkomponenttianalyysiä (PCA), faktorianalyysiä (FA)
ja riippumattomien komponenttien analyysiä (ICA).
Pääkomponettianalyysi ja faktorianalyysi ovat ”perinteisiä” monimuuttujamenetelmiä,
jotka perustuvat aineistosta laskettuun kovarianssimatriisiin.
Nyt sovellettu riippumattomien komponettien analyysi
perustuu, sekä toisiin, että neljänsiin momentteihin.
Neljänsien momenttien kuvaaminen on toteutettu kahdella hajontamatriisilla
siten, että ne yhdessä muodostavat muuttujien huipukkuuden.
Tässä työssä kaytetty riippumattomien komponenttien analyysi
(ICA-K) löytää siten huipukkaimmat ja kaksihuippuisimmat projektiojakaumat,
joista, oletuksen mukaan, kaksihuippuisimmat ovat seurausta
klusteroimisesta.
Asiasanat:
Pääkomponenttianalyysi, faktorianalyysi, riippumattomien komponenttien analyysi, Principal component analysis, factor analysis, independent component analysis, kurtosis, scatter matrices, ICA-K, ICA, PCA
-tutkimuksen ravitsemus aineistoa. Tavoitteena on löytää ravintotottumuksiltaan
poikkeavia ravinto klustereita, joiden välillä ravitsemustottumukset
ovat erilaisia.
Osana Kansanterveyslaitoksen tekemää Terveys 2000 -tutkimusta
kerättiin tietoa suomalaisten ruokailutottumuksista viimeisen 12 kk:n
ajalta. Tutkimus tehtiin lomakekyselynä.
Tähän aineistoon sovellettiin kolmea tilastollista monimuuttujamenetelmää:
pääkomponenttianalyysiä (PCA), faktorianalyysiä (FA)
ja riippumattomien komponenttien analyysiä (ICA).
Pääkomponettianalyysi ja faktorianalyysi ovat ”perinteisiä” monimuuttujamenetelmiä,
jotka perustuvat aineistosta laskettuun kovarianssimatriisiin.
Nyt sovellettu riippumattomien komponettien analyysi
perustuu, sekä toisiin, että neljänsiin momentteihin.
Neljänsien momenttien kuvaaminen on toteutettu kahdella hajontamatriisilla
siten, että ne yhdessä muodostavat muuttujien huipukkuuden.
Tässä työssä kaytetty riippumattomien komponenttien analyysi
(ICA-K) löytää siten huipukkaimmat ja kaksihuippuisimmat projektiojakaumat,
joista, oletuksen mukaan, kaksihuippuisimmat ovat seurausta
klusteroimisesta.
Asiasanat:
Pääkomponenttianalyysi, faktorianalyysi, riippumattomien komponenttien analyysi, Principal component analysis, factor analysis, independent component analysis, kurtosis, scatter matrices, ICA-K, ICA, PCA