Kovariaattien merkitys ANCOVA-mallissa
Juulia, Kärki (2021)
Juulia, Kärki
2021
Matematiikan ja tilastotieteen kandidaattiohjelma - Bachelor's Programme in Mathematics and Statistics
Informaatioteknologian ja viestinnän tiedekunta - Faculty of Information Technology and Communication Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2021-05-19
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-202104284082
https://urn.fi/URN:NBN:fi:tuni-202104284082
Tiivistelmä
Kovarianssianalyysi (Analysis of covariance) on yleinen lineaarinen malli, joka on yhdistelmä regressio- ja varianssianalyysista. Kovarianssianalyysia käytetään tutkimaan jatkuvien ja luokiteltujen muuttujien vaikutusta selitettävään muuttujaan. Siinä voidaan käyttää yhtä tai useampaa selittävää muuttujaa, joita kutsutaan kovariaateiksi.
Tämä tutkielma voidaan jakaa kahteen osaan. Ensimmäisessä osassa esitellään teoreettisesti kovariaattianalyysin malli, sen tärkeimpien parametrien estimointi, hypoteesin testaus ja kovarianssianalyysin taulu. Tärkeimmät analyysin tunnusluvut ovat esitetty taulussa. Toisessa osassa hyödynnetään teoriaosuutta käytännön aineistoon. Testauksessa käytetään Suomen Ekonomit järjestön keräämää palkkatasoaineistoa ja hyödynnetään sitä kovarianssianalyysin testaukseen. Ensimmäiseksi esitellään testauksessa käytettyjen muuttujien jakautumista havaintoaineistossa. Testauksessa tarkastellaan kovariaattien merkitystä kovarianssianalyysissa ja tutkitaan erilaisten muuttujien vaikutuksia testituloksiin.
Havaintoaineistosta käytetään ryhmiinjakokriteereinä sukupuolta ja selittävänä muuttujana eli kovariaattina ikää ja yrityksen henkilöstömäärää tutkimaan selitettävän muuttujan palkan jakautumista. Näistä kovariaateista tehdään kolme erilaista kovarianssianalyysin mallia, esitellään niiden parametriestimaatit ja testataan estimoidun kovarianssianalyysin mallia. Näistä kaikista malleista tutkitaan kovariaattien merkitys mallissa ja tutkitaan residuaalien käyttäytymistä graafisesti. Kovarianssianalyysin testaukset ja graafiset esitykset ovat tehty R-ohjelmistokielen avulla.
Ensimmäiseen malliin lisätään kovariaatiksi ikämuuttuja. Palkoissa on eroavaisuuksia, kun iän vaikutus on poistettu. Toisessa mallissa korvataan kovariaatti ikämuuttuja henkilöstömäärämuuttujalla. Henkilöstömäärän vaikutuksen poisto ei vaikuta palkkaeroihin tilastollisesti merkitsevästi. Kolmanteen malliin on sisällytetty kumpikin kovariaatti ikä ja henkilöstömäärä. Kun kovariaattien iän ja henkilöstömäärän vaikutus on poistettu, palkoissa on eroavaisuuksia sukupuolittain. Kovariaattien lisääminen malliin ei siis juurikaan vähentänyt palkkaeroja. Miesten ja naisten palkoissa on eroa, mutta palkkojen eroa ei selitä henkilöstömäärä ja ikä. Palkkaeroon vaikuttavat muut tekijät enemmän.
Tämä tutkielma voidaan jakaa kahteen osaan. Ensimmäisessä osassa esitellään teoreettisesti kovariaattianalyysin malli, sen tärkeimpien parametrien estimointi, hypoteesin testaus ja kovarianssianalyysin taulu. Tärkeimmät analyysin tunnusluvut ovat esitetty taulussa. Toisessa osassa hyödynnetään teoriaosuutta käytännön aineistoon. Testauksessa käytetään Suomen Ekonomit järjestön keräämää palkkatasoaineistoa ja hyödynnetään sitä kovarianssianalyysin testaukseen. Ensimmäiseksi esitellään testauksessa käytettyjen muuttujien jakautumista havaintoaineistossa. Testauksessa tarkastellaan kovariaattien merkitystä kovarianssianalyysissa ja tutkitaan erilaisten muuttujien vaikutuksia testituloksiin.
Havaintoaineistosta käytetään ryhmiinjakokriteereinä sukupuolta ja selittävänä muuttujana eli kovariaattina ikää ja yrityksen henkilöstömäärää tutkimaan selitettävän muuttujan palkan jakautumista. Näistä kovariaateista tehdään kolme erilaista kovarianssianalyysin mallia, esitellään niiden parametriestimaatit ja testataan estimoidun kovarianssianalyysin mallia. Näistä kaikista malleista tutkitaan kovariaattien merkitys mallissa ja tutkitaan residuaalien käyttäytymistä graafisesti. Kovarianssianalyysin testaukset ja graafiset esitykset ovat tehty R-ohjelmistokielen avulla.
Ensimmäiseen malliin lisätään kovariaatiksi ikämuuttuja. Palkoissa on eroavaisuuksia, kun iän vaikutus on poistettu. Toisessa mallissa korvataan kovariaatti ikämuuttuja henkilöstömäärämuuttujalla. Henkilöstömäärän vaikutuksen poisto ei vaikuta palkkaeroihin tilastollisesti merkitsevästi. Kolmanteen malliin on sisällytetty kumpikin kovariaatti ikä ja henkilöstömäärä. Kun kovariaattien iän ja henkilöstömäärän vaikutus on poistettu, palkoissa on eroavaisuuksia sukupuolittain. Kovariaattien lisääminen malliin ei siis juurikaan vähentänyt palkkaeroja. Miesten ja naisten palkoissa on eroa, mutta palkkojen eroa ei selitä henkilöstömäärä ja ikä. Palkkaeroon vaikuttavat muut tekijät enemmän.
Kokoelmat
- Kandidaatintutkielmat [8709]