Genominlaajuisen SNP-aineiston tutkimusmenetelmien vertailua syöpää aiheuttavien perimän muutosten löytämiseksi
OINONEN, SAARA (2011)
OINONEN, SAARA
2011
Tilastotiede - Statistics
Informaatiotieteiden yksikkö - School of Information Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2011-06-09
Julkaisun pysyvä osoite on
https://urn.fi/urn:nbn:fi:uta-1-21572
https://urn.fi/urn:nbn:fi:uta-1-21572
Tiivistelmä
Tämän tutkielman tarkoitus on kokeilla ja vertailla erilaisia laajan geneettisen aineiston tutkimiseen tarkoitettuja tilastollisia menetelmiä. Huomiota kiinnitetään eri analyysimenetelmien antamien tulosten samankaltaisuuteen ja siihen, kuinka hyvin ne sopivat aineiston analysointiin. Geneettiset aineistot ovat tilastotieteen kannalta haastavia tutkittavia, sillä muuttujat ovat usein toisistaan riippuvaisia ja niitä saattaa olla aineistossa satoja tuhansia. Tässä tutkielmassa onkin tarkoitus arvioida muutamaa perinteisempää menetelmää sekä uudempia, genetiikan tutkimuksille varta vasten kehitettyjä menetelmiä. Tarjolla olevista lukuisista menetelmistä tässä tutkielmassa käytetään χ2-riippumattomuustestiä, logistista regressioanalyysia, kytkentäepätasapainoanalyysia ja haplotyyppiblokkien määrittämistä sekä Random forest -algoritmia.
Asiasanat:χ2-riippumattomuustesti, logistinen regressioanalyysi, kytkentäepätasapaino, haplotyyppiblokit, Random forest
Asiasanat:χ2-riippumattomuustesti, logistinen regressioanalyysi, kytkentäepätasapaino, haplotyyppiblokit, Random forest