Tunnisteiden vertailumenetelmistä DNA-identifikaatiotutkimuksissa
OLLIKAINEN, JUKKA (2006)
Tässä tietueessa ei ole kokotekstiä saatavilla Treposta, ainoastaan metadata.
OLLIKAINEN, JUKKA
2006
Tietojenkäsittelyoppi - Computer Science
Informaatiotieteiden tiedekunta - Faculty of Information Sciences
Hyväksymispäivämäärä
2006-05-24Tiivistelmä
DNA-identifikaatiotutkimuksissa selvitetään henkilöiden osallisuutta rikoksiin vertailemalla DNA-tunnisteita. Vertailuissa olisi hyödyllistä, jos voidaan käyttää sellaisia menetelmiä, jotka pystyvät vertailemaan nopeasti miljoonia DNA-tunnisteita toisiinsa.
Tutkimuksen aiheena on esitellä erilaisia vertailumenetelmiä. Menetelmien suoritusta vertaillaan kokeellisilla tunnistevertailuilla. Tutkimus on myös johdannollinen esitys DNA-tunnisteiden vertailuun siten, että tekstissä esitellään erilaiset DNA-tunnisteet ja niiden vertailusäännöt, vaikka kokeellisissa vertailuissa aihetta rajataankin huomattavasti tunnistedatan suhteen.
Vertailuissa kaikki testatut menetelmät toimivat muuten hyvin, mutta suoritusnopeuksissa oli selkeitä eroja. Menetelmät, joiden aikavaatimus oli luokkaa O(N2), olivat huonoimpia eikä niitä voi suositella DNA-tunnisteiden käsittelyyn (N on vertailtavien alkioiden lukumäärä). Lajitteluun ja ryhmittelyyn perustuvat menetelmät olivat nopeimpia ja molempien voidaan katsoa sopivan tietynlaisten tunnistetietokantojen käsittelyyn.
Avainsanat: DNA-tunniste, identifikaatiotutkimus, vertailualgoritmit
Tutkimuksen aiheena on esitellä erilaisia vertailumenetelmiä. Menetelmien suoritusta vertaillaan kokeellisilla tunnistevertailuilla. Tutkimus on myös johdannollinen esitys DNA-tunnisteiden vertailuun siten, että tekstissä esitellään erilaiset DNA-tunnisteet ja niiden vertailusäännöt, vaikka kokeellisissa vertailuissa aihetta rajataankin huomattavasti tunnistedatan suhteen.
Vertailuissa kaikki testatut menetelmät toimivat muuten hyvin, mutta suoritusnopeuksissa oli selkeitä eroja. Menetelmät, joiden aikavaatimus oli luokkaa O(N2), olivat huonoimpia eikä niitä voi suositella DNA-tunnisteiden käsittelyyn (N on vertailtavien alkioiden lukumäärä). Lajitteluun ja ryhmittelyyn perustuvat menetelmät olivat nopeimpia ja molempien voidaan katsoa sopivan tietynlaisten tunnistetietokantojen käsittelyyn.
Avainsanat: DNA-tunniste, identifikaatiotutkimus, vertailualgoritmit