OMOP-CDM:n hyödyntäminen lääketieteellisessä data-analytiikassa
Ruhanen, Tuukka (2023)
Ruhanen, Tuukka
2023
Tieto- ja sähkötekniikan kandidaattiohjelma - Bachelor's Programme in Computing and Electrical Engineering
Informaatioteknologian ja viestinnän tiedekunta - Faculty of Information Technology and Communication Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2023-12-29
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-2023121911034
https://urn.fi/URN:NBN:fi:tuni-2023121911034
Tiivistelmä
Tässä kandidaatintutkielmassa tutkittiin Observational Medical Outcomes Partnership (OMOP) Common Data Model (CDM)-tietomallin käyttöä lääketieteen ja terveydenhuollon data-analytiikassa. Päätavoitteena oli aiempien tutkimusten perusteella selvittää, millaisilla tavoilla OMOP-CDM:ää käytetään ja saavutetaanko sen käytöllä merkittävää hyötyä, joka voisi edesauttaa tietomallin laajempaa käyttöönottoa. Tietomallin laaja käyttö edistäisi terveydenhuollon pyrkimyksiä ymmärtää ja ratkaista niin yksilöiden kuin koko väestön terveyskysymyksiä. Toisena päätavoitteena oli pohtia syitä vähäisen käytön taustalla eri näkökulmista.
Tutkielman aihe sijoittuu lääketieteen ja data-analytiikan rajapinnalle, minkä vuoksi katsauksessa tarkasteltavia julkaisuja haettiin kattavasti molempiin aloihin keskittyvistä tietokannoista, joista tärkeimpiä olivat PubMed, Springer ja ScienceDirect. Lähdejulkaisuja kerättiin vuosien 2018 ja 2023 väliltä, mikä osoittautui sopivaksi rajaukseksi, sillä vanhempia julkaisuja aiheesta ei juurikaan löytynyt. Tärkeimpänä valintakriteerinä julkaisuille oli OMOP-CDM:än merkittävyys tehdylle tutkimukselle tai tutkimuksen tuloksille. Aineistohaussa huomattiin, että OMOP-CDM mainittiin useissa julkaisuissa, mutta vain osassa sen käsittely oli oleellista työn kannalta. Varsinaisten tutkimusten rinnalla työssä käytettiin laajasti lähteitä selittämään käsitteitä, jotka ovat vahvasti sidoksissa teoriaan aiheen taustalla.
Tutkimuksen tulokset vahvistavat käsitystä, että OMOP-CDM on hyödyllinen väline tietoaineistojen laajentamisessa. Potilastietojen standardoinnin myötä on mahdollista kasvattaa tietoaineistoja yli paikallisten ja kansainvälisten rajojen, mikä mahdollistaa laajempien ja yleistettävien tutkimusten toteuttamisen verrattuna suppeampiin otoskooltaan rajoittuneisiin tutkimuksiin. Laajojen otoskokojen käyttö on olennaista korkealaatuisten kvantitatiivisten tutkimusten toteuttamisessa.
Työssä pohdittiin syitä tietomallin vähäiselle omaksumiselle. Heterogeenisen potilastiedon muuntaminen standardimuotoon on prosessi, joka vie paljon aikaa ja edellyttää yhteistyötä kliinikoiden ja data-ammattilaisten välillä. Koska suurten työryhmien resursointi on kallista, monet organisaatiot eivät pidä tätä prioriteettina. Tämän ongelman ratkaisemiseksi pohdittiin mahdollisuutta potilastiedon rakenteellisempaan kirjaamiseen jo alusta alkaen, mikä nopeuttaisi myöhempää muuntamisprosessia, sekä työkalujen kehittämistä, joilla voitaisiin automatisoida muuntamisprosessia.
Tutkielman aihe sijoittuu lääketieteen ja data-analytiikan rajapinnalle, minkä vuoksi katsauksessa tarkasteltavia julkaisuja haettiin kattavasti molempiin aloihin keskittyvistä tietokannoista, joista tärkeimpiä olivat PubMed, Springer ja ScienceDirect. Lähdejulkaisuja kerättiin vuosien 2018 ja 2023 väliltä, mikä osoittautui sopivaksi rajaukseksi, sillä vanhempia julkaisuja aiheesta ei juurikaan löytynyt. Tärkeimpänä valintakriteerinä julkaisuille oli OMOP-CDM:än merkittävyys tehdylle tutkimukselle tai tutkimuksen tuloksille. Aineistohaussa huomattiin, että OMOP-CDM mainittiin useissa julkaisuissa, mutta vain osassa sen käsittely oli oleellista työn kannalta. Varsinaisten tutkimusten rinnalla työssä käytettiin laajasti lähteitä selittämään käsitteitä, jotka ovat vahvasti sidoksissa teoriaan aiheen taustalla.
Tutkimuksen tulokset vahvistavat käsitystä, että OMOP-CDM on hyödyllinen väline tietoaineistojen laajentamisessa. Potilastietojen standardoinnin myötä on mahdollista kasvattaa tietoaineistoja yli paikallisten ja kansainvälisten rajojen, mikä mahdollistaa laajempien ja yleistettävien tutkimusten toteuttamisen verrattuna suppeampiin otoskooltaan rajoittuneisiin tutkimuksiin. Laajojen otoskokojen käyttö on olennaista korkealaatuisten kvantitatiivisten tutkimusten toteuttamisessa.
Työssä pohdittiin syitä tietomallin vähäiselle omaksumiselle. Heterogeenisen potilastiedon muuntaminen standardimuotoon on prosessi, joka vie paljon aikaa ja edellyttää yhteistyötä kliinikoiden ja data-ammattilaisten välillä. Koska suurten työryhmien resursointi on kallista, monet organisaatiot eivät pidä tätä prioriteettina. Tämän ongelman ratkaisemiseksi pohdittiin mahdollisuutta potilastiedon rakenteellisempaan kirjaamiseen jo alusta alkaen, mikä nopeuttaisi myöhempää muuntamisprosessia, sekä työkalujen kehittämistä, joilla voitaisiin automatisoida muuntamisprosessia.
Kokoelmat
- Kandidaatintutkielmat [8381]