Hyppää sisältöön
    • Suomeksi
    • In English
Trepo
  • Suomeksi
  • In English
  • Kirjaudu
Näytä viite 
  •   Etusivu
  • Trepo
  • Väitöskirjat
  • Näytä viite
  •   Etusivu
  • Trepo
  • Väitöskirjat
  • Näytä viite
JavaScript is disabled for your browser. Some features of this site may not work without it.

Novel Data-driven Approaches to Identifying Sickness Absence Risk using Occupational Health Data

Anttila, Anniina (2026)

 
Avaa tiedosto
978-952-03-4435-1.pdf (17.87Mt)
Lataukset: 



Anttila, Anniina
Omakustanne / Self-published
2026

Lääketieteen, biotieteiden ja biolääketieteen tekniikan tohtoriohjelma - Doctoral Programme in Medicine, Biosciences and Biomedical Engineering
Lääketieteen ja terveysteknologian tiedekunta - Faculty of Medicine and Health Technology
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Väitöspäivä
2026-04-17
Näytä kaikki kuvailutiedot
Julkaisun pysyvä osoite on
https://urn.fi/URN:ISBN:978-952-03-4435-1
Tiivistelmä
Työkyvyttömyys aiheuttaa merkittäviä kustannuksia sekä työntekijälle, työpaikalle että yhteiskunnalle ja sen taloudelliset vaikutukset on tunnistettu valtaosassa kehittyneitä maita. Elinajanodotteen nousun myötä on välttämätöntä löytää keinoja edistää ikääntyvän työväestön työkykyä vanhuuseläkeikään saakka. Työterveyshuollon ja työpaikkojen aktiivinen yhteistyö on keskeistä niiden työntekijöiden tukemisessa, joilla on terveyteen liittyviä työkyvyn rajoitteita.

Tässä tutkimuksessa haluttiin selvittää, miten suomalaisessa työterveyshuollon palveluntuotannossa kertyvää tietoa pystytään hyödyntämään työkyvyttömyyden ennustamisessa nykyaikaisilla data-analyysimenetelmillä. Aiemmissa tutkimuksissa on tunnistettu useita sairauspoissaoloja ennakoivia tekijöitä, mutta koneoppimiseen pohjautuvia menetelmiä ei ole aiemmin kattavasti hyödynnetty yhtä laajassa työterveyshuollon aineistossa käyttäen sairauspoissaoloja päätemuuttujana. Tämän tutkimuksen toisena tavoitteena oli tunnistaa sellaisia terveyskyselyihin sisällytettäviä kysymyksiä, jotka olisivat merkittävimpiä työkyvyttömyyden ennakoinnissa. Tämä voisi toimia yhtenä askeleena kohti lyhyempää ja kevyempää, helpommin toistettavaa seulontatyökalua työkyvyttömyyden riskin varhaiseen tunnistamiseen.

Aineistona tässä tutkimuksessa oli yhden keskisuuren suomalaisen työterveyshuollon palveluntuottajan sähköinen potilastietoaineisto. Se koostui 18 840 terveyskyselystä, jonka useiden eri toimialojen työntekijät olivat täyttäneet vuosien 2011 ja 2019 välillä sekä tiedot samojen henkilöiden vastaanottokäynneistä ja sairauspoissaoloista ensimmäisestä poissaolopäivästä alkaen. Rajausten jälkeen eri analyyseissä hyödynnettiin 11 495–12 099 eri työntekijän kyselyvastauksia.

Tietyt yksittäiset masennusoirekyselyn (DEPS) kysymykset osoittautuivat hyödyllisiksi sekä pitkien, yli 30 päivän sairauspoissaolojaksojen, että yli 5 kertaa toistuvien 1–10 päivän sairauspoissalojaksojen ennustamisessa kahden vuoden seuranta-aikana. Työn psykososiaalisia kuormitustekijöitä koskevassa kyselyssä kysymys henkilön mahdollisuuksista vaikuttaa työnsä sisältöön, työtahtiin ja -aikaan osoittautui vahvimmaksi toistuvien lyhyiden poissaolojen ennakoijaksi, myös verrattuna yhteenkään DEPS-seulan kysymyksistä. Korkeampi ikä (45–54 vuotta) osoittautui pitkiltä sairauspoissaoloilta suojaavaksi tekijäksi tilanteissa, joissa esihenkilön tuki tai työpaikan ilmapiiri koettiin huonoksi tai työpaikalla esiintyi häirintää tai epäasiallista kohtelua. Toistuvien lyhyiden sairauspoissaolojen kohdalla vastaavaa eroa ikäryhmien välillä ei havaittu.

Tässä tutkimuksessa luotiin koneoppimismenetelmillä useita alamalleja, joissa hyödynnettiin aineistoa eri aiheista ja lähteistä sekä kaksi mallia, joissa käytettiin kaikkia saatavilla olevia muuttujia. Ennustemallien jako alamalleihin auttoi tunnistamaan kunkin alamallin keskeisimmät muuttujat sairauspoissaoloriskin ennustamisen kannalta sekä auttoi arvioimaan eri lähteistä saatavan aineiston hyödynnettävyyttä sairauspoissaolojen ennustamisessa. Kun kaikki muuttujat sisällytettiin ensemble-malliin, jossa kutakin muuttujaa painotettiin ennustetarkkuutensa mukaisesti, ennustemallin suorituskyky parani oleellisesti verrattuna malleihin, joissa hyödynnettiin vain jo aiemmin tiedossa olleita vahvimman ennustevaikutuksen muuttujia. Ensemble-malli toimi hyvin yli 30 päivän sairauspoissaolojaksojen ennustamisessa, saaden AUROC-arvon 0.79 (95 % CI 0.788-0.794).

Ohjaamattoman koneoppimisen menetelmiä voidaan hyödyntää löytämään yhteyksiä eri muuttujien välillä ilman ennalta määriteltyä hypoteesia rajoittamassa analytiikkaa. Näitä menetelmiä hyödyntäen laajasta terveyskysely- ja potilastietoaineistosta tunnistettiin kuusi kliinisesti tunnistettavaa työntekijäklusteria, joista kuhunkin liittyi samantyyppisiä ominaisuuksia ja riskitekijöitä. Jatkoanalyyseissä näillä klustereilla todettiin olevan myös toisistaan poikkeava riski pitkiin ja toistuviin lyhyisiin sairauspoissaoloihin.

Tämä tutkimus osoitti, että terveyskyselyistä ja vastaanottokäynneistä työterveyshuollossa kertyy paljon tietoa, jota voidaan hyödyntää tulevien sairauspoissaolojen ennustamiseen. Koneoppimisen ja suurten kielimallien nopea kehitys tulee mahdollistamaan myös muun kuin rakenteisesti kirjatun aineiston hyödyntämisen analyyseissä paitsi työterveyshuollon sairauskertomuksista, myös kansallisista rekistereistä kuten Kanta ja Avohilmo. Tämä parantaa tulevaisuudessa mahdollisuuksia kehittää entistä tarkempia ennustetyökaluja, joilla työterveyshuollon ammattilaiset pystyvät aikaisemmin tunnistamaan kohonneessa työkyvyttömyyden riskissä olevat henkilöt. Sekä EU-säädökset että suomalainen lainsäädäntö kuitenkin rajoittavat oleellisesti terveystietojen käyttöä ja automatisoitua päätöksentekoa. Terveystietoja voidaan käyttää sairauspoissaoloriskin ennustamiseen vain yksilön nimenomaisella suostumuksella tätä tarkoitusta varten. Kehitettävät menetelmät eivät voi korvata ammattilaisen arviota, vaan ainoastaan toimia päätöksenteon tukena.
 
Kokoelmat
  • Väitöskirjat [5229]
Kalevantie 5
PL 617
33014 Tampereen yliopisto
oa[@]tuni.fi | Tietosuoja | Saavutettavuusseloste
 

 

Selaa kokoelmaa

TekijätNimekkeetTiedekunta (2019 -)Tiedekunta (- 2018)Tutkinto-ohjelmat ja opintosuunnatAvainsanatJulkaisuajatKokoelmat

Omat tiedot

Kirjaudu sisäänRekisteröidy
Kalevantie 5
PL 617
33014 Tampereen yliopisto
oa[@]tuni.fi | Tietosuoja | Saavutettavuusseloste