Hyppää sisältöön
    • Suomeksi
    • In English
Trepo
  • Suomeksi
  • In English
  • Kirjaudu
Näytä viite 
  •   Etusivu
  • Trepo
  • Opinnäytteet - ylempi korkeakoulututkinto
  • Näytä viite
  •   Etusivu
  • Trepo
  • Opinnäytteet - ylempi korkeakoulututkinto
  • Näytä viite
JavaScript is disabled for your browser. Some features of this site may not work without it.

Residual neural network in the identification of rare diseases

Ryyppö, Rasmus (2021)

 
Avaa tiedosto
RyyppöRasmus.pdf (2.706Mt)
Lataukset: 



Ryyppö, Rasmus
2021

Master's Programme in Computing Sciences
Informaatioteknologian ja viestinnän tiedekunta - Faculty of Information Technology and Communication Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2021-11-23
Näytä kaikki kuvailutiedot
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-202111208546
Tiivistelmä
Rare diseases are difficult to identify and it may require years and multitude of different doctors to reach the correct diagnosis. Machine learning could be the answer to get correct diagnosis faster and that way improve patients’ quality of life.
In this thesis, the objective was to implement residual neural network model that could assist in the early identification of the vasculitides, myositides and glomerulonephritides. Average prevalence in 100000 people for vasculitides is 5 persons, for myositides it is 10.5 persons, and for glomerulonephritides it is 1.6 persons. If we would pick randomly people for testing, estimated probability for vasculitides would be 0.005%, for myositides it would be 0.0105% and for glomerulonephritides it would be 0.0016%.
We found that for this purpose and with the data that Helsinki University Hospital provided, the most suitable model was the Inception type model. The constructed Inception type model performed robustly and over the expectations. The best results obtained showed that it could identify individual rare diseases from each other and from healthy controls almost six years before the initial diagnosis. Positive predictive value in this model for vasculitides was 0.2% and myositides and glomerulonephritides had 0.3%. Situation where patient has any of these diseases, positive predictive value was 6%. Classification accuracy of vasculitides was 42%, myositides was 45%, glomerulonephritides was 65%, and the control was 80%.
The Inception type model was compared against state-of-the-art models such as ResNet18, InceptionTime and XGBoost. Resnet18 and InceptionTime models were not suitable for this situation. This could be due the combination of sparse data and global pooling method. XGBoost on the other hand produced excellent results. The best results for early identification were received with one month before the initial diagnosis. Positive predictive value for vasculitides was 0.6%, myositides was 1% and in glomerulonephritides 0.5%. In the situation where patient has any of these diseases 8.8% was reached. Classification accuracy of vasculitides was 35%, myositides was 30%, glomerulonephritides was 83% and controls was 89%.
In the end, the early identification of rare diseases could be reached considerably earlier with either of these models. Since all these diseases are potentially rapidly fatal, and since once complications start to appear these rapidly lead into expensive supportive measures like intensive care, home care and dialysis, the potential individual and societal effect of reaching earlier diagnosis could be mutually beneficial to all, patients, society and healthcare.
 
Harvinaiset sairaudet ovat vaikeita tunnistaa, oikean diagnoosin tunnistaminen voi kestää useita vuosia ja vaatia monia eri lääkäreitä. Koneoppiminen voisi olla ratkaisu nopeampaan diagnosointiin ja siten myös potilaan elämänlaadun parantamiseen.
Tämän pro gradu -tutkielman tavoite oli implementoida residuaalineuroverkko -malli, joka voisi avustaa vaskuliittien, myosiittien ja glomerulonefriittien varhaisessa tunnistamisessa. Keskimäärin esiintyvyys 100000 ihmisen joukossa vaskuliiteilla on 5.0 henkilö, myosiiteilla se on 10.5 henkilöä ja glomerulonefriiteillä se on 1.6 henkilö. Jos valitsisimme satunnaisesti henkilöitä testeihin, arvioitu todennäköisyys vaskuliiteille olisi 0.005%, myosiiteille 0.0105% ja glomerulonefriiteille se oli 0.0016%.
Havaittiin, että tähän tarkoitukseen Helsingin yliopistollisen sairaalan tarjoaman datan kanssa soveltuvin malli oli Inception -tyyppinen malli. Rakennettu Inception -tyyppinen malli suoriutui todella hyvin ja yli odotusten. Parhaimmat saavutetut tulokset näyttävät, että malli onnistui tunnistamaan harvinaissairaudet toisistaan ja terveistä henkilöistä noin kuusi vuotta ennen alkuperäistä diagnoosia. Positiivinen ennustearvo tällä mallilla oli vaskuliiteille 0.2%, ja myosiitteille ja glomerulonefriiteille saatiin 0.3%. Tilanteessa, jossa tarkasteltiin, että olisiko potilaalla jokin näiden sairaustyhmien sairaus, positiivinen ennustearvo oli 6%. Luokittelutarkkuus vaskuliiteilla oli 42%, myosiiteilla 45%, glomerulonefriiteillä 65% ja kontrolleilla 80%.
Inception -tyyppistä mallia vertailtiin yleisesti parhaimmiksi katsottuihin malleihin kuten ResNet18, InceptionTime ja XGBoost. ResNet18 ja InceptionTime mallit eivät soveltuneet tähän tarkoitukseen, mikä saattoi johtua harvan datan ja globaalin yhdistämismenetelmän yhdistelmästä. XGBoost toisaalta tuotti huomattavan hyvät tulokset. Parhaat tulokset aikaiseen tunnistamiseen saatiin kuukausi ennen toteutunutta diagnoosia. Positiivinen ennustearvo vaskuliiteille oli 0.6%, myosiiteille 1% ja glomerulonefriiteille 0.5%. Tilanteessa, jossa tarkasteltiin, oliko potilaalla jokin sairaus näistä sairausryhmistä, saavutettiin 8.8%. Luokittelutarkkuus vaskuliiteilla oli 35%, myosiiteilla 30%, glomerulonefriiteilla 83% ja kontrolleilla 89%.
Lopulta voitiin todeta, että harvinaissairauksien tunnistaminen onnistui paljon aikaisemmin näillä molemmilla malleilla. Näiden sairauksien ollessa potentiaalisesti nopeasti kohtalokkaita ja komplikaatioiden esiintyessä johtavat nopeasti kalliisiin tukitoimenpiteisiin, kuten teho-, koti- ja dialyysihoitoon, varhaisen diagnoosin potentiaaliset yksilölliset ja yhteiskunnalliset vaikutukset voivat olla molemminpuolisesti hyödyllisiä kaikille, potilaille, yhteiskunnalle ja terveydenhuollolle.
 
Kokoelmat
  • Opinnäytteet - ylempi korkeakoulututkinto [40596]
Kalevantie 5
PL 617
33014 Tampereen yliopisto
oa[@]tuni.fi | Tietosuoja | Saavutettavuusseloste
 

 

Selaa kokoelmaa

TekijätNimekkeetTiedekunta (2019 -)Tiedekunta (- 2018)Tutkinto-ohjelmat ja opintosuunnatAvainsanatJulkaisuajatKokoelmat

Omat tiedot

Kirjaudu sisäänRekisteröidy
Kalevantie 5
PL 617
33014 Tampereen yliopisto
oa[@]tuni.fi | Tietosuoja | Saavutettavuusseloste