Time series foundation models for emergency department forecasting
Järvi, Valtti (2025)
Järvi, Valtti
2025
Tieto- ja sähkötekniikan kandidaattiohjelma - Bachelor's Programme in Computing and Electrical Engineering
Informaatioteknologian ja viestinnän tiedekunta - Faculty of Information Technology and Communication Sciences
Hyväksymispäivämäärä
2025-12-10
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-2025120911384
https://urn.fi/URN:NBN:fi:tuni-2025120911384
Tiivistelmä
Emergency department crowding compromises patient safety and operational efficiency. Accurate occupancy forecasting enables proactive resource allocation. This thesis evaluates whether time series foundation models can accurately forecast emergency department occupancy in a zero-shot setting. This capability would eliminate the computational costs and manual effort required to train traditional machine learning models. This thesis compares five open-source foundation models (TimesFM, Chronos, Sundial, Moirai, and TiRex) against state-of-the-art baseline machine learning models using emergency department occupancy data from Tampere University Hospital. The foundation models are evaluated precisely on the same data as state-of-the-art models were evaluated for direct comparison. The thesis assesses predictive performance, the impact of historical context length and external covariates, and computational requirements. The results show that univariate foundation models, particularly TimesFM, TiRex, and Sundial, outperform the best previous baseline when provided with sufficient historical context. Increasing context length consistently improved accuracy up to the maximum possible context length of 12,840 hours. However, Moirai, the only model capable of processing multivariate data, failed to benefit from external covariates. Computationally, all models demonstrated fast inference times and low memory usage. These findings suggest that zero-shot foundation models offer a viable, scalable alternative to traditional forecasting methods for emergency department crowding management.
Päivystyspoliklinikoiden ruuhkautuminen vaarantaa potilasturvallisuuden ja heikentää toiminnan kustannustehokkuutta. Tarkka kuormituksen ennustaminen mahdollistaisi resurssien kohdentamisen ennakoivasti. Tässä työssä arvioidaan, pystyvätkö esikoulutetut aikasarjamallit ennustamaan päivystyksen potilasmääriä ilman mallin erillistä kouluttamista historiallisen potilasdatan avulla. Tämä kyvykkyys poistaisi perinteisten koneoppimismallien kouluttamiseen vaadittavat laskennalliset kustannukset ja manuaalisen työn. Tässä työssä vertaillaan viittä avoimen lähdekoodin perustamallia (TimesFM, Chronos, Sundial, Moirai ja TiRex) suorituskyvyltään edistyksellisimpiin koneoppimismalleihin käyttäen Tampereen yliopistollisen sairaalan päivystyksen kuormitusdataa. Vertailukelpoisuuden saavuttamiseksi esikoulutetut mallit arvioidaan käyttämällä samaa dataa kuin vertailumallien arvioimiseen käytettiin. Tutkimuksessa arvioidaan ennustetarkkuutta, historiatietojen pituuden ja ulkoisten muuttujien vaikutusta, sekä laskennallisia vaatimuksia. Tulokset osoittavat, että yhden muuttujan perusmallit, erityisesti TimesFM, TiRex ja Sundial, suoriutuvat paremmin kuin paras aiempi vertailumalli, kun niille syötetään riittävästi historiallista aikasarjadataa. Aikasarjadatan pidentäminen paransi tarkkuutta johdonmukaisesti aina suurimpaan mahdolliseen 12 840 tunnin pituuteen asti. Ainoa monimuuttujadataa tukeva malli, Moirai, ei kyennyt hyödyntämään ulkoisia muuttujia. Laskennallisesti kaikkien mallien laskenta-ajat ja muistinkäyttö ovat kohtuullisella tasolla nykyaikaisille tietokoneille. Tulokset viittaavat siihen, että perustamallit tarjoavat varteenotettavan ja skaalautuvan vaihtoehdon perinteisille ennustusmenetelmille päivystyksen ruuhkautumisen hallinnassa.
Päivystyspoliklinikoiden ruuhkautuminen vaarantaa potilasturvallisuuden ja heikentää toiminnan kustannustehokkuutta. Tarkka kuormituksen ennustaminen mahdollistaisi resurssien kohdentamisen ennakoivasti. Tässä työssä arvioidaan, pystyvätkö esikoulutetut aikasarjamallit ennustamaan päivystyksen potilasmääriä ilman mallin erillistä kouluttamista historiallisen potilasdatan avulla. Tämä kyvykkyys poistaisi perinteisten koneoppimismallien kouluttamiseen vaadittavat laskennalliset kustannukset ja manuaalisen työn. Tässä työssä vertaillaan viittä avoimen lähdekoodin perustamallia (TimesFM, Chronos, Sundial, Moirai ja TiRex) suorituskyvyltään edistyksellisimpiin koneoppimismalleihin käyttäen Tampereen yliopistollisen sairaalan päivystyksen kuormitusdataa. Vertailukelpoisuuden saavuttamiseksi esikoulutetut mallit arvioidaan käyttämällä samaa dataa kuin vertailumallien arvioimiseen käytettiin. Tutkimuksessa arvioidaan ennustetarkkuutta, historiatietojen pituuden ja ulkoisten muuttujien vaikutusta, sekä laskennallisia vaatimuksia. Tulokset osoittavat, että yhden muuttujan perusmallit, erityisesti TimesFM, TiRex ja Sundial, suoriutuvat paremmin kuin paras aiempi vertailumalli, kun niille syötetään riittävästi historiallista aikasarjadataa. Aikasarjadatan pidentäminen paransi tarkkuutta johdonmukaisesti aina suurimpaan mahdolliseen 12 840 tunnin pituuteen asti. Ainoa monimuuttujadataa tukeva malli, Moirai, ei kyennyt hyödyntämään ulkoisia muuttujia. Laskennallisesti kaikkien mallien laskenta-ajat ja muistinkäyttö ovat kohtuullisella tasolla nykyaikaisille tietokoneille. Tulokset viittaavat siihen, että perustamallit tarjoavat varteenotettavan ja skaalautuvan vaihtoehdon perinteisille ennustusmenetelmille päivystyksen ruuhkautumisen hallinnassa.
Kokoelmat
- Kandidaatintutkielmat [11031]
