Hitaasti muuttuvat dimensiotyypit tietovarastoinnissa: hyödyt ja haasteet : Systemaattinen kirjallisuuskatsaus
Puuska, Roosa (2025)
Puuska, Roosa
2025
Tietotekniikan DI-ohjelma - Master's Programme in Information Technology
Informaatioteknologian ja viestinnän tiedekunta - Faculty of Information Technology and Communication Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2025-11-25
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-2025112410857
https://urn.fi/URN:NBN:fi:tuni-2025112410857
Tiivistelmä
Tietovarastoissa käytetyissä dimensiomalleissa on attribuutteja, joiden arvot muuttuvat pitkällä aikavälillä hitaasti ja satunnaisesti. Näitä attribuutteja kutsutaan hitaasti muuttuviksi dimensioiksi. Jotta datan laatu voidaan säilyttää oikeana, tulee näitä hitaasti muuttuvia attribuutteja hallita oikein. Hallintamenetelmiksi on luotu erilaisia hitaasti muuttuvia dimensiotyyppejä (SCD-tyyppejä), jotka käsittelevät muutoksia erilaisin keinoin. Perustyyppien lisäksi on luotu myös hybridityyppejä, jotka yhdistelevät perustyyppien ominaisuuksia eri tavoin, pyrkien minimoimaan perustyypeissä tunnistetut rajoitteet. Tutkimuksen tarkoituksena on kartoittaa kokonaiskuvaa tunnettujen SCD-tyyppien nykytutkimuksen tilasta ja arvioida niiden soveltuvuutta erilaisiin käyttötarkoituksiin. Työ toteutetaan systemaattisena kirjallisuuskatsauksena.
Työn menetelmäosiossa kuvataan systemaattinen rajausprosessi vaiheittain, mukaan lukien lähteiden valintaperusteet ja rajauskriteerit. Prosessin lopputuloksena esitetään valitut lähteet, jotka muodostavat tutkimuksen aineiston. Tulokset kootaan taulukkomuotoon, mikä mahdollistaa havaintojen selkeän vertailun ja analysoinnin. Pohdinta-osiossa tarkastellaan aihetta sekä tulosten näkökulmasta että koko tutkimusprosessin aikana esiin nousseiden havaintojen ja rajoitteiden kautta.
Tuloksia käsitellessä havaitaan, että yleisin SCD-tyyppi on tyyppi 2, joka tarjoaa mahdollisuuden säilyttää attribuutin täydellinen historia luomalla uuden rivin jokaiselle muutokselle. Tämän tyypin tärkein ominaisuus on keinoavain, jonka avulla pystytään säilyttämään ajantasainen tieto faktataulussa. Yleistyksenä voidaan todeta, että historiatiedon säilyttäminen on keskeinen tekijä SCD-tyyppien valinnassa, sillä se mahdollistaa tarkat ajalliset analyysit ja raportoinnin tapahtumahetken arvoilla. Hybridityypeillä (SCD-tyypit 5–7) on vähemmän kriittisiä haasteita kuin perustyypeillä (SCD-tyypit 0–4), koska ne on suunniteltu yhdistämään eri perustyyppien vahvuuksia ja vähentämään niiden rajoitteita hyödyntämällä toisen tyypin tarjoamia etuja. Ne tarjoavat joustavuutta yhdistämällä historiatiedon ja nopean raportoinnin, mutta lisäävät rakenteen ja prosessien monimutkaisuutta, mikä edellyttää tarkkaa avainten hallintaa ja käyttäjien syvällistä ymmärrystä.
Työ tarjoaa kattavan kokonaiskuvan tunnistetuista hitaasti muuttuvista dimensiotyypeistä sekä niiden käyttöön liittyvistä hyödyistä ja haasteista. Lisäksi tutkimus avaa SCD-tyyppeihin liittyvän nykytutkimuksen tilaa ja tuo esiin mahdollisia ristiriitoja aiemmissa tutkimuksissa. Näin työ luo pohjan syvemmälle ymmärrykselle siitä, miten eri ratkaisut vaikuttavat tietovarastoinnin laatuun, raportoinnin tarkkuuteen ja järjestelmien suorituskykyyn.
Työn menetelmäosiossa kuvataan systemaattinen rajausprosessi vaiheittain, mukaan lukien lähteiden valintaperusteet ja rajauskriteerit. Prosessin lopputuloksena esitetään valitut lähteet, jotka muodostavat tutkimuksen aineiston. Tulokset kootaan taulukkomuotoon, mikä mahdollistaa havaintojen selkeän vertailun ja analysoinnin. Pohdinta-osiossa tarkastellaan aihetta sekä tulosten näkökulmasta että koko tutkimusprosessin aikana esiin nousseiden havaintojen ja rajoitteiden kautta.
Tuloksia käsitellessä havaitaan, että yleisin SCD-tyyppi on tyyppi 2, joka tarjoaa mahdollisuuden säilyttää attribuutin täydellinen historia luomalla uuden rivin jokaiselle muutokselle. Tämän tyypin tärkein ominaisuus on keinoavain, jonka avulla pystytään säilyttämään ajantasainen tieto faktataulussa. Yleistyksenä voidaan todeta, että historiatiedon säilyttäminen on keskeinen tekijä SCD-tyyppien valinnassa, sillä se mahdollistaa tarkat ajalliset analyysit ja raportoinnin tapahtumahetken arvoilla. Hybridityypeillä (SCD-tyypit 5–7) on vähemmän kriittisiä haasteita kuin perustyypeillä (SCD-tyypit 0–4), koska ne on suunniteltu yhdistämään eri perustyyppien vahvuuksia ja vähentämään niiden rajoitteita hyödyntämällä toisen tyypin tarjoamia etuja. Ne tarjoavat joustavuutta yhdistämällä historiatiedon ja nopean raportoinnin, mutta lisäävät rakenteen ja prosessien monimutkaisuutta, mikä edellyttää tarkkaa avainten hallintaa ja käyttäjien syvällistä ymmärrystä.
Työ tarjoaa kattavan kokonaiskuvan tunnistetuista hitaasti muuttuvista dimensiotyypeistä sekä niiden käyttöön liittyvistä hyödyistä ja haasteista. Lisäksi tutkimus avaa SCD-tyyppeihin liittyvän nykytutkimuksen tilaa ja tuo esiin mahdollisia ristiriitoja aiemmissa tutkimuksissa. Näin työ luo pohjan syvemmälle ymmärrykselle siitä, miten eri ratkaisut vaikuttavat tietovarastoinnin laatuun, raportoinnin tarkkuuteen ja järjestelmien suorituskykyyn.
