Tietopankki apuna datatieteellisten projektien toistettavuudessa
Halonen, Juuso (2023)
Halonen, Juuso
2023
Tietojohtamisen DI-ohjelma - Master's Programme in Information and Knowledge Management
Johtamisen ja talouden tiedekunta - Faculty of Management and Business
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2023-05-15
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-202305075376
https://urn.fi/URN:NBN:fi:tuni-202305075376
Tiivistelmä
Datamäärien kasvu ja analytiikan monimutkaistuminen ovat vaikeuttaneet datatieteellisten projektien toistettavuutta. Huono toistettavuus hidastaa uusien projektien toteuttamista ja vaikeuttaa tiedon säilyttämistä ja oppimista aiemmista projekteista. Toistettavuus hankaloituu, kun projektin etenemisen aikana tehdyistä valinnoista ja päätöksistä ei ole koottu tietoa. Ongelma kiteytyy tiedon heikkoon jakamiseen ja uudelleenkäyttöön, minkä vuoksi tietämyksenhallinta on toistettavuushaasteen äärellä keskeistä. Tietopankit ovat yksi tietämyksenhallinnan keino ratkaista edellä mainittuja ongelmia. Toistettavuushaasteen ratkaisulla voidaan mahdollistaa myös datatieteellisiä projekteja toteuttavan yrityksen liiketoiminnan kasvu.
Tässä tutkimuksessa selvitettiin, millaisen tietopankin avulla datatieteellisten projektien toistettavuutta lisätään. Tutkimuksen toteutustapa oli laadullinen tutkimus. Tutkimus tehtiin tapaustutkimuksena datatieteellisiä projekteja toteuttavan yrityksen kontekstissa teemahaastattelujen avulla. Haastateltavat olivat yrityksen työntekijöitä sekä potentiaalisia tietopankin käyttäjiä.
Tutkimuksen perusteella havaittiin, että datatieteellisten projektien toistettavuuden mahdollistaa tietopankki, joka sisältää projektiin tarvittavia resursseja eri abstraktiotasoilla. Lisäksi tietopankkiin tulee toteuttaa käyttöä tukevia ominaisuuksia kuten hakutoiminto sekä versionhallinta, ja tietopankin käyttö tulee olla huomioitu datatieteellisessä prosessimallissa.
Tässä tutkimuksessa selvitettiin, millaisen tietopankin avulla datatieteellisten projektien toistettavuutta lisätään. Tutkimuksen toteutustapa oli laadullinen tutkimus. Tutkimus tehtiin tapaustutkimuksena datatieteellisiä projekteja toteuttavan yrityksen kontekstissa teemahaastattelujen avulla. Haastateltavat olivat yrityksen työntekijöitä sekä potentiaalisia tietopankin käyttäjiä.
Tutkimuksen perusteella havaittiin, että datatieteellisten projektien toistettavuuden mahdollistaa tietopankki, joka sisältää projektiin tarvittavia resursseja eri abstraktiotasoilla. Lisäksi tietopankkiin tulee toteuttaa käyttöä tukevia ominaisuuksia kuten hakutoiminto sekä versionhallinta, ja tietopankin käyttö tulee olla huomioitu datatieteellisessä prosessimallissa.