Tutkimusaineistojen metatiedot: Metatietojen laatu data- ja metatietoarkistoissa
Pajari, Jussi (2019)
Pajari, Jussi
2019
Informaatiotutkimuksen maisteriohjelma - Master's Degree Programme in Information Studies
Informaatioteknologian ja viestinnän tiedekunta - Faculty of Information Technology and Communication Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2020-04-15
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-202003172724
https://urn.fi/URN:NBN:fi:tuni-202003172724
Tiivistelmä
Tiedepoliittinen avoin tiede ja tutkimus -liike on muuttanut tiedepolitiikkaa ja tieteen käytäntöjä kohti läpinäkyvyyttä ja avoimuutta. Tiedepolitiikan muutos on vaikuttanut niihin tahoihin, jotka tuottavat, rahoittavat tai julkaisevat tiedettä ja tutkimusta. Uudet tieteelliset käytännöt edellyttävät tutkijoilta ja tutkimusryhmiltä yhä avoimempaa tutkimusta. Tutkimusaineistojen dokumentoiminen, avoin jakaminen ja uudelleenkäyttö on saanut paljon huomiota kansainvälisesti ja kansallisesti. Tutkimusaineistojen avoimuus, jakaminen ja uudelleenkäyttö edellyttää hyvin dokumentoitua tutkimusaineistoa. Dokumentoinnilla tarkoitetaan tutkimusaineistojen metatietojen kirjaamista. Suomessa tutkimusaineistojen metatietojen laatua ei ole aikaisemmin kartoitettu.
Tutkimusmenetelmä on tilastollinen tutkimus. Tutkimuksen näyte koostui kolme data- ja metatietoarkistoa, joiden sisältö ladattiin kokonaisuudessaan ja analysoitiin automaattisin menetelmin. Analysoinnissa käytettiin täydellisyyden ja painotetun täydellisyyden metriikkaa sekä tutkimusta varten luotua vertailumittaria, jonka avulla metriikkojen tulokset voitiin operationalisoida. Tuloksia tarkastellaan keskiarvon, keskihajonnan ja mediaanin avulla sekä luokiteltiin laatuarvojen perusteella.
Tutkimuksen tulokset ovat positiiviset. Tutkimusaineistojen metatietojen laatu oli keskimäärin hyvä suuresta hajonnasta huolimatta. Tutkittujen arkistojen keskiarvo laadun suhteen oli molemmilla metriikoilla mitattuna 80 %. Tutkimuksen avulla saatiin selville myös ongelmakohdat metatietojen tuottamisessa. Ongelmallisia metatietokenttiä ovat tutkijan tunniste, organisaatiotiedot ja asiasanat.
Tutkimusmenetelmä on tilastollinen tutkimus. Tutkimuksen näyte koostui kolme data- ja metatietoarkistoa, joiden sisältö ladattiin kokonaisuudessaan ja analysoitiin automaattisin menetelmin. Analysoinnissa käytettiin täydellisyyden ja painotetun täydellisyyden metriikkaa sekä tutkimusta varten luotua vertailumittaria, jonka avulla metriikkojen tulokset voitiin operationalisoida. Tuloksia tarkastellaan keskiarvon, keskihajonnan ja mediaanin avulla sekä luokiteltiin laatuarvojen perusteella.
Tutkimuksen tulokset ovat positiiviset. Tutkimusaineistojen metatietojen laatu oli keskimäärin hyvä suuresta hajonnasta huolimatta. Tutkittujen arkistojen keskiarvo laadun suhteen oli molemmilla metriikoilla mitattuna 80 %. Tutkimuksen avulla saatiin selville myös ongelmakohdat metatietojen tuottamisessa. Ongelmallisia metatietokenttiä ovat tutkijan tunniste, organisaatiotiedot ja asiasanat.