Datan laadun mittaaminen ja arviointi
Jokela, Aleksi (2019)
Jokela, Aleksi
2019
Tietojohtamisen DI-tutkinto-ohjelma
Tekniikan ja luonnontieteiden tiedekunta - Faculty of Engineering and Natural Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2019-10-25
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-201909283581
https://urn.fi/URN:NBN:fi:tuni-201909283581
Tiivistelmä
Dataresurssien kasvavan määrän ja monimutkaisuuden vuoksi datan laadunhallinnasta on muodostunut tärkeä menestystekijä yrityksille. Laadukkaan datan tärkeys yrityksen päätöksenteossa kasvaa, mutta samalla kasvaa myös haaste datan laadukkuuden varmistamiseksi. Dataa virtaa jatkuvasti yritykseen eri lähteistä, järjestelmistä ja käyttäjiltä, minkä myötä datan määrä kasvaa päivittäin. Datan laadun mittaamisen ymmärtämiseksi on huomioitava neljä asiaa. Miten data, laatu ja mittaaminen ymmärretään sekä miten nämä kolme ensimmäistä liittyvät toisiinsa. Näiden lisäksi tässä työssä esitetään myös arvioinnin merkitys datan laadun diagnosoinnissa.
Diplomityö toteutettiin tapaustutkimuksena suomalaiselle ICT-alan yritykselle. Tutkimuksen tarkoituksena oli selvittää, miten kohdeyrityksen datan laatua voidaan mitata ja arvioida. Tutkimuksen empiriassa käytettiin yhdistelmämenetelmää, joka viittaa määrällisten ja laadullisten tiedonkeruu- ja analysointimenetelmien hyödyntämiseen. Puolistrukturoitujen haastatteluiden avulla kerättyä laadullista ja määrällistä aineistoa trianguloitiin kohdeyrityksen tietokannasta saatavalla määrällisellä Master asiakasdatalla. Aineistojen analysoinnissa hyödynnettiin luokittelua, toistuvuuden laskemista, objektiivisia mittareita, roolien etäisyyksien analysointia ja vertailuanalyysiä. Empiriassa käytettiin Hybridi-arviointimenetelmää, johon sisällytettiin arviointitoimintoja kohdeyrityksen laatuongelmien ja tavoitteiden mukaisesti.
Tutkimuksen tuloksista saatiin numeerisen laadun tason lisäksi myös laadullisia kehitystoimenpiteitä ja haasteita. Numeeriset tulokset antoivat yleiskuvan laadun tasosta eri ulottuvuuksien avulla, kun taas laadullisten tulosten myötä pystyttiin tunnistamaan konkreettisia ongelmakohtia. Ongelmakohtia havaittiin mm. alkuvaiheen rekisteröintiprosesseissa ja avainarvojen hyödyntämisen laajuudessa. Subjektiivisen ja objektiivisen mittaamisen vertailuanalyysin tulokset olivat puolestaan yllättävän lähellä toisiaan. Tutkimuksen toteuttamisen myötä nähtiin, että Hybridi-arviointimenetelmä on potentiaalinen menetelmä datan laadun arviointiin etenkin siihen sisällytettävien arviointitoimintojen joustavuuden myötä. Due to the increasing amount and complexity of data resources, data quality management has become an important success factor for companies. The importance of high-quality data in business decision-making is growing, but at the same time, the challenge of ensuring data quality is increasing. Data is constantly flowing to the company from various sources, systems and users, increasing the amount of data every day. To understand data quality measurement, there are four things to consider. How data, quality, and measurement are understood and how the first three relate to each other. In addition to these, the importance of assessment in diagnosing data quality is also presented in this work.
Master’s thesis was conducted as a case study for a Finnish ICT-company. The objective of this research was to find out how the target company’s data quality can be measured and assessed. A combination method was used in empirical research, which refers to the utilization of quantitative and qualitative data collection and analysis methods. Qualitative and quantitative data that was collected through semi-structured interviews were triangulated with quantitative Master customer data from the target company’s database. The empirical material was analyzed using classification, recurrence calculation, objective metrics, role gap analysis, and comparison analysis. The Hybrid assessment method was utilized in empirical research, which included assessment activities related to the target company’s quality problems and objectives.
Thesis results provided numerical data quality level and qualitative development procedures and challenges. The numerical results provided an overview of the data quality level through various quality dimensions, whereas the qualitative results identified specific quality problems. Examples of issues identified were in early-stage registration processes and the extent of key-value exploitation. The comparison analysis results of the subjective and objective measurements were surprisingly close to each other. It was also seen from the thesis that the Hybrid assessment method is a potential method for data quality assessment, particularly due to the flexibility of the assessment functions which can be included in it.
Diplomityö toteutettiin tapaustutkimuksena suomalaiselle ICT-alan yritykselle. Tutkimuksen tarkoituksena oli selvittää, miten kohdeyrityksen datan laatua voidaan mitata ja arvioida. Tutkimuksen empiriassa käytettiin yhdistelmämenetelmää, joka viittaa määrällisten ja laadullisten tiedonkeruu- ja analysointimenetelmien hyödyntämiseen. Puolistrukturoitujen haastatteluiden avulla kerättyä laadullista ja määrällistä aineistoa trianguloitiin kohdeyrityksen tietokannasta saatavalla määrällisellä Master asiakasdatalla. Aineistojen analysoinnissa hyödynnettiin luokittelua, toistuvuuden laskemista, objektiivisia mittareita, roolien etäisyyksien analysointia ja vertailuanalyysiä. Empiriassa käytettiin Hybridi-arviointimenetelmää, johon sisällytettiin arviointitoimintoja kohdeyrityksen laatuongelmien ja tavoitteiden mukaisesti.
Tutkimuksen tuloksista saatiin numeerisen laadun tason lisäksi myös laadullisia kehitystoimenpiteitä ja haasteita. Numeeriset tulokset antoivat yleiskuvan laadun tasosta eri ulottuvuuksien avulla, kun taas laadullisten tulosten myötä pystyttiin tunnistamaan konkreettisia ongelmakohtia. Ongelmakohtia havaittiin mm. alkuvaiheen rekisteröintiprosesseissa ja avainarvojen hyödyntämisen laajuudessa. Subjektiivisen ja objektiivisen mittaamisen vertailuanalyysin tulokset olivat puolestaan yllättävän lähellä toisiaan. Tutkimuksen toteuttamisen myötä nähtiin, että Hybridi-arviointimenetelmä on potentiaalinen menetelmä datan laadun arviointiin etenkin siihen sisällytettävien arviointitoimintojen joustavuuden myötä.
Master’s thesis was conducted as a case study for a Finnish ICT-company. The objective of this research was to find out how the target company’s data quality can be measured and assessed. A combination method was used in empirical research, which refers to the utilization of quantitative and qualitative data collection and analysis methods. Qualitative and quantitative data that was collected through semi-structured interviews were triangulated with quantitative Master customer data from the target company’s database. The empirical material was analyzed using classification, recurrence calculation, objective metrics, role gap analysis, and comparison analysis. The Hybrid assessment method was utilized in empirical research, which included assessment activities related to the target company’s quality problems and objectives.
Thesis results provided numerical data quality level and qualitative development procedures and challenges. The numerical results provided an overview of the data quality level through various quality dimensions, whereas the qualitative results identified specific quality problems. Examples of issues identified were in early-stage registration processes and the extent of key-value exploitation. The comparison analysis results of the subjective and objective measurements were surprisingly close to each other. It was also seen from the thesis that the Hybrid assessment method is a potential method for data quality assessment, particularly due to the flexibility of the assessment functions which can be included in it.