Datan laadun hallinta sähköverkon käyttötoiminnassa
Kontro, Teemu (2021)
Kontro, Teemu
2021
Tietojohtamisen DI-ohjelma - Master's Programme in Information and Knowledge Management
Tekniikan ja luonnontieteiden tiedekunta - Faculty of Engineering and Natural Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2021-10-12
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-202109287317
https://urn.fi/URN:NBN:fi:tuni-202109287317
Tiivistelmä
Datan määrä on kasvanut jatkuvasti datalähteiden määrän ja tallennusratkaisujen kehityksen myötä. Samalla datan laatu on muuttunut entistä tärkeämmäksi liiketoiminnassa, sillä virheellinen data voi aiheuttaa merkittäviä kustannuksia, heikentää organisaation mainetta tai hankaloittaa strategiatyötä. Lisäksi työntekijät käyttävät nykyään merkittävän osan ajastaan erilaisten poikkeamien korjaamiseen. Myös tietojärjestelmäpohjaiset automaatiohankkeet vaativat toimiakseen laadukasta dataa, sillä ihmiset eivät enää valvo kaikkia prosessin vaiheita.
Tämän tutkimuksen tarkoituksena oli perehtyä Fingrid Oyj:n kantaverkon käyttö- ja tiladatan laatuongelmiin sekä tarjota niihin kehitysehdotuksia aiemman kirjallisuuden pohjalta. Työ koostuu kirjallisuuskatsauksesta ja empiirisestä osiosta. Kirjallisuuskatsauksessa käytiin läpi datan laadun määrittelyä ulottuvuuksien kautta, datan laadun arviointimenetelmiä, datan hallinnointia, datan laatuun liittyviä haasteita sekä kehitysmenetelmiä. Empiirinen osuus koostui laadullisesta haastattelututkimuksesta, jonka aineistoa tarkasteltiin sisällönanalyysillä. Haastattelurungon pohjana hyödynnettiin AIMQ-arviointimenetelmän laatu-ulottuvuuksia ja väittämiä. Aineistossa korostuvat ongelmat jaoteltiin sisällön perusteella viiteen pääteemaan, joiden sisällä tarkasteltiin myös ongelmien keskinäisiä suhteita. Havaittuja ongelmia peilattiin kirjallisuudessa aiemmin tunnistettuihin ongelmiin, ja kohdeorganisaation datan laadun kypsyyttä arvioitiin kirjallisuudessa esitettyjen mallien avulla. Lopulta organisaatiolle muotoiltiin viisi erillistä kehitystoimenpideehdotusta.
Haastatteluaineistosta nousi esiin viisi pääteemaa ongelmien aiheuttajana: hajautettu järjestelmäarkkitehtuuri, tietovaraston ja raportoinnin vajaakäyttö, mittarien ja valvonnan puute, datan hallinnointi ja yleiset käytännöt sekä verkonhallinnan toiminnanohjausjärjestelmä. Hajautetut järjestelmät vaikeuttavat datan saatavuutta pilkkomalla sitä useaan eri järjestelmään sekä pakottamalla siirtelemään tietoa järjestelmien välillä, jolloin tiedonsiirtokatkokset aiheuttavat ongelmia. Tietovaraston laajamittaisempi hyödyntäminen helpottaisi saatavuutta ja tiedon visualisointia sekä raportointia, mutta työntekijät eivät ole tietoisia tästä mahdollisuudesta tai tietovaraston päivitystahti on liian hidas käyttäjien tarkoituksiin. Mittarien ja valvonnan puute luo epätietoisuutta datan käyttäjien keskuudessa, sillä datan laadusta ei ole takeita ja virheitä on usein huomattu viiveellä. Datan hallinnointia varten kohdeorganisaatiossa on käytössä datanhallintamalli, jonka jalkautus on kuitenkin vielä kesken ja nimetyt tietovastaavat eivät ota proaktiivisesti vastuuta datan laadusta. Verkonhallinnan tietojärjestelmä on käyttäjien mielestä sekava ja hidas, ja lisäksi sen sisältämissä tiedoissa on puutteita ainakin henkilö- ja laitetietojen osalta.
Datan laadun kehittämistä voi lähestyä joko proaktiivisesti tai reaktiivisesti. Proaktiivisessa strategiassa virheiden syntyminen pyritään ehkäisemään ennalta havaitsemalla ja poistamalla ongelmien juurisyitä. Mikäli tämä ei ole mahdollista, voidaan turvautua reaktiiviseen strategiaan eli virheiden korjaamiseen jälkikäteen. Fingridin käyttötoiminnan tapauksessa liiketoimintakriittinen tieto on valtaosin automaattisten mittausten tuottamaa sekä poikkeuksellisen nopeasti uusiutuvaa, joten perinteiset korjaus- ja kehitysmenetelmät eivät ole aina tarkoituksenmukaisia. Kehitystoimenpiteiksi kohdeorganisaatiolle ehdotetaan aktiivisempaa datan laadun valvontaa, datan keskittämistä, tietovirtojen dokumentointia, datanhallintamallin jalkautusta sekä verkko-omaisuusdatan puutteiden korjaamista. The amount of data has grown steadily due to increasing number of data sources and the development of storage solutions. At the same time, data quality has become increasingly important in business, as erroneous data can incur significant costs, damage an organization’s reputation, or hinder strategy implementation. In addition, employees now spend a significant portion of their time correcting various anomalies. Automation of information system processes requires high quality data to function, as people are no longer monitoring all phases of the process.
The purpose of this study is to get acquainted with the quality problems of Fingrid Oyj's power system operations and status data and to offer development proposals based on existing literature. The work consists of a literature review and an empirical section. The literature review covered the definition of data quality through dimensions, data quality assessment methods, data governance, data quality challenges and improvement methods. The empirical part consisted of a qualitative interview study based on the survey included in the AIMQ assessment methodology. The interview material was examined using content analysis. The problems highlighted in the material were divided into five main themes based on the content, within which the interrelationships of the problems were also examined. The observed problems were mirrored to the problems previously identified in the literature, and the maturity of the data quality of the target organization was assessed using models presented in the literature. In the end, five separate proposals for development measures were formulated for the organization.
Five main root cause themes emerged from the interview material: fragmented system architecture, underutilization of data warehousing and reporting, lack of metrics and controls, data governance and common practices, and the grid control ERP system. Fragmented systems make it difficult to access data by splitting it into several different systems and forcing data migration between systems, which increases the risk of data transmission failures. Better utilization of the data warehouse would provide better access to data and facilitate data visualization and reporting, but either the employees are not aware of this possibility, or the refresh cycle of the data warehouse is too slow for their needs. The lack of metrics and controls creates uncertainty among data users, as there are no guarantees about data quality and error detection is often delayed. The target organization has a data governance model in place, but it still in the implementation phase and the designated data stewards do not proactively take responsibility for the quality of the data. The network management information system is perceived by users as confusing and slow, and in addition there are flaws in the device and personnel data it contains.
Data quality development can be approached either proactively or reactively. The proactive strategy seeks to prevent errors from occurring by identifying and eliminating the root causes of the data quality problems. If this is not possible, a reactive strategy can be used, i.e., correcting errors afterwards. In the case of Fingrid's power system operations, business-critical information regenerates in a rapid rate in addition to being largely generated by automatic measurements, hence traditional repair and improvement methods are not always appropriate. The proposed development measures for the target organization include more active data quality control, data centralization, documentation of data flows, practical implementation of their data management model and correction of deficiencies in grid asset data.
Tämän tutkimuksen tarkoituksena oli perehtyä Fingrid Oyj:n kantaverkon käyttö- ja tiladatan laatuongelmiin sekä tarjota niihin kehitysehdotuksia aiemman kirjallisuuden pohjalta. Työ koostuu kirjallisuuskatsauksesta ja empiirisestä osiosta. Kirjallisuuskatsauksessa käytiin läpi datan laadun määrittelyä ulottuvuuksien kautta, datan laadun arviointimenetelmiä, datan hallinnointia, datan laatuun liittyviä haasteita sekä kehitysmenetelmiä. Empiirinen osuus koostui laadullisesta haastattelututkimuksesta, jonka aineistoa tarkasteltiin sisällönanalyysillä. Haastattelurungon pohjana hyödynnettiin AIMQ-arviointimenetelmän laatu-ulottuvuuksia ja väittämiä. Aineistossa korostuvat ongelmat jaoteltiin sisällön perusteella viiteen pääteemaan, joiden sisällä tarkasteltiin myös ongelmien keskinäisiä suhteita. Havaittuja ongelmia peilattiin kirjallisuudessa aiemmin tunnistettuihin ongelmiin, ja kohdeorganisaation datan laadun kypsyyttä arvioitiin kirjallisuudessa esitettyjen mallien avulla. Lopulta organisaatiolle muotoiltiin viisi erillistä kehitystoimenpideehdotusta.
Haastatteluaineistosta nousi esiin viisi pääteemaa ongelmien aiheuttajana: hajautettu järjestelmäarkkitehtuuri, tietovaraston ja raportoinnin vajaakäyttö, mittarien ja valvonnan puute, datan hallinnointi ja yleiset käytännöt sekä verkonhallinnan toiminnanohjausjärjestelmä. Hajautetut järjestelmät vaikeuttavat datan saatavuutta pilkkomalla sitä useaan eri järjestelmään sekä pakottamalla siirtelemään tietoa järjestelmien välillä, jolloin tiedonsiirtokatkokset aiheuttavat ongelmia. Tietovaraston laajamittaisempi hyödyntäminen helpottaisi saatavuutta ja tiedon visualisointia sekä raportointia, mutta työntekijät eivät ole tietoisia tästä mahdollisuudesta tai tietovaraston päivitystahti on liian hidas käyttäjien tarkoituksiin. Mittarien ja valvonnan puute luo epätietoisuutta datan käyttäjien keskuudessa, sillä datan laadusta ei ole takeita ja virheitä on usein huomattu viiveellä. Datan hallinnointia varten kohdeorganisaatiossa on käytössä datanhallintamalli, jonka jalkautus on kuitenkin vielä kesken ja nimetyt tietovastaavat eivät ota proaktiivisesti vastuuta datan laadusta. Verkonhallinnan tietojärjestelmä on käyttäjien mielestä sekava ja hidas, ja lisäksi sen sisältämissä tiedoissa on puutteita ainakin henkilö- ja laitetietojen osalta.
Datan laadun kehittämistä voi lähestyä joko proaktiivisesti tai reaktiivisesti. Proaktiivisessa strategiassa virheiden syntyminen pyritään ehkäisemään ennalta havaitsemalla ja poistamalla ongelmien juurisyitä. Mikäli tämä ei ole mahdollista, voidaan turvautua reaktiiviseen strategiaan eli virheiden korjaamiseen jälkikäteen. Fingridin käyttötoiminnan tapauksessa liiketoimintakriittinen tieto on valtaosin automaattisten mittausten tuottamaa sekä poikkeuksellisen nopeasti uusiutuvaa, joten perinteiset korjaus- ja kehitysmenetelmät eivät ole aina tarkoituksenmukaisia. Kehitystoimenpiteiksi kohdeorganisaatiolle ehdotetaan aktiivisempaa datan laadun valvontaa, datan keskittämistä, tietovirtojen dokumentointia, datanhallintamallin jalkautusta sekä verkko-omaisuusdatan puutteiden korjaamista.
The purpose of this study is to get acquainted with the quality problems of Fingrid Oyj's power system operations and status data and to offer development proposals based on existing literature. The work consists of a literature review and an empirical section. The literature review covered the definition of data quality through dimensions, data quality assessment methods, data governance, data quality challenges and improvement methods. The empirical part consisted of a qualitative interview study based on the survey included in the AIMQ assessment methodology. The interview material was examined using content analysis. The problems highlighted in the material were divided into five main themes based on the content, within which the interrelationships of the problems were also examined. The observed problems were mirrored to the problems previously identified in the literature, and the maturity of the data quality of the target organization was assessed using models presented in the literature. In the end, five separate proposals for development measures were formulated for the organization.
Five main root cause themes emerged from the interview material: fragmented system architecture, underutilization of data warehousing and reporting, lack of metrics and controls, data governance and common practices, and the grid control ERP system. Fragmented systems make it difficult to access data by splitting it into several different systems and forcing data migration between systems, which increases the risk of data transmission failures. Better utilization of the data warehouse would provide better access to data and facilitate data visualization and reporting, but either the employees are not aware of this possibility, or the refresh cycle of the data warehouse is too slow for their needs. The lack of metrics and controls creates uncertainty among data users, as there are no guarantees about data quality and error detection is often delayed. The target organization has a data governance model in place, but it still in the implementation phase and the designated data stewards do not proactively take responsibility for the quality of the data. The network management information system is perceived by users as confusing and slow, and in addition there are flaws in the device and personnel data it contains.
Data quality development can be approached either proactively or reactively. The proactive strategy seeks to prevent errors from occurring by identifying and eliminating the root causes of the data quality problems. If this is not possible, a reactive strategy can be used, i.e., correcting errors afterwards. In the case of Fingrid's power system operations, business-critical information regenerates in a rapid rate in addition to being largely generated by automatic measurements, hence traditional repair and improvement methods are not always appropriate. The proposed development measures for the target organization include more active data quality control, data centralization, documentation of data flows, practical implementation of their data management model and correction of deficiencies in grid asset data.