Avoimen datan käyttö ohjelmistokehityksessä
Kallioniemi, Jere (2021)
Kallioniemi, Jere
2021
Tietojenkäsittelytieteiden kandidaattiohjelma - Bachelor's Programme in Computer Sciences
Informaatioteknologian ja viestinnän tiedekunta - Faculty of Information Technology and Communication Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2021-05-19
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-202105054458
https://urn.fi/URN:NBN:fi:tuni-202105054458
Tiivistelmä
Julkiset tahot ovat alkaneet julkaista dataansa suurissa määrin avoimeen käyttöön, ja tätä myötä avoimen datan käyttö on yleistynyt huomattavasti viime vuosina. Avointa dataa hyödyntävistä sovelluksista on tullut osa monien arkipäivää, esimerkiksi julkisen liikenteen aikatauluja jakavien reittioppaiden myötä. Tämän tutkielman tarkoituksena on tarkastella, kuinka avointa dataa pystytään hyödyntämään ohjelmistojen kehityksessä ja mitä mahdollisia ongelmia siitä voi seurata.
Olen kerännyt suurimman osan aineistoista IEEE-, ACM- ja ProQuest-tietokannoista. Hakiessani lähteitä tutkimukseeni, hyödynsin myös Google Scholar -hakupalvelua. Aineistoja valikoidessani arvioin alustavasti aineistojen luotettavuutta erityisesti tuoreuden ja viittauksien määrän perusteella. Suurin osa aineistoista sijoittuu vuosien 2016 ja 2021 välille. Kuitenkin tiettyjen protokollien määrityksiin käytin myös vanhempaa aineistoa, mikäli määritykset eivät olleet vuosien varrella muuttuneet.
Tutkielmassa käy ilmi, että avointa dataa on saatavilla laajalti erityisesti julkisen sektorin puolelta, jota pystytään hyödyntämään esimerkiksi turismiapplikaatioissa. Tämän lisäksi työssä havaitaan myös datan laadun arvioinnin merkitys ohjelmistokehityksessä. Toisaalta ilmaisena resurssina avoin data on hyvin houkutteleva vaihtoehto ohjelmistokehittäjille, mutta datan laadun vaihtelevuus voi aiheuttaa monenlaisia ongelmia ohjelmistoa kehitettäessä. Usein avoimen datan formaatti ei ole koneluettavuuden kannalta käytännöllinen tai data sisältää epäyhtenäisyyksiä, joiden korjaamiseen joudutaan käyttämään lisäresursseja. Tässä tutkielmassa annetaan esimerkkejä datatyypeistä, jotka soveltuvat ohjelmistokehitykseen ja perehdytään sovelluksiin, joissa avointa dataa on hyödynnetty onnistuneesti. Avoimen datan käytöstä aiheutuvia ongelmia tarkastellaan konkreettisten esimerkkien avulla.
Olen kerännyt suurimman osan aineistoista IEEE-, ACM- ja ProQuest-tietokannoista. Hakiessani lähteitä tutkimukseeni, hyödynsin myös Google Scholar -hakupalvelua. Aineistoja valikoidessani arvioin alustavasti aineistojen luotettavuutta erityisesti tuoreuden ja viittauksien määrän perusteella. Suurin osa aineistoista sijoittuu vuosien 2016 ja 2021 välille. Kuitenkin tiettyjen protokollien määrityksiin käytin myös vanhempaa aineistoa, mikäli määritykset eivät olleet vuosien varrella muuttuneet.
Tutkielmassa käy ilmi, että avointa dataa on saatavilla laajalti erityisesti julkisen sektorin puolelta, jota pystytään hyödyntämään esimerkiksi turismiapplikaatioissa. Tämän lisäksi työssä havaitaan myös datan laadun arvioinnin merkitys ohjelmistokehityksessä. Toisaalta ilmaisena resurssina avoin data on hyvin houkutteleva vaihtoehto ohjelmistokehittäjille, mutta datan laadun vaihtelevuus voi aiheuttaa monenlaisia ongelmia ohjelmistoa kehitettäessä. Usein avoimen datan formaatti ei ole koneluettavuuden kannalta käytännöllinen tai data sisältää epäyhtenäisyyksiä, joiden korjaamiseen joudutaan käyttämään lisäresursseja. Tässä tutkielmassa annetaan esimerkkejä datatyypeistä, jotka soveltuvat ohjelmistokehitykseen ja perehdytään sovelluksiin, joissa avointa dataa on hyödynnetty onnistuneesti. Avoimen datan käytöstä aiheutuvia ongelmia tarkastellaan konkreettisten esimerkkien avulla.
Kokoelmat
- Kandidaatintutkielmat [8996]