Joukkoliikennedatan integrointi: NeTEx-formaatin muunnos GTFS-muotoon
Leinonen, Iris (2021)
Leinonen, Iris
2021
Tietojenkäsittelyopin maisteriohjelma - Master's Programme in Computer Science
Informaatioteknologian ja viestinnän tiedekunta - Faculty of Information Technology and Communication Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2021-12-09
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-202112078950
https://urn.fi/URN:NBN:fi:tuni-202112078950
Tiivistelmä
Tietoa tuotetaan yhä enenevässä määrin automaattisesti ja niinpä saatavilla olevan tiedon määrä on kasvanut valtavasti. Yleinen ongelma tiedon hyödyntämisessä on kuitenkin se, että kerätty tieto on usein erimuotoista ja sen hyödyntäminen yhtenäisesti vaatii tiedon integrointia. Tiedon integrointi tarkoittaa erimuotoisten tietojen saattamista yhdenmuotoiseen formaattiin tai yhtenäisen näkymän luontia erimuotoiseen dataan. Tässä tutkielmassa tarkastellaan joukkoliikenteeseen liittyvän tiedon hyödyntämistä ja integrointia. Joukkoliikenteen tiedonsiirtoon on tarjolla useita erilaisia tietoformaatteja, kuten tässä tutkielmassa käsiteltävät General Transit Feed Specification (GTFS) ja Network Timetable Exchange (NeTEx). GTFS on Googlen kehittämä dataspesifikaatio, jota hyödyntämällä joukkoliikennetietoa voidaan julkaista taulukkomuodossa. NeTEx puolestaan on Comité Européen de Normalisation -järjestön (CEN) julkaisema standardi, jonka tietoformaatti on XML. NeTExille tyypillistä ovat erilaiset aluekohtaiset profiilit, jotka ovat kehitetty NeTExin pohjalta alueen omiin tarpeisiin. Eri alueiden profiilit voivat sisältää keskenään erilaisia elementtejä ja erota rakenteeltaan. Näille eri formaateille ja profiileille on usein oma tarkoituksensa, ja nykyaikaisen ja kansainvälisen joukkoliikennejärjestelmän tulisikin voida käsitellä useampaa kuin yhtä formaattia.
Tämä tutkielma liittyy Mattersoft Oy:n toteuttamaan järjestelmään joukkoliikennedatan hyödyntämiseksi. Tällä hetkellä Mattersoft Oy:n järjestelmä pystyy käsittelemään tietoa ainoastaan taulukkomuodossa. Tässä tutkielmassa kehitetään muunnin, jonka avulla joukkoliikennejärjestelmä pystyy jäsentämään taulukkomuotoisen datan lisäksi myös pohjoismaisen NeTEx-profiilin mukaista XML-dataa. Tutkielmaan sisältyy myös selonteko erilaisten XML-profiilien välisistä datakonflikteista. Konflikteja etsiessä havaitaan, että eri profiilien väliset erot ovat suuria. Tätä selontekoa voidaan hyödyntää tulevaisuuden integraatiohaasteissa.
Tämä tutkielma liittyy Mattersoft Oy:n toteuttamaan järjestelmään joukkoliikennedatan hyödyntämiseksi. Tällä hetkellä Mattersoft Oy:n järjestelmä pystyy käsittelemään tietoa ainoastaan taulukkomuodossa. Tässä tutkielmassa kehitetään muunnin, jonka avulla joukkoliikennejärjestelmä pystyy jäsentämään taulukkomuotoisen datan lisäksi myös pohjoismaisen NeTEx-profiilin mukaista XML-dataa. Tutkielmaan sisältyy myös selonteko erilaisten XML-profiilien välisistä datakonflikteista. Konflikteja etsiessä havaitaan, että eri profiilien väliset erot ovat suuria. Tätä selontekoa voidaan hyödyntää tulevaisuuden integraatiohaasteissa.