Urban Traffic Analysis with Bus Location Data
Syrjärinne, Paula (2016)
Syrjärinne, Paula
Tampere University Press
2016
Tietojenkäsittelyoppi - Computer Science
Informaatiotieteiden yksikkö - School of Information Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Väitöspäivä
2016-03-11
Julkaisun pysyvä osoite on
https://urn.fi/URN:ISBN:978-952-03-0069-2
https://urn.fi/URN:ISBN:978-952-03-0069-2
Tiivistelmä
Tässä työssä esitellään Tampereen alueen julkisen liikenteen linja-autoista kerätyn datan käyttöä ja analysointia. Aineistoa on analysoitu useilla eri algoritmeilla ja monesta eri näkökulmasta. Osa analyyseista mittaa julkisen liikenteen palvelutasoa, osa tarjoaa matkustajille hyödyllistä lisäinformaatiota ja osa keskittyy havainnoimaan liikenteen yleistä sujuvuutta.
Työn alussa esitellään aiheeseen liittyviä taustatietoja ja aiemmin samasta aiheesta tehtyjä tutkimuksia. Erilaiset liikenteeseen liittyvät sensoriverkostot käydään läpi, keskittyen erityisesti sensoriautoverkostoihin. Kauttaaltaan työssä käsitellään Tampereen linja-autodataa liikkuvasta autosensoriverkosta kerättynä datana. Sensoriautoverkostojen analyysiin liittyvää kirjallisuutta esitellään työssä siten että tutkimukset on jaoteltu lähdedatan perusteella taksidataa, linja-autodataa ja mobiililaitedataa käsitteleviin artikkeleihin. Kuhunkin näistä liittyy erilaisia tutkimusongelmia.
Taksidataa käytettäessä puuttuvat havaintopisteet ovat yleisin ongelma, kun taas henkilöautoliikenteen mallintaminen linja-autoista kerätyn datan perusteella on tyypillinen kysymys bussidataa käyttävissä tutkimuksissa. Mobiililaitteista kerättyä dataa käytettäessä pitää sen sijaan yleensä ensin selvittää onko laite ylipäätään liikkuvassa ajoneuvossa.
Tampereen linja-autodata esitellään yksityiskohtaisesti. Tämä data on verrattain hyvälaatuista, koska sen päivitysnopeus on korkea, jokaiseen havaintoon on aina liittetty yksilölliset tunnisteet ja koko julkisen liikenteen verkoston alueelta on runsaasti havaintoja saatavilla. Kuten missä tahansa oikeasta lähteestä kerätyssä datassa, tässäkin aineistossa on kuitenkin ongelmia, kuten epäjohdonmukaisuuksia, virheitä ja kohinaa. Näiden virheiden odotettavissa olevat suuruusluokat on käyty datan esittelyssä läpi. Samoin esittelellään esikäsittelyprosessi, jossa dataa sekä puhdistetaan virheistä että sen kokoa ja muotoa muutetaan helpommin käytettäväksi tilastollisessa analyysissä.
Työn kokeellisessa osassa tarkastellaan aluksi datan käyttöä julkisen liikenteen toimivuuden mittaamisessa. Datasta on etsitty usein esiintyviä aika-paikka-linja –joukkoja, jotka paljastavat missä, milloin ja millä linjoilla bussit ovat säännöllisesti myöhässä. Sen lisäksi reittiajoja on jaoteltu paikan ja tapahtumien (kuten pysäkillä käynnit tai liikennevaloissa odottaminen) mukaan, jotta on löydetty syitä myöhästymisille.
Matkustajien kannalta tehdyissä kokeiluissa on toteutettu mm. dataan perustuvat pysäkkiaikataulut, jotka mukautuvat ajan mittaan todellisten saapumisaikojen mukaan. Saapumisajan lisäksi matkustajille annetaan arvio saapumisajan epävarmuudesta.
Yleisen liikenteen sujuvuuden analysoimiseksi esitellään katuosuusprofiilien käsite. Profiili kertoo kullekin pysäkinvälille normaalin ajoajan rajat kunakin vuorokaudenaikana. Profiileja voidaan käyttää pysäkinvälien luokitteluun esimerkiksi aamu- ja iltapäiväruuhkan vaikutusten mukaan, ja ne ovat perusta reaaliaikaisen poikkeustilamonitoroinnin tarpeisiin. Poikkeustilamonitorointia on testattu työssä käyttäen muutaman tunnetun liikenneonnettomuustilanteen dataa.
Kaikkeen työssä tehtyyn kehitykseen ja testaukseen on käytetty oikeaa dataa, ja reaaliaikaisen datavirran käyttömahdollisuudet on pyritty huomioimaan aina tarvittaessa. Periaatteena on ollut välttää monimutkaisuutta ja suosia käytettävyyttä tuotanto-olosuhteissa siten, että ylimääräisten parametrisointien ja tilastollisten oletusten määrä on pidetty mahdollisimman pienenä. Lisäksi robustisuus on otettu huomioon joka asiassa. Kaikki prosessit on yritetty tehdä niin, että ne perustuvat mahdollisimman standardimuotoisille formaateille, ja ovat automatisoitavissa. Niinpä nämä Tampereen datalla kehitetyt menetelmät voitaisiin minimaalisella käsityön määrällä siirtää käytettäväksi mihin tahansa muuhun kaupunkiin, josta on vastaavat datat saatavilla.
Työn alussa esitellään aiheeseen liittyviä taustatietoja ja aiemmin samasta aiheesta tehtyjä tutkimuksia. Erilaiset liikenteeseen liittyvät sensoriverkostot käydään läpi, keskittyen erityisesti sensoriautoverkostoihin. Kauttaaltaan työssä käsitellään Tampereen linja-autodataa liikkuvasta autosensoriverkosta kerättynä datana. Sensoriautoverkostojen analyysiin liittyvää kirjallisuutta esitellään työssä siten että tutkimukset on jaoteltu lähdedatan perusteella taksidataa, linja-autodataa ja mobiililaitedataa käsitteleviin artikkeleihin. Kuhunkin näistä liittyy erilaisia tutkimusongelmia.
Taksidataa käytettäessä puuttuvat havaintopisteet ovat yleisin ongelma, kun taas henkilöautoliikenteen mallintaminen linja-autoista kerätyn datan perusteella on tyypillinen kysymys bussidataa käyttävissä tutkimuksissa. Mobiililaitteista kerättyä dataa käytettäessä pitää sen sijaan yleensä ensin selvittää onko laite ylipäätään liikkuvassa ajoneuvossa.
Tampereen linja-autodata esitellään yksityiskohtaisesti. Tämä data on verrattain hyvälaatuista, koska sen päivitysnopeus on korkea, jokaiseen havaintoon on aina liittetty yksilölliset tunnisteet ja koko julkisen liikenteen verkoston alueelta on runsaasti havaintoja saatavilla. Kuten missä tahansa oikeasta lähteestä kerätyssä datassa, tässäkin aineistossa on kuitenkin ongelmia, kuten epäjohdonmukaisuuksia, virheitä ja kohinaa. Näiden virheiden odotettavissa olevat suuruusluokat on käyty datan esittelyssä läpi. Samoin esittelellään esikäsittelyprosessi, jossa dataa sekä puhdistetaan virheistä että sen kokoa ja muotoa muutetaan helpommin käytettäväksi tilastollisessa analyysissä.
Työn kokeellisessa osassa tarkastellaan aluksi datan käyttöä julkisen liikenteen toimivuuden mittaamisessa. Datasta on etsitty usein esiintyviä aika-paikka-linja –joukkoja, jotka paljastavat missä, milloin ja millä linjoilla bussit ovat säännöllisesti myöhässä. Sen lisäksi reittiajoja on jaoteltu paikan ja tapahtumien (kuten pysäkillä käynnit tai liikennevaloissa odottaminen) mukaan, jotta on löydetty syitä myöhästymisille.
Matkustajien kannalta tehdyissä kokeiluissa on toteutettu mm. dataan perustuvat pysäkkiaikataulut, jotka mukautuvat ajan mittaan todellisten saapumisaikojen mukaan. Saapumisajan lisäksi matkustajille annetaan arvio saapumisajan epävarmuudesta.
Yleisen liikenteen sujuvuuden analysoimiseksi esitellään katuosuusprofiilien käsite. Profiili kertoo kullekin pysäkinvälille normaalin ajoajan rajat kunakin vuorokaudenaikana. Profiileja voidaan käyttää pysäkinvälien luokitteluun esimerkiksi aamu- ja iltapäiväruuhkan vaikutusten mukaan, ja ne ovat perusta reaaliaikaisen poikkeustilamonitoroinnin tarpeisiin. Poikkeustilamonitorointia on testattu työssä käyttäen muutaman tunnetun liikenneonnettomuustilanteen dataa.
Kaikkeen työssä tehtyyn kehitykseen ja testaukseen on käytetty oikeaa dataa, ja reaaliaikaisen datavirran käyttömahdollisuudet on pyritty huomioimaan aina tarvittaessa. Periaatteena on ollut välttää monimutkaisuutta ja suosia käytettävyyttä tuotanto-olosuhteissa siten, että ylimääräisten parametrisointien ja tilastollisten oletusten määrä on pidetty mahdollisimman pienenä. Lisäksi robustisuus on otettu huomioon joka asiassa. Kaikki prosessit on yritetty tehdä niin, että ne perustuvat mahdollisimman standardimuotoisille formaateille, ja ovat automatisoitavissa. Niinpä nämä Tampereen datalla kehitetyt menetelmät voitaisiin minimaalisella käsityön määrällä siirtää käytettäväksi mihin tahansa muuhun kaupunkiin, josta on vastaavat datat saatavilla.
Kokoelmat
- Väitöskirjat [4903]