Suomessa 2004-2008 sattuneiden tieliikenneonnettomuuksien analysointia GUHA-tiedonlouhintamenetelmällä
Järvenpää, Marko; Turunen, Esko (2012)
Järvenpää, Marko
Turunen, Esko
Tampereen teknillinen yliopisto. Matematiikan laitos
2012
Luonnontieteiden ja ympäristötekniikan tiedekunta - Faculty of Science and Environmental Engineering
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Julkaisun pysyvä osoite on
https://urn.fi/URN:ISBN:978-952-15-2800-2
https://urn.fi/URN:ISBN:978-952-15-2800-2
Tiivistelmä
Tässä tutkimuksessa analysoidaan Suomessa vuosina 2004-2008 poliisin rekisteröimää 83509 tieliikenneonnettomuutta, joissa loukkaantumisiin johti enemmän kuin joka viides ja kuolemaan 1203 onnettomuutta; näissä enemmän kuin yksi ihmishenki menettiin 90 tapauksessa. Vaikka tieliikennekuolemat ovat lukumääräisesti olleet viime vuosina laskussa, on yksikin kuollut tai loukkaantunut liikaa. Kaikki mikä voidaan tehdä onnettomuuksien vähentämiseksi, on tehtävä. Analysoimalla onnettomuusdataa voidaan mahdollisesti löytää sellaisia syitä ja riippuvuuksia, jotka eivät ole olleet liikennesuunnittelijoiden, lainsäätäjien ja muiden asiantuntijoiden tiedossa ja joihin ei sen vuoksi ole osattu tarttua.
Tutkimus on osa Tampereen teknillisen yliopiston matematiikan laitoksen sovelletun logiikan tutkimusryhmän toimintaa. Käyttämämme tutkimusmetodi on GUHA-tiedonlouhintamenetelmä, jonka soveltuvuutta tieliikenneonnettomuusdatan analysoimiseen tässä tutkimusprojektissa selvitetään. Sovelletun logiikan tutkimusryhmällä ei ole erityistä tieliikenneproblematiikan asiantuntemusta, mutta valitsemalla tieliikenneonnettomuusaineisto GUHA-menetelmän testiaineistoksi haluamme toisaalta testata menetelmän käyttökelpoisuutta reaaliseen, kaikille suhteellisen helposti ymmärrettävään dataan, ja toisaalta toteuttaa osaltamme uuden yliopistolain yliopistolle asettamaa tehtävää toimia vuorovaikutuksessa muun yhteiskunnan kanssa sekä edistää tutkimustulosten yhteiskunnallista vaikuttavuutta. Tutkittua tieliikenneonnettomuusdataa on analysoitu myös Jyväskylän yliopistossa louhimalla sitä muilla tiedonlouhintamenetelmillä. Tämän selvityksen eräänä tavoitteena on tutkia, voidaanko GUHA-menetelmallä löytää myös sellaisia riippuvuuksia, joita tutkimuksessa ei ole raportoitu.
The suitability of GUHA-data mining method for analyzing a data set containing more than 80.000 road accidents occurred in Finland in 2004 - 2008 is examined in this report. By GUHA-method, implemented to LISp-Miner software, more than 10.000 dependencies was found; about 100 easily understandable of them are presented here. Our conclusion is that GUHA-method is useful when one wants to explore relatively small size, but still significant dependencies between subsets of a given data.
Tutkimus on osa Tampereen teknillisen yliopiston matematiikan laitoksen sovelletun logiikan tutkimusryhmän toimintaa. Käyttämämme tutkimusmetodi on GUHA-tiedonlouhintamenetelmä, jonka soveltuvuutta tieliikenneonnettomuusdatan analysoimiseen tässä tutkimusprojektissa selvitetään. Sovelletun logiikan tutkimusryhmällä ei ole erityistä tieliikenneproblematiikan asiantuntemusta, mutta valitsemalla tieliikenneonnettomuusaineisto GUHA-menetelmän testiaineistoksi haluamme toisaalta testata menetelmän käyttökelpoisuutta reaaliseen, kaikille suhteellisen helposti ymmärrettävään dataan, ja toisaalta toteuttaa osaltamme uuden yliopistolain yliopistolle asettamaa tehtävää toimia vuorovaikutuksessa muun yhteiskunnan kanssa sekä edistää tutkimustulosten yhteiskunnallista vaikuttavuutta. Tutkittua tieliikenneonnettomuusdataa on analysoitu myös Jyväskylän yliopistossa louhimalla sitä muilla tiedonlouhintamenetelmillä. Tämän selvityksen eräänä tavoitteena on tutkia, voidaanko GUHA-menetelmallä löytää myös sellaisia riippuvuuksia, joita tutkimuksessa ei ole raportoitu.
The suitability of GUHA-data mining method for analyzing a data set containing more than 80.000 road accidents occurred in Finland in 2004 - 2008 is examined in this report. By GUHA-method, implemented to LISp-Miner software, more than 10.000 dependencies was found; about 100 easily understandable of them are presented here. Our conclusion is that GUHA-method is useful when one wants to explore relatively small size, but still significant dependencies between subsets of a given data.