Hajautusfunktioperusteinen anonymisointi
Lumpo, Roni-Markus (2021)
Lumpo, Roni-Markus
2021
Tietojenkäsittelytieteiden kandidaattiohjelma - Bachelor's Programme in Computer Sciences
Informaatioteknologian ja viestinnän tiedekunta - Faculty of Information Technology and Communication Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2021-05-12
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-202105044386
https://urn.fi/URN:NBN:fi:tuni-202105044386
Tiivistelmä
Tietoaineistojen anonymisointiin ei ole vielä kehitetty ratkaisua, joka sopii kaikille tietoaineistoille. Tietoaineiston anonymisoinnin toteuttamisessa saatetaan joutua käyttämään useampia anonymisoinnin keinoja yhden sijaan. Tässä tutkielmassa selvitetään, mitä hajautusfunktiopoh-jainen anonymisointi on ja tarkastellaan sen sovellusalueena MAC-osoitteiden, eli verkkolait-teita yksilöivien arvojen anonymisointia.
MAC-osoitteiden hajautusfunktioperusteisessa anonymisoinnissa ongelmana on MAC-osoitteiden pituuden aiheuttama rajoite niiden muodostamalle tulosjoukolle. MAC-osoitteiden muodostaman tulosjoukon ollessa pieni, niistä muodostetut hajautusarvot ovat alttiita esimer-kiksi väsytyshyökkäyksille. Väsytyshyökkäyksistä on mahdollista tehdä hyökkääjille epäsuo-tuisia käyttämällä laskennallisesti raskaita hajautusalgoritmeja kuten bcryptiä, käyttämällä suolaa ja pippuria hajautuksessa sekä vaihtamalla suolan ja pippurin saamia arvoja.
Hajautusfunktiopohjaiselle anonymisoinnille on ehdotettu lähestymistapaa, jolla saavutetaan minimaalinen k-anonymiteetti. K-anonymiteettikään ei kuitenkaan takaa aineiston anonyymiyt-tä. MAC-osoitteiden anonymisoinnin tapauksessa k-anonymiteetti muodostetaan niin, että MAC-osoitteesta saatava hajautusarvo typistetään ennen hajautusarvon tallettamista hajautus-tauluun, jolloin hajautusarvon typistetty muoto vastaa useampaa kuin yhtä MAC-osoitetta. Hajautustaulun indeksiin sopivien MAC-osoitteiden määrä riippuu hajautusarvon typistetyn muodon pituudesta.
Tutkielmassa tutustutaan Lontoon joukkoliikenteen, eli TfL:n toteuttamaan pilottihankkee-seen MAC-osoitteiden keräämisestä ja anonymisoinnista. Tämä pilottihanke tehtiin vuonna 2016 ja se todettiin onnistuneeksi vuonna 2017. Pilottihankkeen käytäntöjä otettiin laajamittai-sesti käyttöön Lontoon metrossa vuonna 2019 ja ne ovat käytössä edelleen. TfL tukeutuu MAC-osoitteiden anonymisointiprosessissa hajautusalgoritmiin, joka suoritetaan kahdesti jo-kaisen talletettavan MAC-osoitteen kohdalla. Molemmilla kerroilla syötteeseen lisätään salai-set merkkijonot tietoturvan parantamiseksi. Lontoon joukkoliikenteen toteuttamasta MAC-osoitteiden keräämisestä ja anonymisoinnin tietoturvallisuudesta on ristiriitaisia näkemyksiä, koska pahimmassa skenaariossa tietoaineistosta on mahdollista tunnistaa yksilöitä esimerkiksi käyttämällä väsytys- ja taustatietohyökkäystä, jolloin yksityisyydensuoja rikkoutuu.
MAC-osoitteiden hajautusfunktioperusteisessa anonymisoinnissa ongelmana on MAC-osoitteiden pituuden aiheuttama rajoite niiden muodostamalle tulosjoukolle. MAC-osoitteiden muodostaman tulosjoukon ollessa pieni, niistä muodostetut hajautusarvot ovat alttiita esimer-kiksi väsytyshyökkäyksille. Väsytyshyökkäyksistä on mahdollista tehdä hyökkääjille epäsuo-tuisia käyttämällä laskennallisesti raskaita hajautusalgoritmeja kuten bcryptiä, käyttämällä suolaa ja pippuria hajautuksessa sekä vaihtamalla suolan ja pippurin saamia arvoja.
Hajautusfunktiopohjaiselle anonymisoinnille on ehdotettu lähestymistapaa, jolla saavutetaan minimaalinen k-anonymiteetti. K-anonymiteettikään ei kuitenkaan takaa aineiston anonyymiyt-tä. MAC-osoitteiden anonymisoinnin tapauksessa k-anonymiteetti muodostetaan niin, että MAC-osoitteesta saatava hajautusarvo typistetään ennen hajautusarvon tallettamista hajautus-tauluun, jolloin hajautusarvon typistetty muoto vastaa useampaa kuin yhtä MAC-osoitetta. Hajautustaulun indeksiin sopivien MAC-osoitteiden määrä riippuu hajautusarvon typistetyn muodon pituudesta.
Tutkielmassa tutustutaan Lontoon joukkoliikenteen, eli TfL:n toteuttamaan pilottihankkee-seen MAC-osoitteiden keräämisestä ja anonymisoinnista. Tämä pilottihanke tehtiin vuonna 2016 ja se todettiin onnistuneeksi vuonna 2017. Pilottihankkeen käytäntöjä otettiin laajamittai-sesti käyttöön Lontoon metrossa vuonna 2019 ja ne ovat käytössä edelleen. TfL tukeutuu MAC-osoitteiden anonymisointiprosessissa hajautusalgoritmiin, joka suoritetaan kahdesti jo-kaisen talletettavan MAC-osoitteen kohdalla. Molemmilla kerroilla syötteeseen lisätään salai-set merkkijonot tietoturvan parantamiseksi. Lontoon joukkoliikenteen toteuttamasta MAC-osoitteiden keräämisestä ja anonymisoinnin tietoturvallisuudesta on ristiriitaisia näkemyksiä, koska pahimmassa skenaariossa tietoaineistosta on mahdollista tunnistaa yksilöitä esimerkiksi käyttämällä väsytys- ja taustatietohyökkäystä, jolloin yksityisyydensuoja rikkoutuu.
Kokoelmat
- Kandidaatintutkielmat [8918]