ER-mallin muuntaminen graafitietokantaan
Luuri, Olli (2025)
Luuri, Olli
2025
Tietojenkäsittelyopin maisteriohjelma - Master's Programme in Computer Science
Informaatioteknologian ja viestinnän tiedekunta - Faculty of Information Technology and Communication Sciences
Hyväksymispäivämäärä
2025-06-02
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-202505306422
https://urn.fi/URN:NBN:fi:tuni-202505306422
Tiivistelmä
Relaatiotietokannat ovat pitkään olleet suosituimpia tietokantaratkaisuja ja ne ovat säilyttäneet valta-asemansa sopeutumalla muuttuviin tarpeisiin. Kuitenkin 2000-luvun alussa erityisesti sosiaalisen median palveluiden myötä datan määrä, nopeus ja vaihtelevuus kasvoivat nopeasti. Tämä Big Dataksi kutsuttu ilmiö toi mukanaan uudenlaisia vaatimuksia, joiden myötä relaatiotietokannat osoittautuivat kankeiksi ja raskaiksi. Ratkaisuksi kehitettiin joustavuuteen ja suurten datamäärien käsittelyyn keskittyviä tietokantaratkaisuja, joita kutsutaan yhteisnimityksellä NoSQL.
Erityisesti mielenkiintoa ovat herättäneet graafitietokannat, jotka on suunniteltu luontaisesti verkkomuotoisen datan käsittelyyn ja jotka keskittyvät muista tietokannoista poiketen datan välisiin suhteisiin. Graafitietokannat hyödyntävät tyypillisesti ominaisuusgraafimallia, jossa tieto mallinnetaan solmuina, solmujen välisinä kaarina ja näiden ominaisuuksina.
Relaatiotietokannan rakenteen suunnittelussa käsitteellinen mallintaminen ER-mallin avulla on saavuttanut standardin aseman. Graafitietokantojen suunnittelu on kuitenkin vielä uutta, eikä mikään menetelmä ole vakiintunut käyttöön. Graafitietomallin joustavuus mahdollistaa myös saman asian mallintamisen eri tavoin. Ilmiötä kutsutaan semanttiseksi relativismiksi.
Tässä tutkielmassa tarkastellaan graafitietokantojen suunnittelua ja sitä, miten perinteinen ER-malli voidaan muuntaa graafitietokannan ominaisuusgraafimalliksi. Tämän taustoittamiseksi tehdään katsaus esitettyihin menetelmiin ER-mallin hyödyntämisestä graafitietokannan suunnittelussa. Lisäksi toteutetaan käytännössä ER-mallin muunnos Neo4j-tietokannan ominaisuusgraafimalliksi ja vertaillaan, millaisia vaikutuksia eri mallinnustavoilla on graafikyselyiden muodostamiseen.
Vaikka ER-malli ja ominaisuusgraafi ovat rakenteellisesti samankaltaisia, niillä on muunnoksessa yhteensovittamista vaativia eroja. Ominaisuusgraafi on binäärinen, eli kaaret ovat aina kahden solmun välisiä, kun taas ER-mallissa suhteeseen voi osallistua useita entiteettejä. Useamman osallistujan suhteet voidaan muuntaa useiksi binäärisiksi suhteiksi, mutta merkitys voi tällöin muuttua. Lisäämällä suhdetta kuvaava välisolmu, alkuperäinen semanttinen merkitys säilyy paremmin, mutta se voi monimutkaistaa kyselyitä. Graafitietokanta mahdollistaa myös mallien yhdistämisen, jolloin kyselyt voidaan laatia parhaiten käyttötapaukseen sopivan mallin mukaisesti.
Erityisesti mielenkiintoa ovat herättäneet graafitietokannat, jotka on suunniteltu luontaisesti verkkomuotoisen datan käsittelyyn ja jotka keskittyvät muista tietokannoista poiketen datan välisiin suhteisiin. Graafitietokannat hyödyntävät tyypillisesti ominaisuusgraafimallia, jossa tieto mallinnetaan solmuina, solmujen välisinä kaarina ja näiden ominaisuuksina.
Relaatiotietokannan rakenteen suunnittelussa käsitteellinen mallintaminen ER-mallin avulla on saavuttanut standardin aseman. Graafitietokantojen suunnittelu on kuitenkin vielä uutta, eikä mikään menetelmä ole vakiintunut käyttöön. Graafitietomallin joustavuus mahdollistaa myös saman asian mallintamisen eri tavoin. Ilmiötä kutsutaan semanttiseksi relativismiksi.
Tässä tutkielmassa tarkastellaan graafitietokantojen suunnittelua ja sitä, miten perinteinen ER-malli voidaan muuntaa graafitietokannan ominaisuusgraafimalliksi. Tämän taustoittamiseksi tehdään katsaus esitettyihin menetelmiin ER-mallin hyödyntämisestä graafitietokannan suunnittelussa. Lisäksi toteutetaan käytännössä ER-mallin muunnos Neo4j-tietokannan ominaisuusgraafimalliksi ja vertaillaan, millaisia vaikutuksia eri mallinnustavoilla on graafikyselyiden muodostamiseen.
Vaikka ER-malli ja ominaisuusgraafi ovat rakenteellisesti samankaltaisia, niillä on muunnoksessa yhteensovittamista vaativia eroja. Ominaisuusgraafi on binäärinen, eli kaaret ovat aina kahden solmun välisiä, kun taas ER-mallissa suhteeseen voi osallistua useita entiteettejä. Useamman osallistujan suhteet voidaan muuntaa useiksi binäärisiksi suhteiksi, mutta merkitys voi tällöin muuttua. Lisäämällä suhdetta kuvaava välisolmu, alkuperäinen semanttinen merkitys säilyy paremmin, mutta se voi monimutkaistaa kyselyitä. Graafitietokanta mahdollistaa myös mallien yhdistämisen, jolloin kyselyt voidaan laatia parhaiten käyttötapaukseen sopivan mallin mukaisesti.