Sarakeperhetietokannat ja niiden käyttökohteet
Heinilä, Jussi (2025)
Heinilä, Jussi
2025
Tieto- ja sähkötekniikan kandidaattiohjelma - Bachelor's Programme in Computing and Electrical Engineering
Informaatioteknologian ja viestinnän tiedekunta - Faculty of Information Technology and Communication Sciences
Hyväksymispäivämäärä
2025-12-15
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-2025121311609
https://urn.fi/URN:NBN:fi:tuni-2025121311609
Tiivistelmä
Erilaisten sovellusten käsittelemän datan määrä on kasvanut valtavasti internetin ja mobiilisovellusten käytön yleistymisen seurauksena. Tämä on luonut tarpeen uusille tietokantaratkaisuille olemassa olevien relaatiotietokantojen rinnalle. Nämä uudet tietokantajärjestelmät sopivat keskenään erilaisiin käyttökohteisiin ominaisuuksiensa takia. Sarakeperhetietokannat ovat yksi keskeinen kategoria näitä uusia NoSQL-tietokantoja.
Tässä tutkielmassa toteutettiin kirjallisuuskatsaus, jonka tavoitteena oli tutustua sarakeperhetietokantoihin ja niiden käyttökohteisiin. Käyttökohteista pyrittiin tunnistamaan yhteisiä tekijöitä, jotka osoittavat, miksi juuri sarakeperhetietokannat ovat sopivia käytettäväksi tietyntyyppisissä sovelluksissa. Tutkielmassa käsitellään aluksi NoSQL-tietokantoja ja niiden eroja relaatiotietokantoihin yleisesti. Tämän jälkeen käsitellään tarkemmin sarakeperhetietokantojen rakenteita ja toimintaa, sekä sarakeperhetietokantojen suorituskykyä synteettisillä aineistoilla. Lopuksi käsitellään sarakeperhetietokantojen nykyisiä ja potentiaalisia käyttökohteita, sekä näiden tietokantojen suorituskykyä ehdotetuissa käyttökohteissa.
Tutkielman tulokset osoittavat, että sarakeperhetietokannoille tyypillinen tapa toteuttaa tietokantojen hajautus ja ositus sekä niiden denormalisoitujen tietomallien käyttö tekevät niistä erittäin hyvin skaalautuvia. Toisaalta niiden rakenne on tyypillisesti suunniteltu ennalta suunniteltuja kyselyitä varten ja uusien kyselyiden toteutus voi olla raskasta. Tietojen suorituskykymittaukset puolestaan nostivat esille sarakeperhetietokannoille tyypillisenä ominaisuutena nopeiksi optimoidut kirjoitusoperaatiot. Näiden skaalautuvuus ja kirjoitus ominaisuuksien vaikutus oli havaittavissa myös sarakeperhetietokantojen soveltuvuudessa niiden yleisimpiin käyttökohteisiin.
Tässä tutkielmassa toteutettiin kirjallisuuskatsaus, jonka tavoitteena oli tutustua sarakeperhetietokantoihin ja niiden käyttökohteisiin. Käyttökohteista pyrittiin tunnistamaan yhteisiä tekijöitä, jotka osoittavat, miksi juuri sarakeperhetietokannat ovat sopivia käytettäväksi tietyntyyppisissä sovelluksissa. Tutkielmassa käsitellään aluksi NoSQL-tietokantoja ja niiden eroja relaatiotietokantoihin yleisesti. Tämän jälkeen käsitellään tarkemmin sarakeperhetietokantojen rakenteita ja toimintaa, sekä sarakeperhetietokantojen suorituskykyä synteettisillä aineistoilla. Lopuksi käsitellään sarakeperhetietokantojen nykyisiä ja potentiaalisia käyttökohteita, sekä näiden tietokantojen suorituskykyä ehdotetuissa käyttökohteissa.
Tutkielman tulokset osoittavat, että sarakeperhetietokannoille tyypillinen tapa toteuttaa tietokantojen hajautus ja ositus sekä niiden denormalisoitujen tietomallien käyttö tekevät niistä erittäin hyvin skaalautuvia. Toisaalta niiden rakenne on tyypillisesti suunniteltu ennalta suunniteltuja kyselyitä varten ja uusien kyselyiden toteutus voi olla raskasta. Tietojen suorituskykymittaukset puolestaan nostivat esille sarakeperhetietokannoille tyypillisenä ominaisuutena nopeiksi optimoidut kirjoitusoperaatiot. Näiden skaalautuvuus ja kirjoitus ominaisuuksien vaikutus oli havaittavissa myös sarakeperhetietokantojen soveltuvuudessa niiden yleisimpiin käyttökohteisiin.
Kokoelmat
- Kandidaatintutkielmat [10487]
