Viimeaikaisia kehityksiä relaatiotietokantakyselyjen optimoinnissa
Kallunki, Tomi (2023)
Kallunki, Tomi
2023
Tietojenkäsittelytieteiden kandidaattiohjelma - Bachelor's Programme in Computer Sciences
Informaatioteknologian ja viestinnän tiedekunta - Faculty of Information Technology and Communication Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2023-05-30
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-202305085421
https://urn.fi/URN:NBN:fi:tuni-202305085421
Tiivistelmä
Relaatiotietokantojen olennainen piirre on suurien datamäärien noutaminen ja haluttuun muotoon muovaaminen järkevässä ajassa. Avainasemassa on täten kyselyjen suoritustehokkuus. Relaatiotietokantakyselyjen optimoinnin tavoite on lyhentää kyselyjen suoritukseen kuluvaa aikaa ja toisaalta vähentää suoritukseen vaadittavia resursseja, kuten muistia. Kyselyjen optimointia on tutkittu jo vuosikymmenien ajan, mutta datan monimutkaistumisen ja datamäärän kasvun myötä optimoitavien kyselyjen luonne on vuosien varrella muuttunut, joten tutkimuksen painopisteet ovat muuttuneet. Tämän vuoksi pyrin tässä tutkielmassa muodostamaan kuvan kyselyjen optimoinnin nykytilanteesta tarkastelemalla tutkimusalueen viimeaikaisia kehityksiä.
Tutkielma on menetelmältään kirjallisuuskatsaus, jonka aineistona käytin korkealaatuisia vertaisarvioituja lehtiartikkeleita ja konferenssijulkaisuja edeltävän viiden vuoden ajalta. Rajasin tarkastelun relaatiotietokantajärjestelmän sisälle toteutettaviin kyselyjen suoritusta tehostaviin optimointimenetelmiin. Aineistosta etsin ongelmia ja ratkaisuja, joista muodostin teemoja. Tutkielmaan valitsin neljä yleispätevää ja olennaista teemaa: kardinaliteettien arviointi, liitosten suoritusjärjestys, optimointi ilman kardinaliteettien arviointia sekä kyselyjen jaettu suoritus. Kustakin teemasta esittelen kaksi viimeaikoina kehitettyä optimointimenetelmää.
Teemoista havaitsin liitosten optimoinnin olevan erityisen tärkeää, mikä heijastanee edellä mainittuja muutoksia datassa. Esittelemistäni optimointimenetelmistä huomasin suurimman osan hyödyntävän koneoppimista, joten tekoälyn kehitys vaikuttaa edesauttaneen kyselyjen optimoinnin kehitystä. Kyselyjen optimoinnin kehityksissä ilmenee selvästi informaatioteknologian laajemmat muutokset.
Tutkielma on menetelmältään kirjallisuuskatsaus, jonka aineistona käytin korkealaatuisia vertaisarvioituja lehtiartikkeleita ja konferenssijulkaisuja edeltävän viiden vuoden ajalta. Rajasin tarkastelun relaatiotietokantajärjestelmän sisälle toteutettaviin kyselyjen suoritusta tehostaviin optimointimenetelmiin. Aineistosta etsin ongelmia ja ratkaisuja, joista muodostin teemoja. Tutkielmaan valitsin neljä yleispätevää ja olennaista teemaa: kardinaliteettien arviointi, liitosten suoritusjärjestys, optimointi ilman kardinaliteettien arviointia sekä kyselyjen jaettu suoritus. Kustakin teemasta esittelen kaksi viimeaikoina kehitettyä optimointimenetelmää.
Teemoista havaitsin liitosten optimoinnin olevan erityisen tärkeää, mikä heijastanee edellä mainittuja muutoksia datassa. Esittelemistäni optimointimenetelmistä huomasin suurimman osan hyödyntävän koneoppimista, joten tekoälyn kehitys vaikuttaa edesauttaneen kyselyjen optimoinnin kehitystä. Kyselyjen optimoinnin kehityksissä ilmenee selvästi informaatioteknologian laajemmat muutokset.
Kokoelmat
- Kandidaatintutkielmat [8709]