Hierarkkisien näkymien generointi relaatiotietokannan sanakirjadatasta
Ala-Fossi, Jukka (2021)
Ala-Fossi, Jukka
2021
Tietojenkäsittelyopin maisteriohjelma - Master's Programme in Computer Science
Informaatioteknologian ja viestinnän tiedekunta - Faculty of Information Technology and Communication Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2021-11-30
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-202111238596
https://urn.fi/URN:NBN:fi:tuni-202111238596
Tiivistelmä
Sanakirjadata on monimuotoista ja sisältää paitsi merkityksiä, myös esimerkiksi termejä, variantteja ja luokitteluja. Se on myös rakenteeltaan monimutkaista, koska sen eri osat voivat olla hierarkkisia. Sanakirja- ja tesaurusmuotoinen sanakirjadata esitetään usein hierarkkisessa muodossa, mutta näiden kahden muodon hierarkiat ovat erilaiset. Sanakirjadatan hierarkkisesta muodosta huolimatta sen tallentaminen relaatiotietokantaan on varsin houkutteleva vaihtoehto, koska relaatiotietokannat ovat kaikkein yleisimpiä tietokantoja. Relaatiotietokantaan tallennettaessa sanakirjadatan hierarkia täytyy ottaa huomioon tietokannan rakenteen suunnittelussa, että se pystyy säilyttämään koko hierarkian muodossa, josta se on uudelleen johdettavissa.
Tämä tutkielma käsittelee hierarkkisien näkymien generointia relaatiotietokantaan tallennetusta sanakirjadatasta. Osana tutkielmaa toteutettiin sovellus, joka tekee relaatiotietokantaan rekursiivisia kyselyitä ja tuottaa niiden perusteella XML- ja HTML-dokumentteja. Nämä dokumentit sisältävät hierarkkisen tesaurusmuotoisen version relaatiotietokannan sisällöstä. Sovelluksen käyttämä relaatiotietokanta sisältää sanakirjamuotoista sanakirjadataa, jota ei alun perin ole lainkaan suunniteltu käytettäväksi tesauruksena. Se kuitenkin sisältää tarvittavan määrän informaatiota tesauruksen rakentamiseksi.
Tutkielmassa käydään läpi eri menetelmiä hierarkkisen datan tallentamiseen ja noutamiseen relaatiotietokantaa käyttäen. Tämän jälkeen esitellään esimerkkitoteutus, joka tuottaa XML- ja HTML-muotoiset tesaurukset. XML-dokumentti mahdollistaa tesauruksen tehokkaan jatkokäytön. HTML-dokumenttiversio toteuttaa relaatiotietokannan datalle tesaurusmuotoisen käyttöliittymän. Esimerkkitoteutus osoittaa, että rekursiiviset tietokantakyselyt voivat olla tehokas menetelmä hierarkkisen sanakirjadatan noutamiseen relaatiotietokannasta. Toteutus myös havainnollistaa, miten tarpeeksi joustavaa relaatiotietokantaa on mahdollista käyttää tavoilla, jotka eivät sisältyneet relaatiotietokannan alkuperäisiin vaatimuksiin.
Tämä tutkielma käsittelee hierarkkisien näkymien generointia relaatiotietokantaan tallennetusta sanakirjadatasta. Osana tutkielmaa toteutettiin sovellus, joka tekee relaatiotietokantaan rekursiivisia kyselyitä ja tuottaa niiden perusteella XML- ja HTML-dokumentteja. Nämä dokumentit sisältävät hierarkkisen tesaurusmuotoisen version relaatiotietokannan sisällöstä. Sovelluksen käyttämä relaatiotietokanta sisältää sanakirjamuotoista sanakirjadataa, jota ei alun perin ole lainkaan suunniteltu käytettäväksi tesauruksena. Se kuitenkin sisältää tarvittavan määrän informaatiota tesauruksen rakentamiseksi.
Tutkielmassa käydään läpi eri menetelmiä hierarkkisen datan tallentamiseen ja noutamiseen relaatiotietokantaa käyttäen. Tämän jälkeen esitellään esimerkkitoteutus, joka tuottaa XML- ja HTML-muotoiset tesaurukset. XML-dokumentti mahdollistaa tesauruksen tehokkaan jatkokäytön. HTML-dokumenttiversio toteuttaa relaatiotietokannan datalle tesaurusmuotoisen käyttöliittymän. Esimerkkitoteutus osoittaa, että rekursiiviset tietokantakyselyt voivat olla tehokas menetelmä hierarkkisen sanakirjadatan noutamiseen relaatiotietokannasta. Toteutus myös havainnollistaa, miten tarpeeksi joustavaa relaatiotietokantaa on mahdollista käyttää tavoilla, jotka eivät sisältyneet relaatiotietokannan alkuperäisiin vaatimuksiin.