QLXR - logiikkaohjelmoinnin muuttujakäsitteeseen perustuva dokumenttikeskeinen XML-kyselykieli
MOILANEN, KATJA (2011)
Tässä tietueessa ei ole kokotekstiä saatavilla Treposta, ainoastaan metadata.
MOILANEN, KATJA
2011
Tietojenkäsittelyoppi - Computer Science
Informaatiotieteiden yksikkö - School of Information Sciences
Hyväksymispäivämäärä
2011-11-22Tiivistelmä
Puolirakenteinen XML mallinnetaan usein puuna ja tämän vuoksi XML-kyselykielissä käytetään usein polkuilmauksia. Erityisesti dokumenttikeskeisessä näkökulmassa, jossa käyttäjän tietämys dokumenteista on vajaavainen ja tietotarve on lähinnä sopivien dokumenttien tai niiden osien löytäminen, ovat polkuilmaisut käyttäjän kannalta hankalia.
Tässä tutkielmassa kehitettiin dokumenttikeskeinen XML-kyselykieli QLXR. Puun sijaan XML-dokumentit mallinnettiin XML-relaatioesitystavalla, jossa XML-dokumentti esitetään kolmipaikkaisena relaationa. Relaation kaavio on D(C,T,I), missä D on XML-dokumentin nimi, C on komponentti-ilmentymä (merkkauksen nimi tai tekstimuotoisen sisällön yksittäinen sana), T on komponentti-ilmentymän tyyppi ja I indeksi. Tutkielmassa esitellään vertailukohdaksi myös kolme muuta XML-kyselykieltä.
Polkuilmausten sijaan QLXR-kyselykielessä käytetään avainsanahakuja, jotka prosessoidaan tässä tutkielmassa kehitetyllä AES-poimintastrategialla. AES poimii toisiinsa semanttisesti liittyvät avainsanojen ilmentymät myös niissä tilanteissa, joissa tutkielmassa esitellyt muut XML-tietojen poimintastrategiat epäonnistuvat.
Kyselykielissä yleisesti käytetyn proseduraalisen muuttujan sijaan QLXR-kyselykielessä on käytössä logiikkaohjelmoinnin jaettu muuttuja, joka on intuitiivinen - sama muuttujan nimi eri kohdissa kyselyä viittaa aina samaan muuttujan arvotukseen. Käyttäjä voi saada kyselyn tuloksena yhden tai useamman muuttujan arvotuksen tai dokumentin osan. Lisäksi hän voi kyselykielen tietokeskeisen laajennoksen ansiosta luoda uusia dokumentteja ja yhdistää ja ryhmitellä dokumenttien tietoja. QLXR-kyselykielen käyttäjä saa siis itse valita millaisen tuloksen hän haluaa saada kyselylleen.
Tutkielmassa verrataan QLXR- ja XQuery-kyselykieliä. Vertailussa havaitaan, että dokumenttikeskeisissä kyselyissä QLXR-kyselyt ovat yksinkertaisempia kuin XQuery-kyselyt, vaikka XQuery-kieleen on liitetty dokumenttikeskeisessä käsittelyssä tarpeelliset kokotekstihakuominaisuudet.
Asiasanat:XML, kyselykielet, poimintastrategiat, logiikkaohjelmointi
Tässä tutkielmassa kehitettiin dokumenttikeskeinen XML-kyselykieli QLXR. Puun sijaan XML-dokumentit mallinnettiin XML-relaatioesitystavalla, jossa XML-dokumentti esitetään kolmipaikkaisena relaationa. Relaation kaavio on D(C,T,I), missä D on XML-dokumentin nimi, C on komponentti-ilmentymä (merkkauksen nimi tai tekstimuotoisen sisällön yksittäinen sana), T on komponentti-ilmentymän tyyppi ja I indeksi. Tutkielmassa esitellään vertailukohdaksi myös kolme muuta XML-kyselykieltä.
Polkuilmausten sijaan QLXR-kyselykielessä käytetään avainsanahakuja, jotka prosessoidaan tässä tutkielmassa kehitetyllä AES-poimintastrategialla. AES poimii toisiinsa semanttisesti liittyvät avainsanojen ilmentymät myös niissä tilanteissa, joissa tutkielmassa esitellyt muut XML-tietojen poimintastrategiat epäonnistuvat.
Kyselykielissä yleisesti käytetyn proseduraalisen muuttujan sijaan QLXR-kyselykielessä on käytössä logiikkaohjelmoinnin jaettu muuttuja, joka on intuitiivinen - sama muuttujan nimi eri kohdissa kyselyä viittaa aina samaan muuttujan arvotukseen. Käyttäjä voi saada kyselyn tuloksena yhden tai useamman muuttujan arvotuksen tai dokumentin osan. Lisäksi hän voi kyselykielen tietokeskeisen laajennoksen ansiosta luoda uusia dokumentteja ja yhdistää ja ryhmitellä dokumenttien tietoja. QLXR-kyselykielen käyttäjä saa siis itse valita millaisen tuloksen hän haluaa saada kyselylleen.
Tutkielmassa verrataan QLXR- ja XQuery-kyselykieliä. Vertailussa havaitaan, että dokumenttikeskeisissä kyselyissä QLXR-kyselyt ovat yksinkertaisempia kuin XQuery-kyselyt, vaikka XQuery-kieleen on liitetty dokumenttikeskeisessä käsittelyssä tarpeelliset kokotekstihakuominaisuudet.
Asiasanat:XML, kyselykielet, poimintastrategiat, logiikkaohjelmointi