Semanttiset verkkokyselyt: Tiedon louhinnasta tiedon poimintaan
Järvinen, Veli (2023)
Järvinen, Veli
2023
Tietojenkäsittelyopin maisteriohjelma - Master's Programme in Computer Science
Informaatioteknologian ja viestinnän tiedekunta - Faculty of Information Technology and Communication Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2023-03-15
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-202302282666
https://urn.fi/URN:NBN:fi:tuni-202302282666
Tiivistelmä
Semanttisilla verkkoteknologioilla (RDF, RDFS, OWL) luodaan käsitteitä määritteleviä sanastoja sekä tuetaan sanastoja hyödyntäviä sovelluksia. Linkitetyn tiedon periaatteita on ollut mahdollista toteuttaa jo hyvän aikaa, mutta verkkodatan koneluettava kuvaaminen RDF-tiedostoilla on edelleen harvinaista julkishallinnollisten toimijoiden ulkopuolella. Semanttisten verkkoteknologioiden mahdollistama verkottuneen tiedon aikakausi on alkanut hiipien ja useimpien huomaamatta.
Tässä työssä tutkitaan, kuinka semanttisia verkkoteknologioita voidaan hyödyntää kansalaisia suoraan koskettavissa sovelluskohteissa. Erilaiset kyselytutkimukset liittyen asiakastyytyväisyyteen, työhyvinvointiin ja tieteellisen tutkimusaineiston kokoamiseen ovat yleisiä. Monivalintatehtävä on perinteinen kyselyjen formaatti, joka tekee tilastodatan tuottamisesta helppoa. Tämä karsii kuitenkin vastaajan ilmaisuvoiman minimiin, kun tehtävänä on valita reagointivaihtoehto annettuun väitteeseen. Semanttisilla verkkoteknologioilla voidaan esittää koneluettavaa kuvaustietoa myös kyselyvastauksesta ja tämän voi toteuttaa vastaaja itse. Tällöin vastaajalla on käytössään valmiiden vaihtoehtojen sijasta laaja käsitesanasto, eli ontologia. Tästä valitut asiasanat kertovat monivalintatehtävää tarkemmalla resoluutiolla, mikä on vastaajan suhtautuminen annettuun asiaan.
Vapaista tekstisyötteistä etsitään tilastoitavaa dataa sekä toistuvia kaavoja tiedonlouhinnan menetelmillä. Näin on tutkittu muun muassa tieteellisiä artikkeleita ja sosiaalisen median julkaisuja. Semanttisilla verkkoteknologioilla data voidaan koota merkityssisällöltään tunnettuihin kategorioihin jo tiedonkeräämisen vaiheessa. Tässä työssä menettelyä luonnehditaan semanttiseksi verkkokyselyksi. Esimerkkinä käytetään Vaalikone-verkkosovellusta, jossa monivalintatehtävien sijasta vaaliehdokkaat vastaavat kysymyksiin ontologian käsitteistä muodostetuilla argumenteilla. Vastaukset visualisoidaan käsitekarttojen tapaan. Tämän työn tulosten mukaan menetelmä on haasteellinen sovelluksen käytettävyyden näkökulmasta. Toiminta on luonteeltaan käsitteellistä mallintamista, joka on kognitiivisesti vaativaa. Semanttisen verkkokyselyn rakennetta yksinkertaistamalla ja ilmaisunvapautta rajoittamalla kognitiivista kynnystä voidaan kuitenkin madaltaa.
Tässä työssä tutkitaan, kuinka semanttisia verkkoteknologioita voidaan hyödyntää kansalaisia suoraan koskettavissa sovelluskohteissa. Erilaiset kyselytutkimukset liittyen asiakastyytyväisyyteen, työhyvinvointiin ja tieteellisen tutkimusaineiston kokoamiseen ovat yleisiä. Monivalintatehtävä on perinteinen kyselyjen formaatti, joka tekee tilastodatan tuottamisesta helppoa. Tämä karsii kuitenkin vastaajan ilmaisuvoiman minimiin, kun tehtävänä on valita reagointivaihtoehto annettuun väitteeseen. Semanttisilla verkkoteknologioilla voidaan esittää koneluettavaa kuvaustietoa myös kyselyvastauksesta ja tämän voi toteuttaa vastaaja itse. Tällöin vastaajalla on käytössään valmiiden vaihtoehtojen sijasta laaja käsitesanasto, eli ontologia. Tästä valitut asiasanat kertovat monivalintatehtävää tarkemmalla resoluutiolla, mikä on vastaajan suhtautuminen annettuun asiaan.
Vapaista tekstisyötteistä etsitään tilastoitavaa dataa sekä toistuvia kaavoja tiedonlouhinnan menetelmillä. Näin on tutkittu muun muassa tieteellisiä artikkeleita ja sosiaalisen median julkaisuja. Semanttisilla verkkoteknologioilla data voidaan koota merkityssisällöltään tunnettuihin kategorioihin jo tiedonkeräämisen vaiheessa. Tässä työssä menettelyä luonnehditaan semanttiseksi verkkokyselyksi. Esimerkkinä käytetään Vaalikone-verkkosovellusta, jossa monivalintatehtävien sijasta vaaliehdokkaat vastaavat kysymyksiin ontologian käsitteistä muodostetuilla argumenteilla. Vastaukset visualisoidaan käsitekarttojen tapaan. Tämän työn tulosten mukaan menetelmä on haasteellinen sovelluksen käytettävyyden näkökulmasta. Toiminta on luonteeltaan käsitteellistä mallintamista, joka on kognitiivisesti vaativaa. Semanttisen verkkokyselyn rakennetta yksinkertaistamalla ja ilmaisunvapautta rajoittamalla kognitiivista kynnystä voidaan kuitenkin madaltaa.