Ontologioiden muodostaminen
Jaakkonen, Lauri (2020)
Jaakkonen, Lauri
2020
Tietojenkäsittelytieteiden kandidaattiohjelma - Bachelor's Programme in Computer Sciences
Informaatioteknologian ja viestinnän tiedekunta - Faculty of Information Technology and Communication Sciences
This publication is copyrighted. Only for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2020-12-18
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-202012108705
https://urn.fi/URN:NBN:fi:tuni-202012108705
Tiivistelmä
Ontologiat ovat yleishyödyllisiä työkaluja informaatiotutkimuksessa ja tietojenkäsittelytieteessä. Tässä kandidaatintutkielmassa suoritetaan systemaattinen kirjallisuuskatsaus, jonka tarkoituksena on selvittää, miten eri tavoin ontologioita voidaan muodostaa ja minkälaisia haasteita ontologioiden muodostamiseen liittyy.
Jotta tutkimuskysymystä olisi mielekästä pohtia, on työssä perehdytty ensiksi ontologioihin liittyviin perusasioihin. Tutkielmassa käydään perusteellisesti läpi ontologian määritelmä ja ontologioiden primitiivit eli perusosaset. Näitä primitiivejä ovat luokat, attribuutit ja suhteet. Lisäksi työssä esitellään erilaisia ontologioiden visualisointitapoja. Niitä on olemassa kymmeniä erilaisia ja ne eroavat toisistaan muun muassa värien käytön ja ulottuvuuksien määrän suhteen. Myös alan yksi tärkeimmistä ja käytetyimmistä työkaluista, Protégé, on esitelty lyhyesti.
Kirjallisuuskatsauksen tuloksena selvisi, että ontologioiden muodostamismetodeja on paljon erilaisia ja ne myös voidaan luokitella usein erilaisin tavoin. Kategorisointi voidaan suorittaa metodien etenemissuunnan perusteella. Tällöin metodit jakautuvat bottom-up, top-down ja middle-out metodeihin. Toisaalta metodit voidaan kategorisoida myös käytettyjen tiedonlähteiden perusteella. Näitä tiedonlähteitä ovat ainakin teksti, tesaurukset ja tietokantakaaviot. Ontologioiden muodostamisessa voidaan hyödyntää pohjana muun muassa ohjelmistotuotannosta tuttuja tekniikoita. Jos ontologia muodostetaan yhdistämällä toisia ontologioita, joudutaan suorittamaan ontologioiden yhteensovittaminen. Kirjallisuuskatsauksen tuloksena löytyi kahdeksan merkittävää yhteensovittamiseen liittyvää haastetta. Nämä haasteet jakautuvat kolmeen kategoriaan. Ensimmäinen kategoria on työkaluihin ja tehokkuuteen liittyvät haasteet, johon kuuluvia haasteita löydettiin kolme kappaletta. Toinen kategoria on tiedon etsimiseen ja tallentamiseen liittyvät haasteet, johon kuuluvia haasteita löydettiin kaksi kappaletta, ja viimeisenä kategoriana on ihmisiin ja yhteisöllisyyteen liittyvät haasteet, johon kuuluvia haasteita löydettiin kolme kappaletta.
Jotta tutkimuskysymystä olisi mielekästä pohtia, on työssä perehdytty ensiksi ontologioihin liittyviin perusasioihin. Tutkielmassa käydään perusteellisesti läpi ontologian määritelmä ja ontologioiden primitiivit eli perusosaset. Näitä primitiivejä ovat luokat, attribuutit ja suhteet. Lisäksi työssä esitellään erilaisia ontologioiden visualisointitapoja. Niitä on olemassa kymmeniä erilaisia ja ne eroavat toisistaan muun muassa värien käytön ja ulottuvuuksien määrän suhteen. Myös alan yksi tärkeimmistä ja käytetyimmistä työkaluista, Protégé, on esitelty lyhyesti.
Kirjallisuuskatsauksen tuloksena selvisi, että ontologioiden muodostamismetodeja on paljon erilaisia ja ne myös voidaan luokitella usein erilaisin tavoin. Kategorisointi voidaan suorittaa metodien etenemissuunnan perusteella. Tällöin metodit jakautuvat bottom-up, top-down ja middle-out metodeihin. Toisaalta metodit voidaan kategorisoida myös käytettyjen tiedonlähteiden perusteella. Näitä tiedonlähteitä ovat ainakin teksti, tesaurukset ja tietokantakaaviot. Ontologioiden muodostamisessa voidaan hyödyntää pohjana muun muassa ohjelmistotuotannosta tuttuja tekniikoita. Jos ontologia muodostetaan yhdistämällä toisia ontologioita, joudutaan suorittamaan ontologioiden yhteensovittaminen. Kirjallisuuskatsauksen tuloksena löytyi kahdeksan merkittävää yhteensovittamiseen liittyvää haastetta. Nämä haasteet jakautuvat kolmeen kategoriaan. Ensimmäinen kategoria on työkaluihin ja tehokkuuteen liittyvät haasteet, johon kuuluvia haasteita löydettiin kolme kappaletta. Toinen kategoria on tiedon etsimiseen ja tallentamiseen liittyvät haasteet, johon kuuluvia haasteita löydettiin kaksi kappaletta, ja viimeisenä kategoriana on ihmisiin ja yhteisöllisyyteen liittyvät haasteet, johon kuuluvia haasteita löydettiin kolme kappaletta.