Sääntöpohjaisten menetelmien soveltuvuus tiedonlouhinnassa
Viinikainen, Joona (2024)
Viinikainen, Joona
2024
Tieto- ja sähkötekniikan kandidaattiohjelma - Bachelor's Programme in Computing and Electrical Engineering
Informaatioteknologian ja viestinnän tiedekunta - Faculty of Information Technology and Communication Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2024-04-30
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-202404234223
https://urn.fi/URN:NBN:fi:tuni-202404234223
Tiivistelmä
Tiedonlouhinta on prosessi, jossa datasta etsitään kiinnostavia yhteyksiä. Tämä
menetelmä on saanut huomiota datan määrän kasvamisen, koneoppimisen ja
tietokoneiden tehokkuuden kasvamisen myötä. Sääntöpohjainen tiedonlouhinta on yksi
lähestymistapa useiden muiden menetelmien joukossa. Se perustuu formaalin logiikan
sääntöihin, ja se on saanut paljon vaikutteita aikaisemmista logiikan sovelluksista kuten
logiikkaohjelmoinnista. Työn tarkoituksena on selvittää, milloin sääntöpohjaisia
menetelmiä voidaan ja on kannattavaa soveltaa.
Työ aloitetaan logiikan määritelmien esittelyllä. Tavoitteena on havainnollistaa,
mihin louhittavien sääntöjen esitysmuoto perustuu. Tällöin myös esitellään, kuinka
relaatioilla voidaan laajentaa tarkasteltavaa kieltä, jolloin saadaan aikaiseksi yhtenäinen
runko myöhemmin esiteltävien menetelmien tueksi. Lisäksi näytetään erilaisia
sääntöjen esitystapoja, joita on esitetty tutkimuksissa. Sääntöjen jälkeen esitellään kaksi
algoritmia sääntöjen louhimiseen. Algoritmien tarkoitus on havainnollistaa erilaisten
menetelmien ominaisuuksia ja antaa kontekstia, mihin työssä esiteltävä lähestymistapa
perustuu. Algoritmien jälkeen tarkastellaan tiedonlouhinnan erilaisia tehtäviä. Tämän
jälkeen tarkastellaan sääntöpohjaisia menetelmiä yleisellä tasolla ja vastataan
tutkimuskysymykseen: milloin sääntöpohjaisia menetelmiä voidaan soveltaa
tiedonlouhinnassa.
Kirjallisuuskatsauksessa huomataan, että tutkittavilla menetelmillä voidaan ratkaista
useita erilaisia tehtäviä. Sääntöpohjaisien menetelmien sovelluksista on tehty
tutkimusta lukuisista erilaisista käyttötarkoituksista. Kuitenkin soveltuvuuteen vaikuttaa
enemmän muut tekijät kuten ongelman luonne, datan esitystapa, ihmisten kyky
mallintaa ongelmaa ja sovelluskohteen koko. Parhainten sääntöpohjainen
lähestymistapa suoriutuu, kun ongelma voidaan luonnollisesti esittää diskreetein
rakentein. Toisaalta datan tulisi olla sellaista, että algoritmeja voidaan soveltaa siihen
luonnollisesti. Lisäksi useat menetelmät vaativat käyttäjältä jonkinlaista ohjausta
prosessissa.
menetelmä on saanut huomiota datan määrän kasvamisen, koneoppimisen ja
tietokoneiden tehokkuuden kasvamisen myötä. Sääntöpohjainen tiedonlouhinta on yksi
lähestymistapa useiden muiden menetelmien joukossa. Se perustuu formaalin logiikan
sääntöihin, ja se on saanut paljon vaikutteita aikaisemmista logiikan sovelluksista kuten
logiikkaohjelmoinnista. Työn tarkoituksena on selvittää, milloin sääntöpohjaisia
menetelmiä voidaan ja on kannattavaa soveltaa.
Työ aloitetaan logiikan määritelmien esittelyllä. Tavoitteena on havainnollistaa,
mihin louhittavien sääntöjen esitysmuoto perustuu. Tällöin myös esitellään, kuinka
relaatioilla voidaan laajentaa tarkasteltavaa kieltä, jolloin saadaan aikaiseksi yhtenäinen
runko myöhemmin esiteltävien menetelmien tueksi. Lisäksi näytetään erilaisia
sääntöjen esitystapoja, joita on esitetty tutkimuksissa. Sääntöjen jälkeen esitellään kaksi
algoritmia sääntöjen louhimiseen. Algoritmien tarkoitus on havainnollistaa erilaisten
menetelmien ominaisuuksia ja antaa kontekstia, mihin työssä esiteltävä lähestymistapa
perustuu. Algoritmien jälkeen tarkastellaan tiedonlouhinnan erilaisia tehtäviä. Tämän
jälkeen tarkastellaan sääntöpohjaisia menetelmiä yleisellä tasolla ja vastataan
tutkimuskysymykseen: milloin sääntöpohjaisia menetelmiä voidaan soveltaa
tiedonlouhinnassa.
Kirjallisuuskatsauksessa huomataan, että tutkittavilla menetelmillä voidaan ratkaista
useita erilaisia tehtäviä. Sääntöpohjaisien menetelmien sovelluksista on tehty
tutkimusta lukuisista erilaisista käyttötarkoituksista. Kuitenkin soveltuvuuteen vaikuttaa
enemmän muut tekijät kuten ongelman luonne, datan esitystapa, ihmisten kyky
mallintaa ongelmaa ja sovelluskohteen koko. Parhainten sääntöpohjainen
lähestymistapa suoriutuu, kun ongelma voidaan luonnollisesti esittää diskreetein
rakentein. Toisaalta datan tulisi olla sellaista, että algoritmeja voidaan soveltaa siihen
luonnollisesti. Lisäksi useat menetelmät vaativat käyttäjältä jonkinlaista ohjausta
prosessissa.
Kokoelmat
- Kandidaatintutkielmat [10837]
