Knowledge Discovery for Female Urinary Incontinence Expert System
Laurikkala, Jorma (2001)
Laurikkala, Jorma
Tampere University Press Tampereen yliopisto
2001
Tietojenkäsittelyoppi - Computer Science
Informaatiotieteiden tiedekunta - Faculty of Information Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Väitöspäivä
2001-10-26
Julkaisun pysyvä osoite on
https://urn.fi/urn:isbn:951-44-5193-7
https://urn.fi/urn:isbn:951-44-5193-7
Tiivistelmä
Asiantuntijajärjestelmät ovat tarkasti ongelma-alueelle rajattuja tietokoneohjelmia, joiden 'älykäs' ihmisasiantuntijan päättelyä jäljittelevä toiminta perustuu ongelmaa koskevaan tietämykseen. Tietämyksen voidaan ajatella olevan informaatiota, jonka asiantuntija on oppinut koulutuksen ja kokemuksen kautta. Parhaimmillaan asiantuntijajärjestelmä suoriutuu annetusta ongelmasta yhtä hyvin kuin alan asiantuntija. Tällaiset ohjelmat eivät korvaa ihmisasiantuntijan päättelyä, kuten lääkärin diagnoosin tekoa, mutta hyvin toteutettuna ne tukevat ja tehostavat päätöksentekoa.
Asiantuntijajärjestelmät ovat osoittautuneet tehokkaiksi ongelmanratkaisijoiksi, mutta niiden toteutustekniikkaan liittyy ongelmia. Erityisen vaikeaa on asiantuntijan tietämyksen siirto asiantuntijajärjestelmään, joka perinteisesti toteutetaan siten, että tietämysinsinööri haastattelee asiantuntijaa selvittääkseen ongelmanratkaisussa tarvittavan tietämyksen. Haastattelu on usein hidasta ja kallista, koska asiantuntijat ovat kiireisiä eivätkä he aina osaa kuvata päättelyään sanallisesti. Useaa asiantuntijaa haastateltaessa ongelmia tuottavat henkilökohtaiset erot päättelyssä ja kyvyssä kuvata päättelyä.
Artikkelimuotoisessa väitöskirjassani tarkastellaan tietämyksen hankintaa tiedonlouhinnan avulla. Tiedonlouhinnalla tarkoitetaan vaiheittaista prosessia, jossa käytetään koneoppimis- tai tilastollisia menetelmiä tietämyksen automaattiseen hankkimiseen tietokannoista. Työni tietojenkäsittelytieteellisessä osuudessa kehitettiin tiedonlouhintamenetelmiä koneoppimiseen ja tiedon esikäsittelyyn. Käytännöllinen tavoite oli toteuttaa tiedonlouhinnan avulla asiantuntijajärjestelmä naisten virtsainkontinenssin (virtsan pidätysongelmat) diagnoosin tueksi.
Työni tuotti geneettisiä algoritmeja hyödyntävän koneoppimismenetelmän sekä menetelmän vinon luokkajakauman tasaamiseen. Geneettiset algoritmit ovat saaneet nimensä siitä, että niissä hyödynnetään evoluution ja genetiikan periaatteita. Laskenta etenee luonnon valintaa mallintavan valintaprosessin sekä eräänlaisten muunnosten ja risteymien kautta kohti tavoitetta. Geneettisissä algoritmeissa tietoa käsitellään hieman samankaltaisesti kuin todellisissa geeneissä, joissa informaatio säilyy ja periytyy jälkeläiselle. Geneettiset algoritmit osoittautuivat potilasaineiston automaattisessa luokittelussa yhtä hyviksi kuin tilastolliset monimuuttujamenetelmät ja päätöspuut.
Vino luokkajakauma vaikeuttaa tiedonlouhintamenetelmien soveltamista. Pieniä luokkia, esimerkiksi harvinaisia diagnooseja, on usein vaikeaa erottaa suurista luokista. Pyrin ratkaisemaan tämän ongelman menetelmällä, joka poistaa suurista luokista epätavallisia havaintoja ja toisaalta "siivoaa" pienten ja suurien luokkien rajoja, jotta pienten luokkien tunnistaminen helpottuisi. Menetelmäni luokkajakauman tasaamiseen oli parempi kuin vertailumenetelmät.
Tiedonlouhintamenetelmiä käytettiin diagnoosisääntöjen automaattiseen hankintaan potilasaineistosta. Tämän tietämyksen avulla toteutettiin virtsainkontinenssin diagnoosia tukeva asiantuntijajärjestelmä, jonka diagnoositarkkuus kahdessa testiaineistossa oli 94% ja 91%. Automaattisten diagnoosien sensitiivisyys oli 97% ja 96% ja spesifisyys 94% ja 90%. Suurien luokkien epätavallisista potilastapauksista muodostettiin poikkeussääntöjä, joiden tavoitteena on tunnistaa epätavallisia tai mahdollisesti väärin diagnosoituja potilaita.
Työni osoitti, että tiedonlouhinta on lupaava lähestymistapa asiantuntijajärjestelmien kehitykseen. Kehitys helpottuu huomattavasti, kun pitkälliset ihmisasiantuntijoiden haastattelut voidaan korvata automaattisella tietämyksen hankinnalla. Lisäksi tämä lähestymistapa on erinomainen, kun asiantuntijoita ei ole tai ongelma on liian vaikea perinteisesti mallinnettavaksi. Tiedonlouhinnalla löydetään joskus myös tietämystä, joka on täysin uutta sovellusalueen asiantuntijoille. Mikäli asiantuntija on saatavilla, on järkevää hyödyntää hänen asiantuntemustaan erityisesti tietämyksen laadun arvioinnissa. Asiantuntijaa ei siis pyritä sulkemaan pois tiedonlouhinnan avulla vaan hänen roolinsa muuttuu Tietämys hankitaan automaattisesti, mutta asiantuntijat arvioivat tietämyksen laatua ja käyttökelpoisuutta. Haittapuolina perinteiseen kehitystapaan verrattuna ovat syvällisen tietämyksen puute ja rajoittuneet selitykset päätelmille.
Tulevaisuuden tutkimuskohteita ovat muun muassa asiantuntijajärjestelmän jatkokehitys, geneettisten algoritmien sovellukset koneoppimisessa ja tiedonlouhintamenetelmien integrointi asiantuntijajärjestelmäkehittimiin.
Asiantuntijajärjestelmät ovat osoittautuneet tehokkaiksi ongelmanratkaisijoiksi, mutta niiden toteutustekniikkaan liittyy ongelmia. Erityisen vaikeaa on asiantuntijan tietämyksen siirto asiantuntijajärjestelmään, joka perinteisesti toteutetaan siten, että tietämysinsinööri haastattelee asiantuntijaa selvittääkseen ongelmanratkaisussa tarvittavan tietämyksen. Haastattelu on usein hidasta ja kallista, koska asiantuntijat ovat kiireisiä eivätkä he aina osaa kuvata päättelyään sanallisesti. Useaa asiantuntijaa haastateltaessa ongelmia tuottavat henkilökohtaiset erot päättelyssä ja kyvyssä kuvata päättelyä.
Artikkelimuotoisessa väitöskirjassani tarkastellaan tietämyksen hankintaa tiedonlouhinnan avulla. Tiedonlouhinnalla tarkoitetaan vaiheittaista prosessia, jossa käytetään koneoppimis- tai tilastollisia menetelmiä tietämyksen automaattiseen hankkimiseen tietokannoista. Työni tietojenkäsittelytieteellisessä osuudessa kehitettiin tiedonlouhintamenetelmiä koneoppimiseen ja tiedon esikäsittelyyn. Käytännöllinen tavoite oli toteuttaa tiedonlouhinnan avulla asiantuntijajärjestelmä naisten virtsainkontinenssin (virtsan pidätysongelmat) diagnoosin tueksi.
Työni tuotti geneettisiä algoritmeja hyödyntävän koneoppimismenetelmän sekä menetelmän vinon luokkajakauman tasaamiseen. Geneettiset algoritmit ovat saaneet nimensä siitä, että niissä hyödynnetään evoluution ja genetiikan periaatteita. Laskenta etenee luonnon valintaa mallintavan valintaprosessin sekä eräänlaisten muunnosten ja risteymien kautta kohti tavoitetta. Geneettisissä algoritmeissa tietoa käsitellään hieman samankaltaisesti kuin todellisissa geeneissä, joissa informaatio säilyy ja periytyy jälkeläiselle. Geneettiset algoritmit osoittautuivat potilasaineiston automaattisessa luokittelussa yhtä hyviksi kuin tilastolliset monimuuttujamenetelmät ja päätöspuut.
Vino luokkajakauma vaikeuttaa tiedonlouhintamenetelmien soveltamista. Pieniä luokkia, esimerkiksi harvinaisia diagnooseja, on usein vaikeaa erottaa suurista luokista. Pyrin ratkaisemaan tämän ongelman menetelmällä, joka poistaa suurista luokista epätavallisia havaintoja ja toisaalta "siivoaa" pienten ja suurien luokkien rajoja, jotta pienten luokkien tunnistaminen helpottuisi. Menetelmäni luokkajakauman tasaamiseen oli parempi kuin vertailumenetelmät.
Tiedonlouhintamenetelmiä käytettiin diagnoosisääntöjen automaattiseen hankintaan potilasaineistosta. Tämän tietämyksen avulla toteutettiin virtsainkontinenssin diagnoosia tukeva asiantuntijajärjestelmä, jonka diagnoositarkkuus kahdessa testiaineistossa oli 94% ja 91%. Automaattisten diagnoosien sensitiivisyys oli 97% ja 96% ja spesifisyys 94% ja 90%. Suurien luokkien epätavallisista potilastapauksista muodostettiin poikkeussääntöjä, joiden tavoitteena on tunnistaa epätavallisia tai mahdollisesti väärin diagnosoituja potilaita.
Työni osoitti, että tiedonlouhinta on lupaava lähestymistapa asiantuntijajärjestelmien kehitykseen. Kehitys helpottuu huomattavasti, kun pitkälliset ihmisasiantuntijoiden haastattelut voidaan korvata automaattisella tietämyksen hankinnalla. Lisäksi tämä lähestymistapa on erinomainen, kun asiantuntijoita ei ole tai ongelma on liian vaikea perinteisesti mallinnettavaksi. Tiedonlouhinnalla löydetään joskus myös tietämystä, joka on täysin uutta sovellusalueen asiantuntijoille. Mikäli asiantuntija on saatavilla, on järkevää hyödyntää hänen asiantuntemustaan erityisesti tietämyksen laadun arvioinnissa. Asiantuntijaa ei siis pyritä sulkemaan pois tiedonlouhinnan avulla vaan hänen roolinsa muuttuu Tietämys hankitaan automaattisesti, mutta asiantuntijat arvioivat tietämyksen laatua ja käyttökelpoisuutta. Haittapuolina perinteiseen kehitystapaan verrattuna ovat syvällisen tietämyksen puute ja rajoittuneet selitykset päätelmille.
Tulevaisuuden tutkimuskohteita ovat muun muassa asiantuntijajärjestelmän jatkokehitys, geneettisten algoritmien sovellukset koneoppimisessa ja tiedonlouhintamenetelmien integrointi asiantuntijajärjestelmäkehittimiin.
Kokoelmat
- Väitöskirjat [4866]