Towards simulating and evaluating user interaction in information retrieval using test collections
Keskustalo, Heikki (2010)
Keskustalo, Heikki
Tampere University Press
2010
Informaatiotutkimus - Information Studies
Informaatiotieteiden tiedekunta - Faculty of Information Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Väitöspäivä
2010-11-27
Julkaisun pysyvä osoite on
https://urn.fi/urn:isbn:978-951-44-8263-2
https://urn.fi/urn:isbn:978-951-44-8263-2
Tiivistelmä
Tiedonhakua käsittelevässä väitöskirjassa tutkittiin tiedonhaun käyttäjävuorovaikutuksen simulointia ja evaluointia testikokoelmaympäristössä.
Tiedonhaun testikokoelmatutkimuksessa on perinteisesti vertailtu hakumenetelmiä tekemällä yksittäinen haku useista eri hakuaiheista ilman että hakijan vuorovaikutusta hakujärjestelmän kanssa mallinnetaan. Todellisuudessa tiedonhaku perustuu keskeisesti hakijan vuorovaikutukselle hakujärjestelmän kanssa. Väitöskirjassa tutkittiin kahta erilaista simuloitua vuorovaikutustyyppiä: käyttäjän antamaa relevanssipalautetta sekä hakulausekkeiden suoraa muotoilua.
Relevanssipalautteen simulaatioissa tarkasteltiin relevanssipalautteen laadun ja määrän vaikutusta haun tulokseen, kun alkuperäiseen hakulausekkeeseen lisättiin automaattisesti hakusanoja simuloidun hakijan osoittamista relevanteista dokumenteista olettaen eri vaatimuksia haettavien dokumenttien laadulle.
Hakulausekkeiden suoran muotoilun simulaatioissa tarkasteltiin tilanteita, joissa hakija muotoilee uudelleen hakulausekkeita käyttäen yksinkertaisia muotoilustrategioita. Tutkimuksessa simuloitiin kärsimättömiä hakijoita, jotka käyttävät lyhyiden kyselyiden sekvenssejä ja pitävät menestyskriteerinä yksittäisen relevantin dokumentin löytymistä.
Väitöskirjan kokeelliset tulokset osoittivat, että laadultaan vaihtelevan relevanssipalautteen hyväksyminen oli tehokkaampaa kuin pyrkimys hyväksyä vain parhaat dokumentit relevanssipalautteeksi. Lisäksi erittäin lyhyet kyselyt osoittautuivat sekvensseinä käytettyinä menestyksekkäiksi toisin kuin perinteisestä näkökulmasta tarkasteltuina.
Perinteinen yksittäisille aiheenmukaisille kyselyille pohjautuva tiedonhaun laboratoriomalli ei huomioi vuorovaikutusta, joka kuitenkin on tiedonhakujärjestelmien käytön olennainen piirre. Väitöskirjassa esitetty käyttäjävuorovaikutuksen simulointi laajentaa testikokoelmapohjaista tiedonhaun tutkimusta kohti aiempaa tarkempaa käyttäjien mallintamista.
Tiedonhaun testikokoelmatutkimuksessa on perinteisesti vertailtu hakumenetelmiä tekemällä yksittäinen haku useista eri hakuaiheista ilman että hakijan vuorovaikutusta hakujärjestelmän kanssa mallinnetaan. Todellisuudessa tiedonhaku perustuu keskeisesti hakijan vuorovaikutukselle hakujärjestelmän kanssa. Väitöskirjassa tutkittiin kahta erilaista simuloitua vuorovaikutustyyppiä: käyttäjän antamaa relevanssipalautetta sekä hakulausekkeiden suoraa muotoilua.
Relevanssipalautteen simulaatioissa tarkasteltiin relevanssipalautteen laadun ja määrän vaikutusta haun tulokseen, kun alkuperäiseen hakulausekkeeseen lisättiin automaattisesti hakusanoja simuloidun hakijan osoittamista relevanteista dokumenteista olettaen eri vaatimuksia haettavien dokumenttien laadulle.
Hakulausekkeiden suoran muotoilun simulaatioissa tarkasteltiin tilanteita, joissa hakija muotoilee uudelleen hakulausekkeita käyttäen yksinkertaisia muotoilustrategioita. Tutkimuksessa simuloitiin kärsimättömiä hakijoita, jotka käyttävät lyhyiden kyselyiden sekvenssejä ja pitävät menestyskriteerinä yksittäisen relevantin dokumentin löytymistä.
Väitöskirjan kokeelliset tulokset osoittivat, että laadultaan vaihtelevan relevanssipalautteen hyväksyminen oli tehokkaampaa kuin pyrkimys hyväksyä vain parhaat dokumentit relevanssipalautteeksi. Lisäksi erittäin lyhyet kyselyt osoittautuivat sekvensseinä käytettyinä menestyksekkäiksi toisin kuin perinteisestä näkökulmasta tarkasteltuina.
Perinteinen yksittäisille aiheenmukaisille kyselyille pohjautuva tiedonhaun laboratoriomalli ei huomioi vuorovaikutusta, joka kuitenkin on tiedonhakujärjestelmien käytön olennainen piirre. Väitöskirjassa esitetty käyttäjävuorovaikutuksen simulointi laajentaa testikokoelmapohjaista tiedonhaun tutkimusta kohti aiempaa tarkempaa käyttäjien mallintamista.
Kokoelmat
- Väitöskirjat [4905]