Simulating Search Sessions in Interactive Information Retrieval Evaluation
Baskaya, Feza (2014)
Baskaya, Feza
Tampere University Press
2014
Informaatiotutkimus ja interaktiivinen media - Information Studies and Interactive Media
Informaatiotieteiden yksikkö - School of Information Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Väitöspäivä
2014-06-13
Julkaisun pysyvä osoite on
https://urn.fi/URN:ISBN:978-951-44-9499-4
https://urn.fi/URN:ISBN:978-951-44-9499-4
Tiivistelmä
Väitöskirjatyössä tutkittiin tiedonhakijoiden ominaisuuksien ja relevanssipalautteen vaikutuksia haun tehokkuuteen. Todellisten testihenkilöiden käyttöön liittyviä kustannuksia vältettiin tarkastelemalla tiedonhakijoiden käyttäytymisen vaikutuksia simulaatioiden avulla.
Tutkimuksessa tarkasteltiin uuden, koneoppimiseen perustuvan luokittelumenetelmän kykyä parantaa haun tulosta simuloidun relevanssipalautteen perusteella. Tutkimuksessa havaittiin, että relevanssipalaute, jossa on realistinen määrä virheitä, ei heikennä haun tehokkuutta merkitsevästi lyhyitä kyselyitä käytettäessä.
Tutkimuksessa havaittiin myös, että perinteiset kokeellisen tiedonhaun evaluointimittarit voivat antaa harhaanjohtavia tuloksia vertailtaessa hakustrategioita eri ympäristöissä, jos aikatekijä otetaan huomioon.
Tutkimuksessa tarkasteltiin lisäksi kyselynmuotoilustrategioiden vaikutuksia, generoimalla kattavasti kaikki muotoilustrategiat rajallisen hakusanajoukon pohjalta. Tällöin havaittiin, että ei ole löydettävissä yleisstrategiaa, joka toimisi parhaiten kaikilla käytetyillä eri hakuaiheilla.
Tutkimus kiinnittää huomion siihen, että perinteisessä kokeellisen tiedonhaun tutkimuksessa ei ole ollut tapana mallintaa eräitä muuttujia, jotka ovat keskeinen osa hakuprosessia ja joilla voi olla vaikutusta haun tuloksellisuuteen.
Tällaisia ovat esimerkiksi kyselyjen muotoilustrategiat ja hakutulosten
selailuun ja relevanssiarviointiin liittyvät piirteet. Näiden muuttujien vaikutukset tulisikin ottaa huomioon evaluoitaessa vuorovaikutteista tiedonhakua.
Tutkimuksessa tarkasteltiin uuden, koneoppimiseen perustuvan luokittelumenetelmän kykyä parantaa haun tulosta simuloidun relevanssipalautteen perusteella. Tutkimuksessa havaittiin, että relevanssipalaute, jossa on realistinen määrä virheitä, ei heikennä haun tehokkuutta merkitsevästi lyhyitä kyselyitä käytettäessä.
Tutkimuksessa havaittiin myös, että perinteiset kokeellisen tiedonhaun evaluointimittarit voivat antaa harhaanjohtavia tuloksia vertailtaessa hakustrategioita eri ympäristöissä, jos aikatekijä otetaan huomioon.
Tutkimuksessa tarkasteltiin lisäksi kyselynmuotoilustrategioiden vaikutuksia, generoimalla kattavasti kaikki muotoilustrategiat rajallisen hakusanajoukon pohjalta. Tällöin havaittiin, että ei ole löydettävissä yleisstrategiaa, joka toimisi parhaiten kaikilla käytetyillä eri hakuaiheilla.
Tutkimus kiinnittää huomion siihen, että perinteisessä kokeellisen tiedonhaun tutkimuksessa ei ole ollut tapana mallintaa eräitä muuttujia, jotka ovat keskeinen osa hakuprosessia ja joilla voi olla vaikutusta haun tuloksellisuuteen.
Tällaisia ovat esimerkiksi kyselyjen muotoilustrategiat ja hakutulosten
selailuun ja relevanssiarviointiin liittyvät piirteet. Näiden muuttujien vaikutukset tulisikin ottaa huomioon evaluoitaessa vuorovaikutteista tiedonhakua.
Kokoelmat
- Väitöskirjat [5019]