TRIX-tiedonhakujärjestelmän evaluointi
AALTO, TIMO (2005)
AALTO, TIMO
2005
Informaatiotutkimus - Information Studies
Informaatiotieteiden tiedekunta - Faculty of Information Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2005-03-15
Julkaisun pysyvä osoite on
https://urn.fi/urn:nbn:fi:uta-1-14518
https://urn.fi/urn:nbn:fi:uta-1-14518
Tiivistelmä
Hakutermit:
XML, tiedonhakujärjestelmät, arviointi
Tutkimus esittelee Tampereen yliopistossa vuonna 2004 kehitetyn TRIX-tiedonhakujärjestelmän. TRIX on erityisesti XML-dokumenteista tehtävään tiedonhakuun kehitetty osittaistäsmäyttävä, hierarkkiseen tietorakenteeseen perustuvaa indeksointiratkaisua käyttävä tiedonhakujärjestelmän prototyyppi. Tutkimuksen tutkimuskysymyksinä oli selvittää onko järjestelmän kahden eri hakuavainten painojen yhdistämismenetelmän välillä eroa sekä tutkia miten painotuskaavan vakion säätäminen vaikuttaa järjestelmän toimintaan.
Järjestelmää testattiin kansainvälisen INEX-evaluointihankkeen testikokoelmassa, joka koostuu noin 12000:ta XML-merkatusta tieteellisestä artikkelista. Aineistoon tehtiin kyselyjä yhteensä 76 hakuaiheesta ja tuloksia arvioitiin kahdella XML-tiedonhaun evaluointiin kehitetyllä mittarilla. Lisäksi tutkimusta varten kehitettiin oma ohjelma tuloslistojen analysointiin.
Tutkimuksen tuloksina havaittiin, että painojen yhdistämismenetelmien välillä ei ollut merkitsevää eroa sekä että painotuskaavan vakion säätämisellä on voimakas vaikutus järjestelmän palauttamien elementtien kokoon ja vaihteleva vaikutus evaluointimittareiden antamiin tuloksiin.
XML, tiedonhakujärjestelmät, arviointi
Tutkimus esittelee Tampereen yliopistossa vuonna 2004 kehitetyn TRIX-tiedonhakujärjestelmän. TRIX on erityisesti XML-dokumenteista tehtävään tiedonhakuun kehitetty osittaistäsmäyttävä, hierarkkiseen tietorakenteeseen perustuvaa indeksointiratkaisua käyttävä tiedonhakujärjestelmän prototyyppi. Tutkimuksen tutkimuskysymyksinä oli selvittää onko järjestelmän kahden eri hakuavainten painojen yhdistämismenetelmän välillä eroa sekä tutkia miten painotuskaavan vakion säätäminen vaikuttaa järjestelmän toimintaan.
Järjestelmää testattiin kansainvälisen INEX-evaluointihankkeen testikokoelmassa, joka koostuu noin 12000:ta XML-merkatusta tieteellisestä artikkelista. Aineistoon tehtiin kyselyjä yhteensä 76 hakuaiheesta ja tuloksia arvioitiin kahdella XML-tiedonhaun evaluointiin kehitetyllä mittarilla. Lisäksi tutkimusta varten kehitettiin oma ohjelma tuloslistojen analysointiin.
Tutkimuksen tuloksina havaittiin, että painojen yhdistämismenetelmien välillä ei ollut merkitsevää eroa sekä että painotuskaavan vakion säätämisellä on voimakas vaikutus järjestelmän palauttamien elementtien kokoon ja vaihteleva vaikutus evaluointimittareiden antamiin tuloksiin.