Googleta se! iGS-verkkotietopalvelun kysymystyypit ja vastausten löytyminen hakukoneiden keskivertokäyttäjien "simulaation" avulla
KERÄNEN, JANI (2010)
KERÄNEN, JANI
2010
Informaatiotutkimus - Information Studies
Informaatiotieteiden tiedekunta - Faculty of Information Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2010-05-05
Julkaisun pysyvä osoite on
https://urn.fi/urn:nbn:fi:uta-1-20510
https://urn.fi/urn:nbn:fi:uta-1-20510
Tiivistelmä
Tutkielmassa selvitettiin, missä määrin Google-hakukoneella löytyy relevantteja suomenkielisiä vastauksia iGS-verkkotietopalvelun kysymyksiin, ja minkätyyppisiä kysymyksiä asiakkaat lähettävät iGS-palveluun. Lisäksi tutkimuksessa selvitettiin, onko iGS:n kysymysten tyypillä yhteyttä siihen että missä määrin Google-hakukoneella löytyy relevantteja suomenkielisiä vastauksia iGS:n kysymyksiin.
Tutkimusmetodina käytettiin tätä tutkimusta varten kehitettyä hakukoneiden keskivertokäyttäjien "simulaatiota". Hakukoneiden käyttäjistä saatua tutkimustietoa sovellettiin eräänlaisten tutkimuksen ennakkoehtojen ja rajausten luomisessa. Käyttäjätutkimusten tulosten perusteella muodostettiin hakukoneiden keskivertokäyttäjiä "simuloivia" sääntöjä, joiden tarkoituksena oli vähentää hakijan yksilöllisten ominaisuuksien vaikutusta hakutuloksiin. "Simulaation" säännöissä määriteltiin mm. kyselyissä käytettävien hakutermien valinta, määrä ja muoto, edistyneempien hakutekniikoiden käyttö, kyselyiden muodostamismenetelmä, hakujen määrä sekä hakutulosten läpikäyminen.
Hakukoneiden keskivertokäyttäjien "simulaation" avulla Google-hakukoneella löytyi relevantti suomenkielinen vastaus 188 kysymykseen. Tutkimuksen otoksen 509 alakysymyksestä tämä oli 36,9 prosenttia, eli runsas kolmasosa. "Simulaation" säännöissä määriteltyjen rajoitusten valossa tämä tuntuu varsin suurelta luvulta. 321 kysymykseen (63,1 prosenttia) ei vastausta löytynyt Googlella.
Otoksen kysymykset jaettiin kolmeen kysymyskategoriaan. Tiettyä aihetta koskevia kysymyksiä oli eniten (44,2 prosenttia), mutta lähes yhtä paljon oli faktakysymyksiä (43,6 prosenttia). Tiettyä teosta koskevia kysymyksiä oli selvästi vähiten (12,2 prosenttia). Faktakysymyksiin löytyi parhaiten vastaus Googlella (41,4 prosenttia), seuraavaksi parhaiten tiettyä aihetta koskeviin kysymyksiin (33,8 prosenttia), ja huonoiten tiettyä teosta koskeviin kysymyksiin (30,5 prosenttia). iGS:n kysymysten tyypeillä ei kuitenkaan ollut tilastollisesti merkittävää yhteyttä siihen että missä määrin Google-hakukoneella löytyy relevantteja suomenkielisiä vastauksia iGS:n kysymyksiin.
Hakukoneiden keskivertokäyttäjien "simulaatiosta" saatuja tuloksia on melko vaikeaa yleistää, koska tällaista tutkimusmetodia ei ole koskaan aikaisemmin käytetty. Metodilla saatiin kuitenkin aikaiseksi suuntaa-antava "vähimmäistulos", ja lisäksi saatiin tietoa palvelun kysymystyypeistä. Eräänlaisena tutkimustuloksena voidaan pitää myös uudenlaisen tutkimusmetodin aikaan saamista. Hakukoneiden keskivertokäyttäjien "simulaatio" on puutteineenkin melko käyttökelpoinen tutkimusmetodi mahdollisten jatkotutkimusten kannalta. Sitä voidaan myös kehittää edelleen, ja soveltaa tiedonhakuun liittyvissä tutkimuksissa.
Asiasanat:yleiset kirjastot, verkkotietopalvelu, kysymykset, luokitukset, tiedonhaku, hakuohjelmat, Google, käyttäjät, käyttäjätutkimus, simulointi
Tutkimusmetodina käytettiin tätä tutkimusta varten kehitettyä hakukoneiden keskivertokäyttäjien "simulaatiota". Hakukoneiden käyttäjistä saatua tutkimustietoa sovellettiin eräänlaisten tutkimuksen ennakkoehtojen ja rajausten luomisessa. Käyttäjätutkimusten tulosten perusteella muodostettiin hakukoneiden keskivertokäyttäjiä "simuloivia" sääntöjä, joiden tarkoituksena oli vähentää hakijan yksilöllisten ominaisuuksien vaikutusta hakutuloksiin. "Simulaation" säännöissä määriteltiin mm. kyselyissä käytettävien hakutermien valinta, määrä ja muoto, edistyneempien hakutekniikoiden käyttö, kyselyiden muodostamismenetelmä, hakujen määrä sekä hakutulosten läpikäyminen.
Hakukoneiden keskivertokäyttäjien "simulaation" avulla Google-hakukoneella löytyi relevantti suomenkielinen vastaus 188 kysymykseen. Tutkimuksen otoksen 509 alakysymyksestä tämä oli 36,9 prosenttia, eli runsas kolmasosa. "Simulaation" säännöissä määriteltyjen rajoitusten valossa tämä tuntuu varsin suurelta luvulta. 321 kysymykseen (63,1 prosenttia) ei vastausta löytynyt Googlella.
Otoksen kysymykset jaettiin kolmeen kysymyskategoriaan. Tiettyä aihetta koskevia kysymyksiä oli eniten (44,2 prosenttia), mutta lähes yhtä paljon oli faktakysymyksiä (43,6 prosenttia). Tiettyä teosta koskevia kysymyksiä oli selvästi vähiten (12,2 prosenttia). Faktakysymyksiin löytyi parhaiten vastaus Googlella (41,4 prosenttia), seuraavaksi parhaiten tiettyä aihetta koskeviin kysymyksiin (33,8 prosenttia), ja huonoiten tiettyä teosta koskeviin kysymyksiin (30,5 prosenttia). iGS:n kysymysten tyypeillä ei kuitenkaan ollut tilastollisesti merkittävää yhteyttä siihen että missä määrin Google-hakukoneella löytyy relevantteja suomenkielisiä vastauksia iGS:n kysymyksiin.
Hakukoneiden keskivertokäyttäjien "simulaatiosta" saatuja tuloksia on melko vaikeaa yleistää, koska tällaista tutkimusmetodia ei ole koskaan aikaisemmin käytetty. Metodilla saatiin kuitenkin aikaiseksi suuntaa-antava "vähimmäistulos", ja lisäksi saatiin tietoa palvelun kysymystyypeistä. Eräänlaisena tutkimustuloksena voidaan pitää myös uudenlaisen tutkimusmetodin aikaan saamista. Hakukoneiden keskivertokäyttäjien "simulaatio" on puutteineenkin melko käyttökelpoinen tutkimusmetodi mahdollisten jatkotutkimusten kannalta. Sitä voidaan myös kehittää edelleen, ja soveltaa tiedonhakuun liittyvissä tutkimuksissa.
Asiasanat:yleiset kirjastot, verkkotietopalvelu, kysymykset, luokitukset, tiedonhaku, hakuohjelmat, Google, käyttäjät, käyttäjätutkimus, simulointi