Saksan kielen yhdyssanojen käsittely kieltenvälisessä tiedonhaussa.
HINTIKKA, KRISTIINA (2002)
Tässä tietueessa ei ole kokotekstiä saatavilla Treposta, ainoastaan metadata.
HINTIKKA, KRISTIINA
2002
Informaatiotutkimus - Information Studies
Informaatiotieteiden tiedekunta - Faculty of Information Sciences
Hyväksymispäivämäärä
2002-12-09Tiivistelmä
Sähköisessä muodossa olevan erikielisen tekstiaineiston määrä kasvaa jatkuvasti. Kieltenvälisen tiedonhaun menetelmät helpottavat tiedonhakijan ja dokumenttien välisten kielirajojen ylittämistä. Kielten välillä on monia yhtäläisyyksiä, mutta myös eroja (esimerkiksi yhdyssanojen yleisyydessä), mikä edellyttää kielten erityispiirteiden huomioimista kieltenvälisen tiedonhaun tutkimuksessa.
Tutkielmassa tarkasteltiin yhdyssanojen käsittelyä kieltenvälisessä tiedonhaussa, kun lähdekielenä (kyselyjen kielenä) oli saksa ja kohdekielenä (dokumenttien kielenä) englanti. Kyselyjen kääntäminen perustui elektronisen kaksikielisen yleissanakirjan käyttöön. Työssä selviteltiin erilaisia vastinsanojen ryhmittelytapoja ja kohdekielisen käännöksen rakenteen vaikutusta yhdyssanoja sisältävien kyselyjen tarkkuuksiin. Tutkielmassa verrattiin myös muun muassa kyselyrakenteiden tuloksellisuutta ositettuna ja suoraan käännettyjä yhdyssanoja sisältävissä kyselyissä.
Tulosten mukaan yhdyssanan käännöksen rakenne vaikutti hakutuloksiin. Ositettuna käännettyjen yhdyssanojen ryhmässä paras hakutuloksen tarkkuus saavutettiin, kun ositettuna käännetyn yhdyssanan osien vastinsanojen ryhmiä ei kytketty yhteen. Suoraan käännettyjen yhdyssanojen ryhmässä sen sijaan läheisyysoperaation käytöstä oli hyötyä. Ositettuna käännettyjen yhdyssanojen vastinsanojen manuaalinen karsiminen paransi hakutuloksia jonkin verran. Läheisyysoperaattorin väljentäminen vaikutti vaihtelevasti tarkkuuteen ositettujen yhdyssanojen joukossa, mutta vähän paransi tarkkuuksia suoraan käännettyjen yhdyssanojen joukossa. Hakutuloksille oli tyypillistä yksittäisten kyselyjen tarkkuuksien vaihtelu.
Tutkielmassa tarkasteltiin yhdyssanojen käsittelyä kieltenvälisessä tiedonhaussa, kun lähdekielenä (kyselyjen kielenä) oli saksa ja kohdekielenä (dokumenttien kielenä) englanti. Kyselyjen kääntäminen perustui elektronisen kaksikielisen yleissanakirjan käyttöön. Työssä selviteltiin erilaisia vastinsanojen ryhmittelytapoja ja kohdekielisen käännöksen rakenteen vaikutusta yhdyssanoja sisältävien kyselyjen tarkkuuksiin. Tutkielmassa verrattiin myös muun muassa kyselyrakenteiden tuloksellisuutta ositettuna ja suoraan käännettyjä yhdyssanoja sisältävissä kyselyissä.
Tulosten mukaan yhdyssanan käännöksen rakenne vaikutti hakutuloksiin. Ositettuna käännettyjen yhdyssanojen ryhmässä paras hakutuloksen tarkkuus saavutettiin, kun ositettuna käännetyn yhdyssanan osien vastinsanojen ryhmiä ei kytketty yhteen. Suoraan käännettyjen yhdyssanojen ryhmässä sen sijaan läheisyysoperaation käytöstä oli hyötyä. Ositettuna käännettyjen yhdyssanojen vastinsanojen manuaalinen karsiminen paransi hakutuloksia jonkin verran. Läheisyysoperaattorin väljentäminen vaikutti vaihtelevasti tarkkuuteen ositettujen yhdyssanojen joukossa, mutta vähän paransi tarkkuuksia suoraan käännettyjen yhdyssanojen joukossa. Hakutuloksille oli tyypillistä yksittäisten kyselyjen tarkkuuksien vaihtelu.