"Sokea idiootti" : konekääntämisen ongelmia ja mahdollisuuksia
MALMIVAARA, ANNI (2007)
MALMIVAARA, ANNI
2007
Käännöstiede (saksa) - Translation Studies (German)
Humanistinen tiedekunta - Faculty of Humanities
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2007-06-04
Julkaisun pysyvä osoite on
https://urn.fi/urn:nbn:fi:uta-1-16981
https://urn.fi/urn:nbn:fi:uta-1-16981
Tiivistelmä
Tässä tutkielmassa tarkastellaan konekääntämisen mahdollisuuksia ja ongelmia. Konekääntämisestä on sen alkuajoista, siis noin 1950-luvulta, lähtien povattu tulevaisuuden suurta menestystä, joka korvaa ihmiskääntäjät täysin. Kuitenkin on osoittautunut, että luonnolliselta kielelle toiselle kääntävää ohjelmaa on käytännössä hyvin vaikea toteuttaa.
Kääntäminen on ihmisellekin hankalaa; se vaatii kahden tai useamman kielen erinomaista osaamista sekä laajaa kulttuurien tuntemusta. Ihmisen käyttämä kieli on monimutkaista ja välillä monitulkintaista. Kone ei ymmärrä kieltä, saatikka että se osaisi kääntää toiselle kielelle.
Konekäännökset sisältävät usein vääriä käännöksiä, sanajärjestysvirheitä sekä kääntämättä jääneitä sanoja. Koneelle on lähes mahdotonta syöttää monitulkintaisia sanoja, kaikkien sanojen eri taivutusmuotoja ja synonyymejä. Elektroniset sanakirjat paisuisivat järjettömän suuriksi, mikä johtaisi hitaampiin käännösohjelmistoihin.
Tutkin konekääntämisen erilaisia menetelmiä ja taustoja. Pohdin myös, mihin konekäännöksiä voidaan käyttää laatuongelmista huolimatta. Konekääntämisen tutkijat ovat perustelleet, että konekääntäminen on erinomainen tapa selvittää vieraalla kielellä kirjoitetun tekstin sisältö. Asiantuntijalle usein riittää, että tekstin ydinasiat tulevat selviksi, vaikka sanajärjestys- tai kielioppivirheet estäisivätkin tekstin julkaisemisen sellaisenaan.
Konekäännöksiä käytetään yleisesti esimerkiksi Euroopan komission käännöspalvelussa nopeuttamaan ihmiskääntäjien työtä. Vieraskielisestä tekstistä tehdään ensin konekäännös, jonka pohjalta ihminen muokkaa julkaisukelpoisen tekstin. Joskus virkamiehet teettävät konekäännöksiä itselleen, saadakseen selville mitä teksti käsittelee.
Internetissä on tarjolla kaupallisia konekäännösohjelmia, joista osa tarjoaa käännöksiä ilmaiseksi. Tutkimuksessani käänsin kolme erilaista teknisen alan tekstiä Babel Fish -nimisellä ohjelmalla tarkoituksenani selvittää konekäännösten laatua. Tulokseni ei ollut yllättävä, vaan päinvastoin tuki ennakkokäsitystä siitä, että nykyiset konekäännösohjelmat eivät sovellu kääntämiseen sellaisenaan. Koneen tekemät käännökset täytyy ihmisen toimesta muokata jälkikäteen. Konekäännökset sisälsivät paljon vääriä sanajärjestyksiä, kääntämättä jääneitä sanoja sekä kielioppivirheitä.
Avainsanat: konekääntäminen, konekäännös, ihmiskääntäjä, luonnollinen kieli
Kääntäminen on ihmisellekin hankalaa; se vaatii kahden tai useamman kielen erinomaista osaamista sekä laajaa kulttuurien tuntemusta. Ihmisen käyttämä kieli on monimutkaista ja välillä monitulkintaista. Kone ei ymmärrä kieltä, saatikka että se osaisi kääntää toiselle kielelle.
Konekäännökset sisältävät usein vääriä käännöksiä, sanajärjestysvirheitä sekä kääntämättä jääneitä sanoja. Koneelle on lähes mahdotonta syöttää monitulkintaisia sanoja, kaikkien sanojen eri taivutusmuotoja ja synonyymejä. Elektroniset sanakirjat paisuisivat järjettömän suuriksi, mikä johtaisi hitaampiin käännösohjelmistoihin.
Tutkin konekääntämisen erilaisia menetelmiä ja taustoja. Pohdin myös, mihin konekäännöksiä voidaan käyttää laatuongelmista huolimatta. Konekääntämisen tutkijat ovat perustelleet, että konekääntäminen on erinomainen tapa selvittää vieraalla kielellä kirjoitetun tekstin sisältö. Asiantuntijalle usein riittää, että tekstin ydinasiat tulevat selviksi, vaikka sanajärjestys- tai kielioppivirheet estäisivätkin tekstin julkaisemisen sellaisenaan.
Konekäännöksiä käytetään yleisesti esimerkiksi Euroopan komission käännöspalvelussa nopeuttamaan ihmiskääntäjien työtä. Vieraskielisestä tekstistä tehdään ensin konekäännös, jonka pohjalta ihminen muokkaa julkaisukelpoisen tekstin. Joskus virkamiehet teettävät konekäännöksiä itselleen, saadakseen selville mitä teksti käsittelee.
Internetissä on tarjolla kaupallisia konekäännösohjelmia, joista osa tarjoaa käännöksiä ilmaiseksi. Tutkimuksessani käänsin kolme erilaista teknisen alan tekstiä Babel Fish -nimisellä ohjelmalla tarkoituksenani selvittää konekäännösten laatua. Tulokseni ei ollut yllättävä, vaan päinvastoin tuki ennakkokäsitystä siitä, että nykyiset konekäännösohjelmat eivät sovellu kääntämiseen sellaisenaan. Koneen tekemät käännökset täytyy ihmisen toimesta muokata jälkikäteen. Konekäännökset sisälsivät paljon vääriä sanajärjestyksiä, kääntämättä jääneitä sanoja sekä kielioppivirheitä.
Avainsanat: konekääntäminen, konekäännös, ihmiskääntäjä, luonnollinen kieli