Fel i maskinöversättningar : Maskinöversättningars kvalitet och behov av efterredigering i språkparet svenska–finska
Luoma, Katarina (2021)
Luoma, Katarina
2021
Monikielisen viestinnän ja käännöstieteen maisteriohjelma - Master's Programme in Multilingual Communication and Translation Studies
Informaatioteknologian ja viestinnän tiedekunta - Faculty of Information Technology and Communication Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2021-01-18
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-202012158883
https://urn.fi/URN:NBN:fi:tuni-202012158883
Tiivistelmä
Denna avhandling pro gradu behandlar maskinöversättningars kvalitet och behov av efterredigering i språkparet svenska–finska. Syftet med undersökningen har varit att ta reda på och beskriva kvaliteten på maskinöversättningar och behovet av efterredigering av texter som representerar olika genrer. Jag har fokuserat på de fel som förekommer i maskinöversättningar. I tillägg till detta har jag också varit intresserad av genrens påverkan på översättningarnas kvalitet.
Undersökningens material består av tre svenskspråkiga texter (källtexter) som representerar tre olika genrer – ett avtal, en nyhet och ett recept – och deras finskspråkiga maskinöversättningar (måltexter). Från varje källtext plockades ut ett utdrag på cirka ett hundra ord som sedan översattes maskinellt med hjälp av tre olika maskinöversättningstjänster: Google Översätt, Fiskmö Översättare och EU Council Presidency Translator. Materialet analyserades med en materialbaserad innehållsanalys som hade både kvalitativa och kvantitativa drag. Enligt den utvalda metoden kategoriserades felen i maskinöversättningarna i fem olika felkategorier. I tillägg till detta efterredigerades det en del av de felaktiga meningarna i maskinöversättningarna.
De centrala resultaten visar att det finns ett relativt stort antal fel i alla maskinöversättningar som analyserades i denna undersökning. Ingen av dem kan därför påstås vara av särskilt bra kvalitet eller uppfylla samma krav som vanligen ställs för mänskligt översatta texter. Det betyder att var och en av maskinöversättningarna behöver någon slags efterredigering före publicering.
Resultaten visar också att det finns en mycket liten skillnad i antalet fel mellan avtals- och nyhetsöversättningarna och en mycket stor skillnad i antalet fel mellan receptöversättningarna och avtals- och nyhetsöversättningarna. Därför kan det konstateras att genren har en relativt föga påverkan på maskinöversättningarnas kvalitet. Av resultaten kan dras den slutsatsen att maskinöversättning i språkparet svenska–finska inte fungerar särskilt bra vid den innevarande tidpunkten. Framtiden kan dock se annorlunda ut när maskinöversättningstjänster får mer erfarenhet av översättning mellan svenskan och finskan. Tässä pro gradu -tutkielmassa tarkastellaan konekäännösten laatua ja jälkieditoinnin tarvetta kieliparissa ruotsi–suomi. Tutkielman tavoitteena on ollut selvittää ja kuvailla konekäännösten laatua ja eri genreihin kuuluvien tekstien jälkieditoinnin tarvetta. Olen keskittynyt konekäännöksissä esiintyviin virheisiin. Lisäksi olen ollut kiinnostunut genren vaikutuksesta käännösten laatuun.
Tutkimuksen aineisto koostuu kolmesta eri genreihin kuuluvasta ruotsinkielisestä tekstistä (lähtötekstistä) – sopimuksesta, uutisesta ja reseptistä – ja niiden suomenkielisistä konekäännöksistä (kohdeteksteistä). Jokaisesta lähtötekstistä poimittiin noin sadan sanan mittainen katkelma, joka konekäännettiin kolmella eri konekääntimellä: Google Kääntäjällä, Fiskmö Kääntäjällä ja EU Council Presidency Translator -kääntäjällä. Aineiston analyysi toteutettiin materiaalipohjaisella sisällönanalyysilla, jolla oli sekä kvalitatiivisia että kvantitatiivisia piirteitä. Valitun menetelmän mukaan konekäännösten virheet kategorisoitiin viiteen eri virhekategoriaan. Tämän lisäksi osa konekäännösten virheellisistä virkkeistä jälkieditoitiin.
Keskeiset tutkimustulokset osoittavat, että kaikissa tässä tutkimuksessa analysoiduissa konekäännöksissä on suhteellisen suuri määrä virheitä. Yhdenkään niistä ei siksi voida väittää olevan laadultaan erityisen hyvä eikä täyttävän samoja vaatimuksia, jotka yleensä asetetaan ihmisen kääntämille teksteille. Se tarkoittaa, että jokainen näistä konekäännöksistä tarvitsee jonkinlaista jälkieditointia ennen julkaisua.
Lisäksi tutkimustulokset osoittavat, että sopimus- ja uutiskäännösten virheiden määrässä on hyvin pieni ero ja reseptikäännösten ja sopimus- ja uutiskäännösten virheiden määrässä on hyvin suuri ero. Siksi voidaan todeta, että genrellä on suhteellisen pieni vaikutus konekäännösten laatuun. Tutkimustuloksista voidaan vetää sellainen johtopäätös, ettei konekääntäminen kieliparissa ruotsi–suomi toimi kovin hyvin tällä hetkellä. Tulevaisuus saattaa kuitenkin näyttää erilaiselta, kun konekääntimet saavat lisää kokemusta ruotsin ja suomen välillä kääntämisestä.
Undersökningens material består av tre svenskspråkiga texter (källtexter) som representerar tre olika genrer – ett avtal, en nyhet och ett recept – och deras finskspråkiga maskinöversättningar (måltexter). Från varje källtext plockades ut ett utdrag på cirka ett hundra ord som sedan översattes maskinellt med hjälp av tre olika maskinöversättningstjänster: Google Översätt, Fiskmö Översättare och EU Council Presidency Translator. Materialet analyserades med en materialbaserad innehållsanalys som hade både kvalitativa och kvantitativa drag. Enligt den utvalda metoden kategoriserades felen i maskinöversättningarna i fem olika felkategorier. I tillägg till detta efterredigerades det en del av de felaktiga meningarna i maskinöversättningarna.
De centrala resultaten visar att det finns ett relativt stort antal fel i alla maskinöversättningar som analyserades i denna undersökning. Ingen av dem kan därför påstås vara av särskilt bra kvalitet eller uppfylla samma krav som vanligen ställs för mänskligt översatta texter. Det betyder att var och en av maskinöversättningarna behöver någon slags efterredigering före publicering.
Resultaten visar också att det finns en mycket liten skillnad i antalet fel mellan avtals- och nyhetsöversättningarna och en mycket stor skillnad i antalet fel mellan receptöversättningarna och avtals- och nyhetsöversättningarna. Därför kan det konstateras att genren har en relativt föga påverkan på maskinöversättningarnas kvalitet. Av resultaten kan dras den slutsatsen att maskinöversättning i språkparet svenska–finska inte fungerar särskilt bra vid den innevarande tidpunkten. Framtiden kan dock se annorlunda ut när maskinöversättningstjänster får mer erfarenhet av översättning mellan svenskan och finskan.
Tutkimuksen aineisto koostuu kolmesta eri genreihin kuuluvasta ruotsinkielisestä tekstistä (lähtötekstistä) – sopimuksesta, uutisesta ja reseptistä – ja niiden suomenkielisistä konekäännöksistä (kohdeteksteistä). Jokaisesta lähtötekstistä poimittiin noin sadan sanan mittainen katkelma, joka konekäännettiin kolmella eri konekääntimellä: Google Kääntäjällä, Fiskmö Kääntäjällä ja EU Council Presidency Translator -kääntäjällä. Aineiston analyysi toteutettiin materiaalipohjaisella sisällönanalyysilla, jolla oli sekä kvalitatiivisia että kvantitatiivisia piirteitä. Valitun menetelmän mukaan konekäännösten virheet kategorisoitiin viiteen eri virhekategoriaan. Tämän lisäksi osa konekäännösten virheellisistä virkkeistä jälkieditoitiin.
Keskeiset tutkimustulokset osoittavat, että kaikissa tässä tutkimuksessa analysoiduissa konekäännöksissä on suhteellisen suuri määrä virheitä. Yhdenkään niistä ei siksi voida väittää olevan laadultaan erityisen hyvä eikä täyttävän samoja vaatimuksia, jotka yleensä asetetaan ihmisen kääntämille teksteille. Se tarkoittaa, että jokainen näistä konekäännöksistä tarvitsee jonkinlaista jälkieditointia ennen julkaisua.
Lisäksi tutkimustulokset osoittavat, että sopimus- ja uutiskäännösten virheiden määrässä on hyvin pieni ero ja reseptikäännösten ja sopimus- ja uutiskäännösten virheiden määrässä on hyvin suuri ero. Siksi voidaan todeta, että genrellä on suhteellisen pieni vaikutus konekäännösten laatuun. Tutkimustuloksista voidaan vetää sellainen johtopäätös, ettei konekääntäminen kieliparissa ruotsi–suomi toimi kovin hyvin tällä hetkellä. Tulevaisuus saattaa kuitenkin näyttää erilaiselta, kun konekääntimet saavat lisää kokemusta ruotsin ja suomen välillä kääntämisestä.