YouTube-videoiden konekääntimellä käännettyjen tekstitysten laatu
Saikko, Tuisku (2021)
Saikko, Tuisku
2021
Monikielisen viestinnän ja käännöstieteen maisteriohjelma - Master's Programme in Multilingual Communication and Translation Studies
Informaatioteknologian ja viestinnän tiedekunta - Faculty of Information Technology and Communication Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2021-11-15
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-202110277863
https://urn.fi/URN:NBN:fi:tuni-202110277863
Tiivistelmä
Tämän tutkielman tarkoitus on selvittää, kuinka laadukkaita videopalvelu YouTuben konekääntimellä käännetyt tekstitykset ovat ja mitkä tekijät vaikuttavat tekstitysten laatuun. Aihetta on tärkeää tutkia, sillä konekääntimellä käännetyt tekstitykset voivat hyödyttää sekä videoiden tekijöitä, jotka voivat tavoittaa niiden avulla entistä laajemman yleisön, että videoiden katsojia, joille tekstitykset voivat avata katsottavaksi entistä enemmän sisältöä. Konekääntimen kääntämät tekstitykset ovat myös entistä tärkeämpiä katsojille, sillä YouTube poisti syksyllä 2020 käytöstä toiminnon, jonka avulla katsojat pystyivät lisäämään videoihin omia käännöksiään videoiden tekstityksistä. Monet katsojat voivat sen vuoksi joutua luottamaan konekääntimen kääntämiin tekstityksiin, jos he haluavat katsoa vieraskielisiä videoita.
Tutkielman aineisto koostuu 997 englanninkielisestä virkkeestä ja niiden suomenkielisistä käännöksistä, joista molemmat kerättiin viiden YouTube-videon tekstityksistä. Aineiston käännösten arviointiin käytettiin manuaalista arviointitapaa, jossa jokainen käännös sai arvosanan asteikolla 1–5 sen kyvystä välittää alkuperäisen virkkeen merkitystä sekä sen kielen sujuvuudesta. Tutkielman teoreettisessa viitekehyksessä yhdistyvät konekääntämisen ja konekäännösten arvioinnin tutkimus. Konekääntämisen tutkimuksen osuudessa käsitellään eniten neuroverkkokääntämisen tutkimusta, sillä tutkielman aineisto on hyvin todennäköisesti käännetty YouTuben omistajan, Googlen, kehittämällä neuroverkkokääntimellä.
Tutkielman tulosten mukaan YouTuben konekääntimellä käännetyt tekstitykset välittävät suurimman osan alkuperäisten tekstitysten merkityksestä ja ovat hyvää, mutta ei täysin virheetöntä suomen kieltä. Konekäännin onnistuu kääntämään parhaiten virkkeet, jotka ovat lyhyitä, rakenteeltaan yksinkertaisia ja merkitykseltään yksiselitteisiä. Konekääntimellä käännettyjen tekstitysten laatua heikentävät pitkät virkkeet, virkkeiden monimutkaiset rakenteet, monitulkintaiset ilmaukset kuten synonyymit ja idiomit sekä ilmeiset puutteet konekääntimen kouluttamiseen käytetyissä korpuksissa. Nämä tulokset antavat tärkeää tietoa siitä, miten konekäännintä voidaan kehittää, jotta se pystyisi kääntämään tekstitykset mahdollisimman hyvin ja tekstityksistä saataisiin kaikki mahdollinen hyöty irti.
Tutkielman aineisto koostuu 997 englanninkielisestä virkkeestä ja niiden suomenkielisistä käännöksistä, joista molemmat kerättiin viiden YouTube-videon tekstityksistä. Aineiston käännösten arviointiin käytettiin manuaalista arviointitapaa, jossa jokainen käännös sai arvosanan asteikolla 1–5 sen kyvystä välittää alkuperäisen virkkeen merkitystä sekä sen kielen sujuvuudesta. Tutkielman teoreettisessa viitekehyksessä yhdistyvät konekääntämisen ja konekäännösten arvioinnin tutkimus. Konekääntämisen tutkimuksen osuudessa käsitellään eniten neuroverkkokääntämisen tutkimusta, sillä tutkielman aineisto on hyvin todennäköisesti käännetty YouTuben omistajan, Googlen, kehittämällä neuroverkkokääntimellä.
Tutkielman tulosten mukaan YouTuben konekääntimellä käännetyt tekstitykset välittävät suurimman osan alkuperäisten tekstitysten merkityksestä ja ovat hyvää, mutta ei täysin virheetöntä suomen kieltä. Konekäännin onnistuu kääntämään parhaiten virkkeet, jotka ovat lyhyitä, rakenteeltaan yksinkertaisia ja merkitykseltään yksiselitteisiä. Konekääntimellä käännettyjen tekstitysten laatua heikentävät pitkät virkkeet, virkkeiden monimutkaiset rakenteet, monitulkintaiset ilmaukset kuten synonyymit ja idiomit sekä ilmeiset puutteet konekääntimen kouluttamiseen käytetyissä korpuksissa. Nämä tulokset antavat tärkeää tietoa siitä, miten konekäännintä voidaan kehittää, jotta se pystyisi kääntämään tekstitykset mahdollisimman hyvin ja tekstityksistä saataisiin kaikki mahdollinen hyöty irti.