Investigating the Influence of Context in the Use and Reception of Raw Machine Translation
Nurminen, Mary (2021)
Nurminen, Mary
Tampere University
2021
Kielten tohtoriohjelma - Doctoral Programme in Language Studies
Informaatioteknologian ja viestinnän tiedekunta - Faculty of Information Technology and Communication Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Väitöspäivä
2021-12-03
Julkaisun pysyvä osoite on
https://urn.fi/URN:ISBN:978-952-03-2199-4
https://urn.fi/URN:ISBN:978-952-03-2199-4
Tiivistelmä
Tässä väitöskirjassa tarkastellaan editoimattomien konekäännösten käyttöä sellaisenaan tilanteissa, joissa vieraskielisestä tekstistä pyritään ymmärtämään mahdollisimman paljon tiettyä tarkoitusta varten. Englanniksi tällaista raakakonekäännösten käyttöä kutsutaan tutkimuksessa termillä ”gisting”. Teknologian kehittyminen ja internetissä vapaasti saatavilla olevien konekääntimien käytön yleistyminen viimeisten 15 vuoden aikana on johtanut konekääntämisen käyttäjämäärien räjähdysmäiseen kasvuun. Voidaankin sanoa, että konekääntäminen lienee yksi merkittävimmistä viimeaikaisista innovaatioista ihmisten välisessä viestinnässä. Ilmiön yleisyydestä ja tärkeydestä huolimatta sitä on kuitenkin tutkittu vasta vähän.
Väitöskirjan tavoitteena oli analysoida, miten raakakonekäännöksiä käytetään sellaisenaan erilaisissa konteksteissa, tunnistaa niitä tekijöitä, jotka näissä konteksteissa vaikuttavat raakakonekäännösten käyttöön ja vastaanottoon, ja lopuksi tarkastella teoreettisia viitekehyksiä, joiden avulla raakakonekäännösten käyttöä voidaan käsitteellistää ilmiönä. Väitöstutkimuksen kartoittava tutkimusote johti lopulta neljän kontekstin tarkempaan analyysiin. Nämä neljä kontekstia olivat keskenään erilaisia ja vaativat toisistaan poikkeavia tutkimusmenetelmiä. Useimmissa osatutkimuksissa käytettiin laadullisia menetelmiä; yhdessä osatutkimuksessa menetelmät olivat määrällisiä. Tutkimustulokset julkaistiin viidessä artikkelissa, jotka sisältyvät väitöskirjaan tämän yhteenvedon kanssa.
Tutkitut neljä kontekstia olivat verkkopohjainen konekääntäminen, raakakonekäännösten käyttö ammatillisessa ekosysteemissä, konekäännösvälitteinen tutkimushaastattelu ja konekääntämisen käyttö saavutettavuuden parantamiseksi. Verkkopohjaista konekääntämistä tarkastelevassa osatutkimuksessa laadittiin kysely, joka suunnattiin erään verkkopohjaisen konekääntimen käyttäjille. Tulokset osoittivat, että konekääntimen käyttäjäkunta oli erittäin monimuotoinen ja hyödynsi konekääntämistä monenlaisiin tarkoituksiin, joista yleisin oli väitöskirjan tarkastelema raakakonekäännösten käyttö sellaisenaan. Tyypillisin elämänalue, jolla vastaajat käyttivät konekääntämistä, oli opiskelu, toiseksi yleisin oli työ ja kolmanneksi yleisin vapaa-aika. Jokseenkin yllättäen osatutkimuksessa kävi ilmi, että suurin osa (83 %) vastaajista kertoi ymmärtävänsä konekäännetyn tekstin lähdekieltä edes jonkin verran, mikä saattaa kertoa siitä, että he käyttävät konekäännöksiä eri tavalla kuin perinteisiä ihmisten laatimia käännöksiä.
Toisessa tutkitussa kontekstissa tarkasteltiin immateriaalioikeuksien (IPR) parissa työskenteleviä patenttiasiantuntijoita, jotka käyttivät raakakonekäännöksiä säännöllisesti ymmärtääkseen vierailla kielillä laadittuja patenttiasiakirjoja. Tässä kontekstissa ympäröivä ekosysteemi muovasi ja tuki raakakonekäännösten käyttöä. Koska IPR-työhön ylipäänsä kuuluu merkittäviä riskejä, ekosysteemi tarjosi toimijoille tilaa ottaa huomioon myös raakakonekäännösten käyttöön liittyviä riskejä ja antoi tukea niiden sietämiseen. Raakakonekäännösten käyttöä pidettiin hyväksyttävänä menettelytapana ja sitä myös tuettiin. Osatutkimuksen toinen keskeinen löydös oli se, että patenttiasiantuntijat hyödynsivät omaehtoisia riskienarviointi- ja riskienhallintaprosesseja, joiden avulla he arvioivat, milloin ja missä tilanteessa raakakonekäännökseen voidaan turvautua. Osatutkimuksessa analysoitiin myös raakakonekäännösten käyttöä hajautetun kognition käsitteen avulla, mikä osoittautui hyödylliseksi lähestymistavaksi toiminnan ymmärtämiseen.
Kolmas konteksti käsitti aineiston keräämiseen tähtääviä tutkimushaastatteluja, jotka käytiin konekäännösvälitteisesti: haastattelija ja osallistujat siis kommunikoivat chat-sovelluksen avulla, johon oli integroitu konekäännin. Haastattelija ja osallistujat eivät puhuneet samaa kieltä, vaan he kirjoittivat viestejä omalla kielellään, jotka sovelluksen sisäinen konekäännin käänsi vastaanottajan kielelle. Menetelmä osoittautui lupaavaksi ja jatkotutkimuksen arvoiseksi. Lisäksi osatutkimuksessa tunnistettiin seitsemän seikkaa, jotka on syytä ottaa huomioon konekäännösvälitteisessä viestinnässä.
Viimeinen väitöstutkimuksessa tarkasteltu konteksti koski puutteita tiedon saavutettavuudessa, jonka vuoksi tietyt ihmisryhmät eivät voi osallistua yhteiskunnan toimintaan täysipainoisesti, erityisesti siitä syystä, että heillä ei ole riittävää osaamista tiedon julkaisukielessä. Tässä osatutkimuksessa tehtiin katsaus saavutettavuutta käsitteleviin tutkimuksiin ja hankkeisiin, jotka pyrkivät helpottamaan yhteiskunnan toimintaan osallistumista, terveyteen ja turvallisuuteen liittyvän tiedon saavutettavuutta sekä kulttuurin ja median saavutettavuutta. Tutkimuksessa kartoitettiin lupaavia uusia edistysaskeleita sekä eettisiä ja muita haasteita, joita liittyy konekääntämisen käyttöön saavutettavuuden parantamiseksi.
Väitöskirjan toinen tavoite oli tunnistaa niitä tekijöitä tutkituissa konteksteissa, jotka vaikuttivat raakakonekäännösten käyttöön ja vastaanottoon. Tutkimuksessa tunnistettiin yksitoista tällaista kontekstuaalista tekijää, ja ne jaoteltiin kolmeen ryhmään: käyttäjiin, käyttäjien tehtäviin ja tavoitteisiin sekä tekniseen ympäristöön ja organisaatioympäristöön liittyviin tekijöihin. Raakakonekäännösten käyttöön vaikuttaviin käyttäjien ominaisuuksiin lukeutui osaaminen lähde- ja kohdekielissä, perehtyneisyys konekäännettävän tekstin tekstikontekstiin sekä konekäännöslukutaidon taso. Käyttäjien tehtäviin ja tavoitteisiin liittyviin tekijöihin lukeutui taipumus täydentää raakakonekäännöksestä saatavaa tietoa lähdetekstissä olevalla multimodaalisella tiedolla, taipumus vahvistaa raakakonekäännöksen tuotos muilla konekäännöstyökaluilla, taipumus muokata lähdetekstiä paremman konekäännöksen saamiseksi sekä taipumus neuvotella raakakonekäännöksen merkitysestä muiden kanssa. Ympäristöön liittyviin tekijöihin lukeutui konekäännösten käyttöä helpottavat aputyökalut, konekääntämisen nauttima status ja legitimiteetti kyseisessä ympäristössä sekä tekstien merkityksen neuvotteluun tottuneen ja riskejä sietävän ympäristön tarjoamat affordanssit.
Lopuksi väitöskirjassa esitetään kolme viitekehystä raakakonekäännösten käytön käsitteellistämiseksi. Ilmiötä voidaan tarkastella ja analysoida kontekstuaalisten vaikutteiden viitekehyksen avulla, se voidaan käsitteellistää riskienhallintatoiminnaksi tai se voidaan nähdä hajautetun kognition viitekehyksen kautta. Väitöskirjassa esitetään näiden viitekehysten soveltamista sekä tieteellisessä tutkimuksessa että yritystoiminnassa, esimerkiksi raakakonekääntämisen soveltuvuuden arvioinnissa eri tilanteisiin, tuote- tai prosessikehityksessä tai konekäännöslukutaiton kehittämiseen tähtäävien ohjelmien kehittämisessä.
Väitöskirja tuottaa uutta tietoa konteksteista, joissa raakakonekäännöksiä käytetään sellaisenaan ja joita on aiemmin tutkittu vain vähän, jos lainkaan. Tutkimus korostaa kontekstin tärkeyttä raakakonekäännösten käytössä ja vastaanottamisessa. Se tarjoaa myös vaihtoehtoisia tapoja tarkastella ja analysoida raakakonekäännösten käyttöä ilmiönä.
Väitöskirjan tavoitteena oli analysoida, miten raakakonekäännöksiä käytetään sellaisenaan erilaisissa konteksteissa, tunnistaa niitä tekijöitä, jotka näissä konteksteissa vaikuttavat raakakonekäännösten käyttöön ja vastaanottoon, ja lopuksi tarkastella teoreettisia viitekehyksiä, joiden avulla raakakonekäännösten käyttöä voidaan käsitteellistää ilmiönä. Väitöstutkimuksen kartoittava tutkimusote johti lopulta neljän kontekstin tarkempaan analyysiin. Nämä neljä kontekstia olivat keskenään erilaisia ja vaativat toisistaan poikkeavia tutkimusmenetelmiä. Useimmissa osatutkimuksissa käytettiin laadullisia menetelmiä; yhdessä osatutkimuksessa menetelmät olivat määrällisiä. Tutkimustulokset julkaistiin viidessä artikkelissa, jotka sisältyvät väitöskirjaan tämän yhteenvedon kanssa.
Tutkitut neljä kontekstia olivat verkkopohjainen konekääntäminen, raakakonekäännösten käyttö ammatillisessa ekosysteemissä, konekäännösvälitteinen tutkimushaastattelu ja konekääntämisen käyttö saavutettavuuden parantamiseksi. Verkkopohjaista konekääntämistä tarkastelevassa osatutkimuksessa laadittiin kysely, joka suunnattiin erään verkkopohjaisen konekääntimen käyttäjille. Tulokset osoittivat, että konekääntimen käyttäjäkunta oli erittäin monimuotoinen ja hyödynsi konekääntämistä monenlaisiin tarkoituksiin, joista yleisin oli väitöskirjan tarkastelema raakakonekäännösten käyttö sellaisenaan. Tyypillisin elämänalue, jolla vastaajat käyttivät konekääntämistä, oli opiskelu, toiseksi yleisin oli työ ja kolmanneksi yleisin vapaa-aika. Jokseenkin yllättäen osatutkimuksessa kävi ilmi, että suurin osa (83 %) vastaajista kertoi ymmärtävänsä konekäännetyn tekstin lähdekieltä edes jonkin verran, mikä saattaa kertoa siitä, että he käyttävät konekäännöksiä eri tavalla kuin perinteisiä ihmisten laatimia käännöksiä.
Toisessa tutkitussa kontekstissa tarkasteltiin immateriaalioikeuksien (IPR) parissa työskenteleviä patenttiasiantuntijoita, jotka käyttivät raakakonekäännöksiä säännöllisesti ymmärtääkseen vierailla kielillä laadittuja patenttiasiakirjoja. Tässä kontekstissa ympäröivä ekosysteemi muovasi ja tuki raakakonekäännösten käyttöä. Koska IPR-työhön ylipäänsä kuuluu merkittäviä riskejä, ekosysteemi tarjosi toimijoille tilaa ottaa huomioon myös raakakonekäännösten käyttöön liittyviä riskejä ja antoi tukea niiden sietämiseen. Raakakonekäännösten käyttöä pidettiin hyväksyttävänä menettelytapana ja sitä myös tuettiin. Osatutkimuksen toinen keskeinen löydös oli se, että patenttiasiantuntijat hyödynsivät omaehtoisia riskienarviointi- ja riskienhallintaprosesseja, joiden avulla he arvioivat, milloin ja missä tilanteessa raakakonekäännökseen voidaan turvautua. Osatutkimuksessa analysoitiin myös raakakonekäännösten käyttöä hajautetun kognition käsitteen avulla, mikä osoittautui hyödylliseksi lähestymistavaksi toiminnan ymmärtämiseen.
Kolmas konteksti käsitti aineiston keräämiseen tähtääviä tutkimushaastatteluja, jotka käytiin konekäännösvälitteisesti: haastattelija ja osallistujat siis kommunikoivat chat-sovelluksen avulla, johon oli integroitu konekäännin. Haastattelija ja osallistujat eivät puhuneet samaa kieltä, vaan he kirjoittivat viestejä omalla kielellään, jotka sovelluksen sisäinen konekäännin käänsi vastaanottajan kielelle. Menetelmä osoittautui lupaavaksi ja jatkotutkimuksen arvoiseksi. Lisäksi osatutkimuksessa tunnistettiin seitsemän seikkaa, jotka on syytä ottaa huomioon konekäännösvälitteisessä viestinnässä.
Viimeinen väitöstutkimuksessa tarkasteltu konteksti koski puutteita tiedon saavutettavuudessa, jonka vuoksi tietyt ihmisryhmät eivät voi osallistua yhteiskunnan toimintaan täysipainoisesti, erityisesti siitä syystä, että heillä ei ole riittävää osaamista tiedon julkaisukielessä. Tässä osatutkimuksessa tehtiin katsaus saavutettavuutta käsitteleviin tutkimuksiin ja hankkeisiin, jotka pyrkivät helpottamaan yhteiskunnan toimintaan osallistumista, terveyteen ja turvallisuuteen liittyvän tiedon saavutettavuutta sekä kulttuurin ja median saavutettavuutta. Tutkimuksessa kartoitettiin lupaavia uusia edistysaskeleita sekä eettisiä ja muita haasteita, joita liittyy konekääntämisen käyttöön saavutettavuuden parantamiseksi.
Väitöskirjan toinen tavoite oli tunnistaa niitä tekijöitä tutkituissa konteksteissa, jotka vaikuttivat raakakonekäännösten käyttöön ja vastaanottoon. Tutkimuksessa tunnistettiin yksitoista tällaista kontekstuaalista tekijää, ja ne jaoteltiin kolmeen ryhmään: käyttäjiin, käyttäjien tehtäviin ja tavoitteisiin sekä tekniseen ympäristöön ja organisaatioympäristöön liittyviin tekijöihin. Raakakonekäännösten käyttöön vaikuttaviin käyttäjien ominaisuuksiin lukeutui osaaminen lähde- ja kohdekielissä, perehtyneisyys konekäännettävän tekstin tekstikontekstiin sekä konekäännöslukutaidon taso. Käyttäjien tehtäviin ja tavoitteisiin liittyviin tekijöihin lukeutui taipumus täydentää raakakonekäännöksestä saatavaa tietoa lähdetekstissä olevalla multimodaalisella tiedolla, taipumus vahvistaa raakakonekäännöksen tuotos muilla konekäännöstyökaluilla, taipumus muokata lähdetekstiä paremman konekäännöksen saamiseksi sekä taipumus neuvotella raakakonekäännöksen merkitysestä muiden kanssa. Ympäristöön liittyviin tekijöihin lukeutui konekäännösten käyttöä helpottavat aputyökalut, konekääntämisen nauttima status ja legitimiteetti kyseisessä ympäristössä sekä tekstien merkityksen neuvotteluun tottuneen ja riskejä sietävän ympäristön tarjoamat affordanssit.
Lopuksi väitöskirjassa esitetään kolme viitekehystä raakakonekäännösten käytön käsitteellistämiseksi. Ilmiötä voidaan tarkastella ja analysoida kontekstuaalisten vaikutteiden viitekehyksen avulla, se voidaan käsitteellistää riskienhallintatoiminnaksi tai se voidaan nähdä hajautetun kognition viitekehyksen kautta. Väitöskirjassa esitetään näiden viitekehysten soveltamista sekä tieteellisessä tutkimuksessa että yritystoiminnassa, esimerkiksi raakakonekääntämisen soveltuvuuden arvioinnissa eri tilanteisiin, tuote- tai prosessikehityksessä tai konekäännöslukutaiton kehittämiseen tähtäävien ohjelmien kehittämisessä.
Väitöskirja tuottaa uutta tietoa konteksteista, joissa raakakonekäännöksiä käytetään sellaisenaan ja joita on aiemmin tutkittu vain vähän, jos lainkaan. Tutkimus korostaa kontekstin tärkeyttä raakakonekäännösten käytössä ja vastaanottamisessa. Se tarjoaa myös vaihtoehtoisia tapoja tarkastella ja analysoida raakakonekäännösten käyttöä ilmiönä.
Kokoelmat
- Väitöskirjat [4846]