Tsunami, anime, and martial arts : A corpus-based lexicological study of Japanese borrowings in a historical context and in six varieties of Present-day English
Lehtonen, Sharin (2021)
Lehtonen, Sharin
2021
Englannin kielen ja kirjallisuuden maisteriohjelma - Master's Programme in English Language and Literature
Informaatioteknologian ja viestinnän tiedekunta - Faculty of Information Technology and Communication Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2021-05-17
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-202104243437
https://urn.fi/URN:NBN:fi:tuni-202104243437
Tiivistelmä
Tämä pro gradu -tutkielma on korpuspohjainen leksikologinen tutkimus japanilaisista lainoista englannissa. Tutkimus kartoittaa lainojen jakautumista semanttisiin kenttiin sekä niiden käytön yleisyyttä kuudessa nyky-englannin varieteetissa.
Tutkimuksessa käytetään kahta aineistoa. Ensimmäinen on kerätty Oxford English Dictionary -sanakirjasta hakemalla pääsanoja, joiden etymologian jossakin vaiheessa on ollut japaninkielinen lekseemi. Pääsanat on jaettu 705 lekseemi-merkityspariin, jotka on luokiteltu semanttisiin kenttiin perustuviin pää- ja alakategorioihin. Lekseemi-merkitysparien määriä tarkastellaan kategorioittain kokonaisuudessaan sekä 50 vuoden ajanjaksoittain vuodesta 1550 lähtien ensimmäisen esiintymän vuoden perusteella. Löydökset suhteutetaan historialliseen tilanteeseen kunakin ajanjaksona.
Toinen aineisto on peräisin GloWbE-korpuksesta, josta on haettu ensimmäisen aineiston lekseemi-merkityspareja kuuden varieteetin teksteistä: kahden sisemmän ympyrän varieteetin, amerikan- ja brittienglannin, sekä neljän ulomman ympyrän varieteetin, singaporen-, filippiinin-, malesian- ja hongkonginenglannin. Kaikki osumat on tarkasteltu ja relevanttien sanaesiintymien määrät otettu talteen varieteeteittain ja kategorioittain.
Tutkimus osoittaa, että japanilaiset lainat jakautuvat semantiikan perusteella 25, joista 13:lla on yhteensä 51 alakategoriaa. Pääkategoriat YHTEISKUNTA, TAIDE JA KÄSITYÖ, RUOKA JA JUOMA, URHEILU JA KAMPPAILULAJIT, LUONTO sekä TRADITIO, MYTOLOGIA JA USKONTO sisältävät eniten lekseemi-merkityspareja ja käsittävät yhdessä 66.6% kaikista kategorioissa olevista pareista. Suurimmat frekvenssit korpusteksteissä ovat lekseemi-merkityspareilla, jotka kuuluvat pääkategorioihin RUOKA JA JUOMA, VIIHDE JA VAPAA-AIKA, LUONTO, URHEILU JA KAMPPAILULAJIT sekä YHTEISKUNTA. Varieteettien välillä on vaihtelua normalisoiduissa frekvensseissä. Singaporenenglannilla luku on 271 esiintymää miljoonan sanan tekstissä. Tämä on merkittävästi suurempi kuin muilla varieteeteilla. Muiden ulomman ympyrän varieteettien luvut ovat hyvin lähellä toisiaan, sillä ne ovat välillä 142–150 per miljoona sanaa. Normalisoitu frekvenssi on matalin sisemmän ympyrän varieteeteilla, joista amerikanenglannin frekvenssi on 65 ja brittienglannin 48 esiintymää miljoonan sanan tekstissä.
Tutkimuksessa käytetään kahta aineistoa. Ensimmäinen on kerätty Oxford English Dictionary -sanakirjasta hakemalla pääsanoja, joiden etymologian jossakin vaiheessa on ollut japaninkielinen lekseemi. Pääsanat on jaettu 705 lekseemi-merkityspariin, jotka on luokiteltu semanttisiin kenttiin perustuviin pää- ja alakategorioihin. Lekseemi-merkitysparien määriä tarkastellaan kategorioittain kokonaisuudessaan sekä 50 vuoden ajanjaksoittain vuodesta 1550 lähtien ensimmäisen esiintymän vuoden perusteella. Löydökset suhteutetaan historialliseen tilanteeseen kunakin ajanjaksona.
Toinen aineisto on peräisin GloWbE-korpuksesta, josta on haettu ensimmäisen aineiston lekseemi-merkityspareja kuuden varieteetin teksteistä: kahden sisemmän ympyrän varieteetin, amerikan- ja brittienglannin, sekä neljän ulomman ympyrän varieteetin, singaporen-, filippiinin-, malesian- ja hongkonginenglannin. Kaikki osumat on tarkasteltu ja relevanttien sanaesiintymien määrät otettu talteen varieteeteittain ja kategorioittain.
Tutkimus osoittaa, että japanilaiset lainat jakautuvat semantiikan perusteella 25, joista 13:lla on yhteensä 51 alakategoriaa. Pääkategoriat YHTEISKUNTA, TAIDE JA KÄSITYÖ, RUOKA JA JUOMA, URHEILU JA KAMPPAILULAJIT, LUONTO sekä TRADITIO, MYTOLOGIA JA USKONTO sisältävät eniten lekseemi-merkityspareja ja käsittävät yhdessä 66.6% kaikista kategorioissa olevista pareista. Suurimmat frekvenssit korpusteksteissä ovat lekseemi-merkityspareilla, jotka kuuluvat pääkategorioihin RUOKA JA JUOMA, VIIHDE JA VAPAA-AIKA, LUONTO, URHEILU JA KAMPPAILULAJIT sekä YHTEISKUNTA. Varieteettien välillä on vaihtelua normalisoiduissa frekvensseissä. Singaporenenglannilla luku on 271 esiintymää miljoonan sanan tekstissä. Tämä on merkittävästi suurempi kuin muilla varieteeteilla. Muiden ulomman ympyrän varieteettien luvut ovat hyvin lähellä toisiaan, sillä ne ovat välillä 142–150 per miljoona sanaa. Normalisoitu frekvenssi on matalin sisemmän ympyrän varieteeteilla, joista amerikanenglannin frekvenssi on 65 ja brittienglannin 48 esiintymää miljoonan sanan tekstissä.