Contractions gonna and wanna in internet language : A corpus study
Laukkanen, Milla (2020)
Laukkanen, Milla
2020
Kielten maisteriohjelma - Master's Programme in Languages
Informaatioteknologian ja viestinnän tiedekunta - Faculty of Information Technology and Communication Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2020-05-11
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-202004213482
https://urn.fi/URN:NBN:fi:tuni-202004213482
Tiivistelmä
This thesis examines the use of the contractions wanna and gonna in written internet language based on corpus data. These contractions are typically used only in spoken language due to their informality, and they rarely occur in texts that use formal language. The aim of the thesis is to discover how the use of the contractions is distributed across the different registers of internet language. The thesis also intends to determine how the contractions are used in these registers in comparison to their full forms want to and going to.
The data is gathered from the iWeb corpus, which consists of a broad collection of web pages. The data is categorized into web registers using the 2015 hierarchical framework of Biber et al, which is introduced in the theory section of the thesis. This chapter also introduces background literature related to internet language and explains its relationship to spoken and written language. In addition, the theory section presents some previous research that has been done on the contractions.
The analyzed data reveals that the contractions wanna and gonna are the most frequent in contexts that resemble conversation. The contractions are most often used in the interactive discussion web register, and more specifically in its sub-registers of discussions forums and reader comments. The use of the contractions is largely limited to these interactive situations, although they also occur to some extent in registers that are directly connected to speech. Such situations are song lyrics, transcripts of video and audio, and TV and movie scripts. The contractions were also compared to their full forms want to and going to, and the results indicate that the use of the full forms is distributed more evenly across the different registers. These results were expected, as the longer word forms also occur in written texts outside of the internet and their use is not generally limited to spoken language.
The findings indicate that the contractions typical to spoken language occur in written online texts as well. The writing style of discussion forums and reader comments prefers the contractions over the full forms, and thus closely resembles speech. This can be explained by the similarities between these registers and face-to-face conversations, although the communication that takes place over the web has some limitations. Interactivity and the number of participants are also essential to these registers. Additionally, registers that are directly linked to speech prefer to use the contractions over the full forms as well. Other registers use mainly the full forms, and consequently their language resembles the formal style of traditional written texts. Tutkielma tarkastelee englanninkielisten lyhenteiden wanna ja gonna käyttöä internetkielessä korpuksen avulla. Käsiteltäviä lyhenteitä käytetään tyypillisesti englannin puhekielessä niiden epämuodollisen tyylin vuoksi, eikä niitä esiinny juurikaan virallista kieltä käyttävissä teksteissä. Tutkielman tarkoituksena on tutkia lyhenteiden käytön jakautumista internetkielen eri tekstilajien välillä. Tarkoituksena on myös selvittää, miten lyhenteiden käyttö internetin tekstilajeissa eroaa niiden pidemmistä muodoista want to ja going to.
Tutkielman aineisto on kerätty iWeb korpuksen laajasta verkkosivujen kokoelmasta. Aineisto jaetaan eri tekstilajeihin käyttäen apuna Biber et al. vuoden 2015 hierarkkista viitekehystä, joka esitellään tutkielman teoriaosuudessa. Teoriaosuus esittelee myös aiheeseen liittyvää taustakirjallisuutta internetkielen osalta, sekä selittää kyseisen kielen suhteita puheeseen ja kirjoitettuun tekstiin. Osiossa käsitellään myös lyhenteistä wanna ja gonna tehtyjä aikaisempia tutkimuksia.
Analysoidusta aineistosta selviää, että lyhenteitä wanna ja gonna esiintyy eniten keskustelua muistuttavissa konteksteissa. Lyhenteitä käytetään eniten interaktiivisen keskustelun tekstilajissa, ja tarkemmin sen alalajeissa keskustelufoorumeilla sekä sivujen kommenttiosioissa. Lyhenteiden käyttö on keskittynyt lähinnä näihin interaktiivisiin keskusteluihin, mutta niitä esiintyy myös jonkin verran puheeseen suoraan linkittyvissä tilanteissa. Tällaisia tekstilajeja ovat laulujen lyriikat, äänitteiden ja videoiden litteraatiot sekä elokuvien ja tv-sarjojen käsikirjoitukset. Lyhenteitä vertailtiin myös niiden pidempiin muotoihin want to ja going to, joiden käyttö oli jakautunut tasaisemmin eri tekstilajien välillä. Nämä tulokset olivat odotettuja, sillä pidempiä muotoja esiintyy kirjoitetuissa teksteissä myös internetin ulkopuolella eikä niiden käyttö ole lyhenteiden tavoin rajautunut puhekieleen.
Näiden tulosten perusteella on mahdollista todeta, että tyypillisesti vain puheessa esiintyneitä lyhenteitä wanna ja gonna käytetään myös kirjoitetussa muodossa internetissä. Internetkielen tekstilajeista keskustelufoorumeiden ja kommenttiosioiden kirjoitustyyli suosii eniten epämuodollisia lyhenteitä ja muistuttaa näin eniten puhetta. Tämä voidaan selittää sillä, että kyseiset tekstilajit muistuttavat tyypillistä kasvotusten tapahtuvaa keskustelua, vaikkakin internetin kautta tapahtuvissa keskusteluissa on rajoitteita. Kyseisiin tekstilajeihin liittyy olennaisina tekijöinä myös niiden interaktiivisuus ja keskustelijoiden lukumäärä. Myös puheeseen suoraan linkittyvät tekstilajit suosivat lyhenteitä pidempien muotojen sijaan. Muut tekstilajit puolestaan käyttävät lähinnä pidempiä muotoja, ja nämä sivut muistuttavat enemmän muodollista kieltä suosivia kirjoitettuja tekstejä.
The data is gathered from the iWeb corpus, which consists of a broad collection of web pages. The data is categorized into web registers using the 2015 hierarchical framework of Biber et al, which is introduced in the theory section of the thesis. This chapter also introduces background literature related to internet language and explains its relationship to spoken and written language. In addition, the theory section presents some previous research that has been done on the contractions.
The analyzed data reveals that the contractions wanna and gonna are the most frequent in contexts that resemble conversation. The contractions are most often used in the interactive discussion web register, and more specifically in its sub-registers of discussions forums and reader comments. The use of the contractions is largely limited to these interactive situations, although they also occur to some extent in registers that are directly connected to speech. Such situations are song lyrics, transcripts of video and audio, and TV and movie scripts. The contractions were also compared to their full forms want to and going to, and the results indicate that the use of the full forms is distributed more evenly across the different registers. These results were expected, as the longer word forms also occur in written texts outside of the internet and their use is not generally limited to spoken language.
The findings indicate that the contractions typical to spoken language occur in written online texts as well. The writing style of discussion forums and reader comments prefers the contractions over the full forms, and thus closely resembles speech. This can be explained by the similarities between these registers and face-to-face conversations, although the communication that takes place over the web has some limitations. Interactivity and the number of participants are also essential to these registers. Additionally, registers that are directly linked to speech prefer to use the contractions over the full forms as well. Other registers use mainly the full forms, and consequently their language resembles the formal style of traditional written texts.
Tutkielman aineisto on kerätty iWeb korpuksen laajasta verkkosivujen kokoelmasta. Aineisto jaetaan eri tekstilajeihin käyttäen apuna Biber et al. vuoden 2015 hierarkkista viitekehystä, joka esitellään tutkielman teoriaosuudessa. Teoriaosuus esittelee myös aiheeseen liittyvää taustakirjallisuutta internetkielen osalta, sekä selittää kyseisen kielen suhteita puheeseen ja kirjoitettuun tekstiin. Osiossa käsitellään myös lyhenteistä wanna ja gonna tehtyjä aikaisempia tutkimuksia.
Analysoidusta aineistosta selviää, että lyhenteitä wanna ja gonna esiintyy eniten keskustelua muistuttavissa konteksteissa. Lyhenteitä käytetään eniten interaktiivisen keskustelun tekstilajissa, ja tarkemmin sen alalajeissa keskustelufoorumeilla sekä sivujen kommenttiosioissa. Lyhenteiden käyttö on keskittynyt lähinnä näihin interaktiivisiin keskusteluihin, mutta niitä esiintyy myös jonkin verran puheeseen suoraan linkittyvissä tilanteissa. Tällaisia tekstilajeja ovat laulujen lyriikat, äänitteiden ja videoiden litteraatiot sekä elokuvien ja tv-sarjojen käsikirjoitukset. Lyhenteitä vertailtiin myös niiden pidempiin muotoihin want to ja going to, joiden käyttö oli jakautunut tasaisemmin eri tekstilajien välillä. Nämä tulokset olivat odotettuja, sillä pidempiä muotoja esiintyy kirjoitetuissa teksteissä myös internetin ulkopuolella eikä niiden käyttö ole lyhenteiden tavoin rajautunut puhekieleen.
Näiden tulosten perusteella on mahdollista todeta, että tyypillisesti vain puheessa esiintyneitä lyhenteitä wanna ja gonna käytetään myös kirjoitetussa muodossa internetissä. Internetkielen tekstilajeista keskustelufoorumeiden ja kommenttiosioiden kirjoitustyyli suosii eniten epämuodollisia lyhenteitä ja muistuttaa näin eniten puhetta. Tämä voidaan selittää sillä, että kyseiset tekstilajit muistuttavat tyypillistä kasvotusten tapahtuvaa keskustelua, vaikkakin internetin kautta tapahtuvissa keskusteluissa on rajoitteita. Kyseisiin tekstilajeihin liittyy olennaisina tekijöinä myös niiden interaktiivisuus ja keskustelijoiden lukumäärä. Myös puheeseen suoraan linkittyvät tekstilajit suosivat lyhenteitä pidempien muotojen sijaan. Muut tekstilajit puolestaan käyttävät lähinnä pidempiä muotoja, ja nämä sivut muistuttavat enemmän muodollista kieltä suosivia kirjoitettuja tekstejä.