Koulukorpuksen leksikko: 1.-6.-luokkalaisten aktiivinen sanavarasto
LAINE-LEINONEN, JAANA (2013)
LAINE-LEINONEN, JAANA
2013
Suomen kieli - Finnish Language
Kieli-, käännös- ja kirjallisuustieteiden yksikkö - School of Language, Translation and Literary Studies
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2013-02-21
Julkaisun pysyvä osoite on
https://urn.fi/urn:nbn:fi:uta-1-23229
https://urn.fi/urn:nbn:fi:uta-1-23229
Tiivistelmä
Tutkielmassa tarkastellaan alakoulun 1.–6.-luokkalaisten aktiivista sanavarastoa. Tutkimusaineistona on runsaasta 1 100 Unelmien(i) päivä -aiheisesta kirjoitelmasta koostuva Koulukorpus-aineisto, joka sisältää noin 82 000 sanetta ja vajaat 8 000 lekseemiä. Tutkielma on osa Tampereen yliopistossa suomen kielen oppiaineessa käynnissä olevaa myöhemmän kielenkehityksen tutkimusta. Työn tavoitteena on luoda erityisesti kvantitatiivisin metodein yleiskatsaus Koulukorpuksen leksikkoon ja leksikossa esiintyviin muutoksiin niin eri vuosiluokkien kuin sukupuoltenkin näkökulmasta.
Tutkielma on jaettu kolmeen osaan: Ensimmäisessä osassa tarkastellaan yleisesti saneiden ja sanaluokkien frekvenssejä, eniten käytettyjä lekseemejä sekä niiden frekvenssejä. Toisessa osassa luodaan silmäys yksilövariaatioon vertailemalla muun muassa saneiden sanaluokkien frekvenssejä ja frekvenssien keskihajontaa. Kolmannessa osassa tarkastelun kohteena ovat kerran käytetyt lekseemit eli HL-sanat sekä sanaston rikkaus, jota kartoitetaan erilaisten rikkauslukulaskelmien ja indeksien avulla.
Sanaston ajallista kehitystä havainnoidaan näennäisaikamenetelmällä erityisesti 2., 4. ja 6. vuosiluokkaa vertailemalla. Osa aineiston kirjoitelmista on arvioitu tasonsa perusteella kertomukseksi, skriptiksi, ei skeemalliseksi tai listaksi, ja sanaston monipuolisuutta vertaillaan myös näiden tasoluokitusten näkökulmasta. Tutkimustuloksia verrataan myös muun muassa aikuistenkieleen.
Tutkimustulokset osoittavat, että alakouluikäisten aktiivinen sanavarasto karttuu alakoulun aikana, sillä lekseemien määrä kirjoittajaa kohti kasvaa aina alemmalta vuosiluokalta ylemmälle siirryttäessä. Erityisen paljon kasvaa substantiivilekseemien määrä. Sanaluokkien osuuksissa tapahtuvat muutokset alakoulun aikana ovat enimmäkseen yhden tai kahden prosenttiyksikön luokkaa, eivätkä muutokset tapahdu aina lineaarisesti. Saneiden osalta adjektiivien ja adverbien osuudet kasvavat hieman, kun taas verbien ja pronominien osuudet laskevat. Lekseemien osalta selkeimmin kasvavat verbien, adjektiivien ja adverbien osuudet.
Eniten käytetyt lekseemit ovat kaikilla vuosiluokilla varsin lyhyitä ja konkreettisia, joskin niiden kattavuus koko sanastosta on alemmilla luokilla huomattavasti suurempi kuin ylemmillä. Kumulatiivisen frekvenssin vertailu aikuistenkieleen osoittaa, että Koulukorpus-aineistossa yleisimmät lekseemit kattavat huomattavan suuren osan kaikista aineiston saneista aikuisten kirjoitettuun kieleen verrattuna.
Yksilöllinen variaatio niin aineiden pituuksissa kuin saneiden sanaluokkien osuuksissa on suurta. Saneiden sanaluokkien osuuksien keskihajonta pienenee 2., 4. ja 6. vuosiluokkien tarkastelussa ylemmillä vuosiluokilla, ja hajonta on yleensä aina pienempi tytöillä kuin pojilla. Tyttöjen väliset erot kirjoitelmien sanastossa ovat tästä näkökulmasta pienemmät kuin poikien.
Vain kerran käytettyjä sanoja esiintyy kirjoitelmien lukumäärään suhteutettuna eniten tyttöjen kirjoitelmissa. Niiden osuus saneista on sen sijaan suurempi poikien kirjoitelmissa. Rikkauslukulaskelmien perusteella tytöt käyttävät aina monipuolisempaa sanastoa kuin pojat ja sanasto rikastuu ylemmille vuosiluokille siirryttäessä. Sanasto näyttää myös olevan monipuolisempaa tasoluokitusten kannalta korkeatasoisimmissa aineissa.
Avainsanat: koulu, kirjoittaminen, sanasto, myöhempi kielenkehitys
Tutkielma on jaettu kolmeen osaan: Ensimmäisessä osassa tarkastellaan yleisesti saneiden ja sanaluokkien frekvenssejä, eniten käytettyjä lekseemejä sekä niiden frekvenssejä. Toisessa osassa luodaan silmäys yksilövariaatioon vertailemalla muun muassa saneiden sanaluokkien frekvenssejä ja frekvenssien keskihajontaa. Kolmannessa osassa tarkastelun kohteena ovat kerran käytetyt lekseemit eli HL-sanat sekä sanaston rikkaus, jota kartoitetaan erilaisten rikkauslukulaskelmien ja indeksien avulla.
Sanaston ajallista kehitystä havainnoidaan näennäisaikamenetelmällä erityisesti 2., 4. ja 6. vuosiluokkaa vertailemalla. Osa aineiston kirjoitelmista on arvioitu tasonsa perusteella kertomukseksi, skriptiksi, ei skeemalliseksi tai listaksi, ja sanaston monipuolisuutta vertaillaan myös näiden tasoluokitusten näkökulmasta. Tutkimustuloksia verrataan myös muun muassa aikuistenkieleen.
Tutkimustulokset osoittavat, että alakouluikäisten aktiivinen sanavarasto karttuu alakoulun aikana, sillä lekseemien määrä kirjoittajaa kohti kasvaa aina alemmalta vuosiluokalta ylemmälle siirryttäessä. Erityisen paljon kasvaa substantiivilekseemien määrä. Sanaluokkien osuuksissa tapahtuvat muutokset alakoulun aikana ovat enimmäkseen yhden tai kahden prosenttiyksikön luokkaa, eivätkä muutokset tapahdu aina lineaarisesti. Saneiden osalta adjektiivien ja adverbien osuudet kasvavat hieman, kun taas verbien ja pronominien osuudet laskevat. Lekseemien osalta selkeimmin kasvavat verbien, adjektiivien ja adverbien osuudet.
Eniten käytetyt lekseemit ovat kaikilla vuosiluokilla varsin lyhyitä ja konkreettisia, joskin niiden kattavuus koko sanastosta on alemmilla luokilla huomattavasti suurempi kuin ylemmillä. Kumulatiivisen frekvenssin vertailu aikuistenkieleen osoittaa, että Koulukorpus-aineistossa yleisimmät lekseemit kattavat huomattavan suuren osan kaikista aineiston saneista aikuisten kirjoitettuun kieleen verrattuna.
Yksilöllinen variaatio niin aineiden pituuksissa kuin saneiden sanaluokkien osuuksissa on suurta. Saneiden sanaluokkien osuuksien keskihajonta pienenee 2., 4. ja 6. vuosiluokkien tarkastelussa ylemmillä vuosiluokilla, ja hajonta on yleensä aina pienempi tytöillä kuin pojilla. Tyttöjen väliset erot kirjoitelmien sanastossa ovat tästä näkökulmasta pienemmät kuin poikien.
Vain kerran käytettyjä sanoja esiintyy kirjoitelmien lukumäärään suhteutettuna eniten tyttöjen kirjoitelmissa. Niiden osuus saneista on sen sijaan suurempi poikien kirjoitelmissa. Rikkauslukulaskelmien perusteella tytöt käyttävät aina monipuolisempaa sanastoa kuin pojat ja sanasto rikastuu ylemmille vuosiluokille siirryttäessä. Sanasto näyttää myös olevan monipuolisempaa tasoluokitusten kannalta korkeatasoisimmissa aineissa.
Avainsanat: koulu, kirjoittaminen, sanasto, myöhempi kielenkehitys