Galtonin kuutio: Kolmiulotteinen Galtonin lauta ja moniulotteinen normaalijakauma
Asikainen, Jimi (2023)
Asikainen, Jimi
2023
Tekniikan ja luonnontieteiden kandidaattiohjelma - Bachelor's Programme in Engineering and Natural Sciences
Tekniikan ja luonnontieteiden tiedekunta - Faculty of Engineering and Natural Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2023-12-22
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-2023122111166
https://urn.fi/URN:NBN:fi:tuni-2023122111166
Tiivistelmä
Tämän työn tavoitteena on luoda Francis Galtonin suunnittelemasta kaksiulotteisesta Galtonin laudasta kolmiulotteinen malli, joka simuloituna tuottaa sillä toteutetuilla toistokokeilla samaa todennäköisyysjakaumaa noudattavan hajonnan kuin kaksiulotteinen lauta. Koska simulaatio tullaan toteuttamaan kaksiulotteisessa tilassa toimivan Galtonin laudan sijaan kolmiulotteisena, Galtonin laudan synnyttämä yhden muuttujan todennäköisyysjakauma tulee esiintymään simulaatiossa kahden muuttujan moniulotteisena jakaumana. Tavoitteena on myös selittää syy sille, miksi kyseisen todennäköisyysjakauma myötäilee niin kaksi- kuin kolmiulotteisessa mallissa normaalijakaumaa.
Työssä tutkitaan ensin Galtonin laudan konseptia informaatioteoriaa hyödyntäen. Sen avulla voidaan selittää, miksi toistokokeen aikainen kaoottinen tila johtaa toistuvasti järjestäytyneeseen lopputulokseen normaalijakauman muodossa. Tämän jälkeen tutustutaan Galtonin laudan ja Pascalin kolmion väliseen yhteyteen, sekä siihen, millä tavalla Pascalin kolmiota voidaan osaltaan käyttää ennustamaan ja selittämään normaalijakauman syntyä. Työn teoreettinen osuus päättyy Galtonin kuutiona työssä nimitetyn kolmiulotteisen Galtonin laudan idean esittelyyn, jossa Galtonin kaksiulotteiselle laudalle ominaisilla ilmiöillä havainnollistetaan kolmiulotteisessa tilassa toimivan mallin toimintaperiaatteita.
Työssä tarvittavaa Galtonin kuution simulointia varten laadittiin ohjelma MatLab-nimistä tietokoneohjelmistoa sekä samannimistä ohjelmointikieltä käyttäen. Simulaation malli luotiin Galtonin laudan ominaisuuksien pohjalta. Jo aiemmin työssä tehdyn rajauksen seurauksena simulaation toimintamalli perustettiin fysikaalisten voimien tarkastelun sijaan puhtaasti matemaattisten todennäköisyysmallien alaisen sattumanvaraisuuden varaan. Ohjelmasta tehtiin lisäksi käyttäjäystävällinen, jotta sen käyttö myös tutkielmasta ulkopuolisen henkilön toimesta olisi mahdollisimman vaivatonta.
Tuloksena saatujen arvojen pohjalta todetaan simuloidun Galtonin kuution mallin noudattavan tuottamassaan hajonnassa Galtonin laudan tapaan normaalijakaumaa. Päätelmää tukee havainto siitä, että toistokokeiden odotusarvo kummankin akselin suhteen lähenee sitä arvoa, jota sen normaalijakaumaa noudattavassa mallissa tulee teoriassa lähestyä. Toinen johtopäätöstä tukeva havainto on simulaatiolla saatu todennäköisyys toistokokeen yksittäisen toistokerran tuloksen päätymiselle enintään yhden keskihajonnan päähän odotusarvosta. Vaikka todennäköisyys lähestyykin arvoa, joka eroaa hieman teoreettisesti oikeasta arvosta, virheen syy saadaan selitettyä eikä sillä ole vaikutusta päätelmän oikeellisuuteen. Lisäksi otoskoon suurentamisen havaitaan kasvattavan hajonnan tuottaman graafin ulkoista yhdennäköisyyttä normaalijakauman kanssa. Suuremman otoskoon huomataan myös vähentävän toistokokeen jakauman odotusarvolle sekä keskihajonnalle mitattujen arvojen keskinäistä vaihtelevuutta.
Työssä tutkitaan ensin Galtonin laudan konseptia informaatioteoriaa hyödyntäen. Sen avulla voidaan selittää, miksi toistokokeen aikainen kaoottinen tila johtaa toistuvasti järjestäytyneeseen lopputulokseen normaalijakauman muodossa. Tämän jälkeen tutustutaan Galtonin laudan ja Pascalin kolmion väliseen yhteyteen, sekä siihen, millä tavalla Pascalin kolmiota voidaan osaltaan käyttää ennustamaan ja selittämään normaalijakauman syntyä. Työn teoreettinen osuus päättyy Galtonin kuutiona työssä nimitetyn kolmiulotteisen Galtonin laudan idean esittelyyn, jossa Galtonin kaksiulotteiselle laudalle ominaisilla ilmiöillä havainnollistetaan kolmiulotteisessa tilassa toimivan mallin toimintaperiaatteita.
Työssä tarvittavaa Galtonin kuution simulointia varten laadittiin ohjelma MatLab-nimistä tietokoneohjelmistoa sekä samannimistä ohjelmointikieltä käyttäen. Simulaation malli luotiin Galtonin laudan ominaisuuksien pohjalta. Jo aiemmin työssä tehdyn rajauksen seurauksena simulaation toimintamalli perustettiin fysikaalisten voimien tarkastelun sijaan puhtaasti matemaattisten todennäköisyysmallien alaisen sattumanvaraisuuden varaan. Ohjelmasta tehtiin lisäksi käyttäjäystävällinen, jotta sen käyttö myös tutkielmasta ulkopuolisen henkilön toimesta olisi mahdollisimman vaivatonta.
Tuloksena saatujen arvojen pohjalta todetaan simuloidun Galtonin kuution mallin noudattavan tuottamassaan hajonnassa Galtonin laudan tapaan normaalijakaumaa. Päätelmää tukee havainto siitä, että toistokokeiden odotusarvo kummankin akselin suhteen lähenee sitä arvoa, jota sen normaalijakaumaa noudattavassa mallissa tulee teoriassa lähestyä. Toinen johtopäätöstä tukeva havainto on simulaatiolla saatu todennäköisyys toistokokeen yksittäisen toistokerran tuloksen päätymiselle enintään yhden keskihajonnan päähän odotusarvosta. Vaikka todennäköisyys lähestyykin arvoa, joka eroaa hieman teoreettisesti oikeasta arvosta, virheen syy saadaan selitettyä eikä sillä ole vaikutusta päätelmän oikeellisuuteen. Lisäksi otoskoon suurentamisen havaitaan kasvattavan hajonnan tuottaman graafin ulkoista yhdennäköisyyttä normaalijakauman kanssa. Suuremman otoskoon huomataan myös vähentävän toistokokeen jakauman odotusarvolle sekä keskihajonnalle mitattujen arvojen keskinäistä vaihtelevuutta.
Kokoelmat
- Kandidaatintutkielmat [8344]