Kvantisoinnin vaikutukset kielimallien toiminnallisuuteen
Kitinoja, Jaakko (2025)
Kitinoja, Jaakko
2025
Tietojenkäsittelytieteiden kandidaattiohjelma - Bachelor's Programme in Computer Sciences
Informaatioteknologian ja viestinnän tiedekunta - Faculty of Information Technology and Communication Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2025-05-15
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-202505145480
https://urn.fi/URN:NBN:fi:tuni-202505145480
Tiivistelmä
Tässä kandidaatintutkielmassa tarkastellaan kvantisoinnin (engl. quantization) vaikutuksia kielimallien toiminnallisuuteen. Kvantisointi on neuroverkkojen kompressointitekniikka, jossa neuroverkon osia muutetaan korkeamman tarkkuuden datatyypistä pienemmän tarkkuuden datatyyppiin tarkoituksena vähentää muistin- sekä tilankulutusta ja nopeuttaa päättelyä (engl. inference). Kvantisointi nopeuttaa päättelynaikaista suorituskykyä, sekä pienentää muistin sekä tilankulutusta metodista riippuen eri määrin.
Kvantisointi kuitenkin tiivistää informaatioita pienempään tilaan ja vaikuttaa neuroverkkojen toiminnallisuuteen riippuen kvantisointitekniikasta sekä siitä, kuinka pienen tarkkuuden datatyyppiin informaatioita kompressoidaan. Toiminnallisuuden haittavaikutukset näkyvät kielimallien kontekstuaalisessa ymmärtämisessä, dialogissa sekä itsestään kehittyvissä kyvyissä (engl. emergent abilities – EA). Toiminnallisuuden muutoksia voidaan mitata erilaisilla analysointimetodeilla, joista kerrotaan tutkielmassa.
Ensin tutkielmassa tarkastellaan hieman keskeisimpiä syitä miksi kvantisointi on hyödyllinen kompressointitekniikka sekä kvantisoinnin matemaattisia periaatteita. Sen jälkeen kerrotaan hieman kielimallien analysointimetodeista jonka jälkeen esitellään tulokset. Lopuksi yhteenveto ja johtopäätökset luvussa esitetään mahdollisia jatkotutkimuskohteita.
Kvantisointi kuitenkin tiivistää informaatioita pienempään tilaan ja vaikuttaa neuroverkkojen toiminnallisuuteen riippuen kvantisointitekniikasta sekä siitä, kuinka pienen tarkkuuden datatyyppiin informaatioita kompressoidaan. Toiminnallisuuden haittavaikutukset näkyvät kielimallien kontekstuaalisessa ymmärtämisessä, dialogissa sekä itsestään kehittyvissä kyvyissä (engl. emergent abilities – EA). Toiminnallisuuden muutoksia voidaan mitata erilaisilla analysointimetodeilla, joista kerrotaan tutkielmassa.
Ensin tutkielmassa tarkastellaan hieman keskeisimpiä syitä miksi kvantisointi on hyödyllinen kompressointitekniikka sekä kvantisoinnin matemaattisia periaatteita. Sen jälkeen kerrotaan hieman kielimallien analysointimetodeista jonka jälkeen esitellään tulokset. Lopuksi yhteenveto ja johtopäätökset luvussa esitetään mahdollisia jatkotutkimuskohteita.
Kokoelmat
- Kandidaatintutkielmat [10829]
