Kielimallien ymmärtäminen : Tekijät, jotka vaikuttavat tuotetun tekstin laatuun ja monimuotoisuuteen
Hanski, Timo (2024)
Hanski, Timo
2024
Tietojenkäsittelytieteiden kandidaattiohjelma - Bachelor's Programme in Computer Sciences
Informaatioteknologian ja viestinnän tiedekunta - Faculty of Information Technology and Communication Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2024-05-28
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-202405246281
https://urn.fi/URN:NBN:fi:tuni-202405246281
Tiivistelmä
Tämän kandidaatintutkimuksen päämääränä on löytää ja tutkia niitä tekijöitä, jotka vai kuttavat kielimallien tuottaman tekstin monimuotoisuuteen ja laatuun nykyisen tutkimuskirjallisuuden valossa.
Tutkimuksen ensimmäisessä vaiheessa käyn läpi kielimallien kehitystä, selvittäen, miten ne ovat edenneet nykyiseen kehitysvaiheeseensa ja millaisia haasteita kielimallien tekstintuotannossa on kohdattu.
Seuraavassa vaiheessa tutkimus keskittyy tarkemmin mallien tekstintuoton laatuun ja monimuotoisuuteen vaikuttaviin tekijöihin. Tunnistettuja tekijöitä ovat kielimallien rakenteelliset ominaisuudet, kuten neuroverkkoarkkitehtuurit (RNN, CNN ja Transformer), sekä parametrit, kuten sanastokoko ja piilokerrokset.
Lisäksi tutkimuksessa tarkastelen, miten koulutusdatan laatu ja monimuotoisuus sekä mahdolliset hienosäätömenetelmät vaikuttavat tuotettuun tekstiin.
Lopuksi analysoin käyttäjien strategioita kielimallien tehokkaaseen ohjeistamiseen. Tähän kuuluvat mallia ohjaavien kehotteiden suunnittelu ja muotoilu.
Nämä elementit yhdessä tarjoavat perustan kielimallien tekstintuoton ymmärtämiselle.
Tutkimuksen ensimmäisessä vaiheessa käyn läpi kielimallien kehitystä, selvittäen, miten ne ovat edenneet nykyiseen kehitysvaiheeseensa ja millaisia haasteita kielimallien tekstintuotannossa on kohdattu.
Seuraavassa vaiheessa tutkimus keskittyy tarkemmin mallien tekstintuoton laatuun ja monimuotoisuuteen vaikuttaviin tekijöihin. Tunnistettuja tekijöitä ovat kielimallien rakenteelliset ominaisuudet, kuten neuroverkkoarkkitehtuurit (RNN, CNN ja Transformer), sekä parametrit, kuten sanastokoko ja piilokerrokset.
Lisäksi tutkimuksessa tarkastelen, miten koulutusdatan laatu ja monimuotoisuus sekä mahdolliset hienosäätömenetelmät vaikuttavat tuotettuun tekstiin.
Lopuksi analysoin käyttäjien strategioita kielimallien tehokkaaseen ohjeistamiseen. Tähän kuuluvat mallia ohjaavien kehotteiden suunnittelu ja muotoilu.
Nämä elementit yhdessä tarjoavat perustan kielimallien tekstintuoton ymmärtämiselle.
Kokoelmat
- Kandidaatintutkielmat [9156]