Hyppää sisältöön
    • Suomeksi
    • In English
Trepo
  • Suomeksi
  • In English
  • Kirjaudu
Näytä viite 
  •   Etusivu
  • Trepo
  • Kandidaatintutkielmat (Limited access)
  • Näytä viite
  •   Etusivu
  • Trepo
  • Kandidaatintutkielmat (Limited access)
  • Näytä viite
JavaScript is disabled for your browser. Some features of this site may not work without it.

Katsaus latenttien diffuusiomallien hienosäätötekniikoihin

Hurmalainen, Mikko (2025)

 
Avaa tiedosto
HurmalainenMikko.pdf (613.4Kt)
Lataukset: 

Tekijä ei ole antanut lupaa avoimeen julkaisuun, aineisto on luettavissa vain Tampereen yliopiston kirjastojen opinnäytepisteillä. The author has not given permission to publish the thesis online. The thesis can be read at the thesis point at Tampere University Library.

Hurmalainen, Mikko
2025

Tietojenkäsittelytieteiden kandidaattiohjelma - Bachelor's Programme in Computer Sciences
Informaatioteknologian ja viestinnän tiedekunta - Faculty of Information Technology and Communication Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2025-06-10
Näytä kaikki kuvailutiedot
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-202506097005
Tiivistelmä
Tässä kandidaattitutkielmassa tarkastellaan latenttien diffuusiomallien hienosäätötekniikoita, niiden perusteita, menetelmiä ja keskeisiä tuloksia. Latentit diffuusiomallit ovat syväoppimiseen pohjautuvia generatiivisia malleja, jotka ovat osoittaneet merkittävää potentiaalia kuvien luonnissa. Niiden avulla on mahdollista tuottaa realistisia ja yksityiskohtaisia kuvia teksti- tai kuvasyötteiden perusteella. Vaikka diffuusiomallit ovatkin tehokkaita, niiden suorituskykyä voidaan parantaa hienosäädöllä vastaamaan tarkemmin asetettuja vaatimuksia.
Hienosäätö voi olla tarpeen, koska diffuusiomallit eivät tyypillisesti kykene tuottamaan useita kuvia samasta henkilöstä tai tilanteesta, eivätkä ne välttämättä osaa luoda vaadittua tyyliä tai yksityiskohtia. Mallit eivät myöskään osaa luoda kuvia henkilöistä tai esineistä, joita niiden koulutusdatassa ei ole ollut. Mallia on jatkokoulutettava pienemmällä, kohdennetulla datalla, jolla sille opetetaan halutut konseptit.
Tässä tutkielmassa tarkastellaan eri hienosäätötekniikoiden, kuten täydellisen hienosäädön, ja parametritehokkaiden hienosäätömenetelmien, kuten Hypernetworksin, LoRAn, Textual Inversionin ja DreamBoothin vahvuuksia ja heikkouksia. Vertailussa keskitytään mm. resurssivaatimuksiin, koulutusnopeuteen ja lopputulosten laatuun. Tutkielman keskeinen tavoite on selvittää, mikä tekniikka sopii parhaiten tiettyihin käyttötarkoituksiin.
Tutkielman tulokset osoittavat, että parametritehokkaat hienosäätömenetelmät ovat usein paras valinta tilanteissa, joissa resurssit ovat rajalliset tai koulutusaika on rajoitettu. LoRA ja Textual Inversion tarjoavat hyvän kompromissin laadun ja resurssien tarpeen välillä, kun taas DreamBooth on sopivin tilanteisiin, joissa laatu on ensisijainen tavoite ja resurssit eivät ole rajoittava tekijä.
Kokoelmat
  • Kandidaatintutkielmat (Limited access) [1957]
Kalevantie 5
PL 617
33014 Tampereen yliopisto
oa[@]tuni.fi | Tietosuoja | Saavutettavuusseloste
 

 

Selaa kokoelmaa

TekijätNimekkeetTiedekunta (2019 -)Tiedekunta (- 2018)Tutkinto-ohjelmat ja opintosuunnatAvainsanatJulkaisuajatKokoelmat

Omat tiedot

Kirjaudu sisäänRekisteröidy
Kalevantie 5
PL 617
33014 Tampereen yliopisto
oa[@]tuni.fi | Tietosuoja | Saavutettavuusseloste