Katsaus superresoluution tuottamiseen generatiivisilla kilpailevilla verkoilla
Törmä, Pauli (2023)
Törmä, Pauli
2023
Tietojenkäsittelytieteiden kandidaattiohjelma - Bachelor's Programme in Computer Sciences
Informaatioteknologian ja viestinnän tiedekunta - Faculty of Information Technology and Communication Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2023-02-06
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-202301111330
https://urn.fi/URN:NBN:fi:tuni-202301111330
Tiivistelmä
Superresoluution (SR) tuottaminen on menetelmä, jossa sumeista, epätarkoista tai pienistä kuvista muodostetaan korkealaatuisempi kuva parannetuilla yksityiskohdilla. Superresoluutioita hyödynnetään eri aloilla, muun muassa lääketieteen kuvantamisessa ja kaukokartoituksessa. Kun kuvauslaitteet tai -tilanteet eivät mahdollista korkealaatuisten kuvien ottamista, voidaan kuvia parantaa superresoluutiolla. Generatiivinen kilpaileva verkko (GAN) on neuroverkkoarkkitehtuuri, jolla voidaan tuottaa luonnollisen näköisiä SR-kuvia. Tutkielma on katsaus superresoluutioon ja GAN-verkkojen käyttämisestä superresoluution tuottamiseen. Lisäksi tutkitaan, mitä haasteita erityisesti ihmisen kasvoista tehdyissä suurennoksissa kohdataan.
Työ on kirjallisuuskatsaus, joka jakautuu kolmeen osaan. Ensimmäiseksi määritellään SR-kuvan tuottamistehtävä, sen nykyiset käyttökohteet, lyhyt historia ja niiden mittaamismenetelmät. Toiseksi katsotaan, mitä GAN-verkot ovat ja miten ne toimivat superresoluutioita tuottaessa. Neljännessä luvussa käsitellään ongelmia ja niiden ratkaisuja, mitä erityisesti superresoluutioita ihmisen kasvoista tuottaessa kohdataan. Lähteenä käytetään alan artikkeleita tieteellisistä tietokannoista. Artikkeleiksi on koitettu valita melko uusia julkaisuja, koska alalla tapahtuu paljon kehitystä vuosittain.
Työssä on havaittu, että superresoluutio on huonosti asetettu ongelma, mikä tekee sen ratkaisemisesta haastavaa. Koska yhdelle huonolaatuiselle kuvalle voi muodostaa loputtoman määrän erilaisen kaltaisia paranneltuja kuvia, on tärkeä mitata niiden laatua oikeilla mittareilla. Varsinkin ihmisten kasvoista SR-kuvia tuotettaessa luonnollisen näköiset tulokset ovat usein kaikkein tärkeimpiä, eivätkä esimerkiksi alhaisen kohinan määrä. GAN-verkot on lähteissä yhtenevästi todettu hyviksi tavoiksi tuottamaan superresoluutioita, johtuen niiden kyvystä tuottamaan koulutusdatan kaltaista tulostetta. GAN-verkkojen superresoluution tuottamisen suurimmiksi ongelmiksi osoittautui käyttökohteita vastaavan koulutusdatan puute ja kuvanlaadun mittaamisen rajoitteet. Ratkaisuiksi ongelmiin esitetään esimerkiksi neuroverkkojen käyttämisestä kattavamman koulutusdatan muodostamiseen.
Työ on kirjallisuuskatsaus, joka jakautuu kolmeen osaan. Ensimmäiseksi määritellään SR-kuvan tuottamistehtävä, sen nykyiset käyttökohteet, lyhyt historia ja niiden mittaamismenetelmät. Toiseksi katsotaan, mitä GAN-verkot ovat ja miten ne toimivat superresoluutioita tuottaessa. Neljännessä luvussa käsitellään ongelmia ja niiden ratkaisuja, mitä erityisesti superresoluutioita ihmisen kasvoista tuottaessa kohdataan. Lähteenä käytetään alan artikkeleita tieteellisistä tietokannoista. Artikkeleiksi on koitettu valita melko uusia julkaisuja, koska alalla tapahtuu paljon kehitystä vuosittain.
Työssä on havaittu, että superresoluutio on huonosti asetettu ongelma, mikä tekee sen ratkaisemisesta haastavaa. Koska yhdelle huonolaatuiselle kuvalle voi muodostaa loputtoman määrän erilaisen kaltaisia paranneltuja kuvia, on tärkeä mitata niiden laatua oikeilla mittareilla. Varsinkin ihmisten kasvoista SR-kuvia tuotettaessa luonnollisen näköiset tulokset ovat usein kaikkein tärkeimpiä, eivätkä esimerkiksi alhaisen kohinan määrä. GAN-verkot on lähteissä yhtenevästi todettu hyviksi tavoiksi tuottamaan superresoluutioita, johtuen niiden kyvystä tuottamaan koulutusdatan kaltaista tulostetta. GAN-verkkojen superresoluution tuottamisen suurimmiksi ongelmiksi osoittautui käyttökohteita vastaavan koulutusdatan puute ja kuvanlaadun mittaamisen rajoitteet. Ratkaisuiksi ongelmiin esitetään esimerkiksi neuroverkkojen käyttämisestä kattavamman koulutusdatan muodostamiseen.
Kokoelmat
- Kandidaatintutkielmat [8745]