Visual Object Tracking on RGBD Videos Using Discriminative Correlation Filters
Kart, Ugur (2021)
Kart, Ugur
Tampere University
2021
Tieto- ja sähkötekniikan tohtoriohjelma - Doctoral Programme in Computing and Electrical Engineering
Informaatioteknologian ja viestinnän tiedekunta - Faculty of Information Technology and Communication Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Väitöspäivä
2021-10-08
Julkaisun pysyvä osoite on
https://urn.fi/URN:ISBN:978-952-03-2058-4
https://urn.fi/URN:ISBN:978-952-03-2058-4
Tiivistelmä
Digitaalisen median määrä ja käyttö on kasvanut eksponentiaalisesti johtuen digitaalisten kameroiden ja kamerapuhelimien määrän kasvusta. Suuresta määrästä johtuen kuvien ja videoiden manuaalinen käsittely ja analysointi ei enää ole mahdollista. Automaattista käsittelyä ja analyysia varten kehitetään jatkuvasti parempia tietokonenäköalgoritmeja. Yksi tärkeä analyysiongelma on visuaalinen kohteiden seuraaminen, jossa seurattava kohde on merkitty vain ensimmäiseen videon ruutuun ja menetelmän pitää pystyä seuraamaan sitä läpi videon. Kohteiden seuraamista on tutkittu laajasti ja hyviä menetelmiä löytyy erityisesti perinteisten värikameroiden (RGB-kamera) tuottamille videoille. Viime aikoina ovat kuitenkin myös RGBDkamerat yleistyneet ja näissä on värikuvan lisäksi myös syvyystieto (etäisyystieto) käytettävissä. Syvyystieto auttaa mallintamaan kohteen liikettä 3D-ympäristössä ja tekee esim. kohteiden peittymisen (eng. "occlusion") ja 3D-muodonmuutosten havaitsemisen helpommaksi.
Tämä väitöskirjatyö käsittelee visuaalista kohteenseurantaa RGBD-kameroiden tuottamalle videolle ja tekee kaksi merkittävää tieteellistä kontribuutiota. Ensimmäisenä kontribuutiona työ esittelee uuden RGBD-menetelmän kohteenseurantaan. Menetelmä pohjautuu spatiaalisesti rajoitettuun korrelaatiosuotimeen, joka on ollut menestyksekäs menetelmäRGB-kohteenseurannassa. Uusi menetelmä on kuitenkin ensimmäinen, jossa syvyystieto on yhdistetty korrelaatiosuotimiin. Menetelmä hyödyntää syvyysdataa kohteen peittymisen havaitsemisessa. Peittymisen havaitseminen mahdollistaa kohteen mallin päivittämisen vain niiltä osin kuin kohde on näkyvissä. Esitelty menetelmä saavuttaa parhaat kirjallisuudessa tunnetut tulokset julkisilla testaustietokannoilla. Väitöskirjan toinen tärkeä kontribuutio on uusi testaustietokanta RGBD-kohteenseurantaan. Uusi tietokanta paikkaa aikaisemmissa tietokannoissa olleita puutteita ja näin mahdollistaa entistä parempien menetelmien kehittämisen.
Tämä väitöskirjatyö käsittelee visuaalista kohteenseurantaa RGBD-kameroiden tuottamalle videolle ja tekee kaksi merkittävää tieteellistä kontribuutiota. Ensimmäisenä kontribuutiona työ esittelee uuden RGBD-menetelmän kohteenseurantaan. Menetelmä pohjautuu spatiaalisesti rajoitettuun korrelaatiosuotimeen, joka on ollut menestyksekäs menetelmäRGB-kohteenseurannassa. Uusi menetelmä on kuitenkin ensimmäinen, jossa syvyystieto on yhdistetty korrelaatiosuotimiin. Menetelmä hyödyntää syvyysdataa kohteen peittymisen havaitsemisessa. Peittymisen havaitseminen mahdollistaa kohteen mallin päivittämisen vain niiltä osin kuin kohde on näkyvissä. Esitelty menetelmä saavuttaa parhaat kirjallisuudessa tunnetut tulokset julkisilla testaustietokannoilla. Väitöskirjan toinen tärkeä kontribuutio on uusi testaustietokanta RGBD-kohteenseurantaan. Uusi tietokanta paikkaa aikaisemmissa tietokannoissa olleita puutteita ja näin mahdollistaa entistä parempien menetelmien kehittämisen.
Kokoelmat
- Väitöskirjat [4905]