Digitaalisen videon automaattinen sisällönkuvailu tv-uutisissa ja videotiedonhaun käyttöliittymät.
TANNI, MIKKO (2003)
TANNI, MIKKO
2003
Informaatiotutkimus - Information Studies
Informaatiotieteiden tiedekunta - Faculty of Information Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2003-03-26
Julkaisun pysyvä osoite on
https://urn.fi/urn:nbn:fi:uta-1-11694
https://urn.fi/urn:nbn:fi:uta-1-11694
Tiivistelmä
Tässä kirjallisuustutkielmassa käsitellään digitaalisten videoiden automaattiseen sisällönkuvailuun soveltuvien hahmopohjaisten indeksointimenetelmien periaatteita. Lähteet on valittu ja teksti jäsennetty TV-uutisten erityisvaatimusten ja -ominaisuuksien perusteella. Tarkastelu keskittyy metadatan tuottamiseen videodatan havaittavista piirteistä sisällönkuvailun eri tasoilla. Indeksoinnin lisäksi tutkielmassa käsitellään videontiedonhaun käyttöliittymiä. Tavoitteena on jäsentää videoiden automaattisen sisällönkuvailun ja visualisoinnin ongelmakenttiä koskevaa kirjallisuutta. Menetelmien toimivuutta pohditaan Yleisradion TV-uutislähetyksen kohdalla.
Tulosten perusteella voidaan esittää, että videoiden ajallisen rakenteen jäsentäminen esimerkiksi uutisjuttujen tunnistaminen on realistisesti toteutettavissa automaattisin menetelmin nykytietämyksen valossa, ja sitä on käsitelty kirjallisuudessa kattavasti. Sen sijaan sisällön tunnistaminen semanttisella tasolla esimerkiksi havaittujen kasvojen nimeäminen on edelleen ratkaisematon ongelma muuten kuin rajoitetuissa konteksteissa. Nykyisten indeksointimenetelmien suorituskykyä voitaisiin parantaa integroimalla kuvaan ja ääneen perustuvia menetelmiä entistä tiukemmin. Videotiedonhakua varten on kehitelty erilaisia hakuvälineitä, mutta ne ovat rajoittuneita eivätkä hyödynnä kuin osaa mahdollisista visualisointimenetelmistä. Hakujärjestelmää suunniteltaessa pitäisi ottaa huomioon indeksointimenetelmien rajoitukset.
Tulosten perusteella voidaan esittää, että videoiden ajallisen rakenteen jäsentäminen esimerkiksi uutisjuttujen tunnistaminen on realistisesti toteutettavissa automaattisin menetelmin nykytietämyksen valossa, ja sitä on käsitelty kirjallisuudessa kattavasti. Sen sijaan sisällön tunnistaminen semanttisella tasolla esimerkiksi havaittujen kasvojen nimeäminen on edelleen ratkaisematon ongelma muuten kuin rajoitetuissa konteksteissa. Nykyisten indeksointimenetelmien suorituskykyä voitaisiin parantaa integroimalla kuvaan ja ääneen perustuvia menetelmiä entistä tiukemmin. Videotiedonhakua varten on kehitelty erilaisia hakuvälineitä, mutta ne ovat rajoittuneita eivätkä hyödynnä kuin osaa mahdollisista visualisointimenetelmistä. Hakujärjestelmää suunniteltaessa pitäisi ottaa huomioon indeksointimenetelmien rajoitukset.