Puhehaun tutkimus ja puhetiedonhaun toteuttamismahdollisuudet suomalaisten nettiradioiden digitaalisissa arkistoissa.
KATAJA, MARJUT (2003)
Tässä tietueessa ei ole kokotekstiä saatavilla Treposta, ainoastaan metadata.
KATAJA, MARJUT
2003
Informaatiotutkimus - Information Studies
Informaatiotieteiden tiedekunta - Faculty of Information Sciences
Hyväksymispäivämäärä
2003-06-10Sisällysluettelo
TIIVISTELMÄ 4 1 JOHDANTO 5 2 PUHETIEDONHAKU 9 2.1 PUHETIEDONHAUN MÄÄRITELMIÄ 9 2.2 PUHEENTUNNISTUS 10 2.2.1 Puheen automaattinen tunnistaminen 11 2.2.2 Sanapohjainen puheentunnistus 14 2.2.3 Foneemipohjainen puheentunnistus 18 2.2.4 Automaattinen puhujan tunnistus 20 2.2.5 Automaattinen kielen tunnistus 22 2.3 PUHEDOKUMENTTIEN INDEKSOINTI 24 2.3.1 Teosperusteinen indeksointi 26 2.3.2 Sisältöperusteinen indeksointi 27 2.3.3 Puheen prosodiset piirteet 29 2.4 PUHETIEDONHAUN KÄYTTÖLIITTYMÄT 31 2.4.1 Käyttöliittymien antamat välineet tiedonhaulle 33 2.4.2 Puheperusteiset käyttöliittymät 37 2.4.3 Tekstipohjainen tiedonhaku puhetietokannoista 39 2.5 SUOMENKIELINEN PUHEHAKU 42 2.5.1 Puheentutkimus Suomessa 42 2.5.2 Puhutun kielen erityispiirteitä puhehaun kannalta 45 3 RADIO TIETOVERKOSSA 48 3.1 RADION JA RADIOTYÖN ERITYISPIIRTEITÄ 49 3.2 NETTIRADIO 50 3.2.1 Mikä nettiradio on? 50 3.2.2 Nettiradion ominaisuuksia 51 3.2.3 Nettiradion kuunteleminen 53 3.2.4 Radio-ohjelma tietoverkossa 54 3.3.1 Yleisradion toiminta tietoverkossa 56 3.3.2 Muut suomalaiset nettiradiot 59 3.4 DIGITAALISET ÄÄNIARKISTOT 62 3.4.1 Digitaalinen radioarkisto Suomessa 62 3.4.2 Digitaalisen arkiston hakemisto - esimerkki 63 3.4.3 Tekijänoikeuskysymykset ääniarkistoissa 65 4 NETTIRADIOTOIMITTAJIEN TUTKIMUSHAASTATTELU 68 4.1 HAASTATTELUOSUUDEN LÄHTÖKOHDAT JA TAVOITTEET 68 4.2 TUTKIMUSMENETELMÄN VALINTA JA HAASTATTELUJEN TEKEMINEN 69 4.3 HAASTATTELUJEN ANALYYSI 70 5 TULOKSET 72 6 POHDISKELUA 76 LÄHDELUETTELO 79 PAINETUT LÄHTEET 79 PAINAMATTOMAT LÄHTEET 85 LIITTEET 86 LIITE 1. HAASTATELTAVAT 86 LIITE 2: HAASTATTELURUNKO NETTIRADIOTOIMINNASTA 87
Tiivistelmä
Tässä kirjallisuuteen pohjautuvassa tutkielmassa käsitellään puhehaun tutkimuksen nykytilaa. Puhehaun tutkimukseen sisältyy puheentunnistuksen menetelmien kuvaileminen, puhedokumenttien indeksoinnin esittely sekä puhehaun käyttöliittymien tarkastelu. Suomenkielisen puhehaun tutkimuksen tämänhetkinen tila on myös tarkastelun kohteena.
Toinen tämän tutkielman kantava aihe ovat suomalaiset tietoverkoissa toimivat nettiradiot. Kun mietitään puhepohjaiselle tiedonhaulle sovellutusmahdollisuuksia, ovat nettiradioiden digitaaliset puhearkistot yksi potentiaalinen käyttäjäryhmä. Varsinaiseen käytännön sovellutukseen ei todennäköisesti päästä vielä pitkään aikaan, mutta periaatteessa visio voi joskus toteutua.
Toinen tämän tutkielman kantava aihe ovat suomalaiset tietoverkoissa toimivat nettiradiot. Kun mietitään puhepohjaiselle tiedonhaulle sovellutusmahdollisuuksia, ovat nettiradioiden digitaaliset puhearkistot yksi potentiaalinen käyttäjäryhmä. Varsinaiseen käytännön sovellutukseen ei todennäköisesti päästä vielä pitkään aikaan, mutta periaatteessa visio voi joskus toteutua.