Characterizing and detecting wind noise in audio recordings
Honkakunnas, Aapo (2021)
Honkakunnas, Aapo
2021
Teknis-luonnontieteellinen DI-ohjelma - Master's Programme in Science and Engineering
Tekniikan ja luonnontieteiden tiedekunta - Faculty of Engineering and Natural Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2021-05-11
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-202104273791
https://urn.fi/URN:NBN:fi:tuni-202104273791
Tiivistelmä
Wind noise is a common nuisance when performing audio recording in outdoor situations. The aim of this thesis was to investigate different methods of characterizing wind noise occurring in audio recording situations, and to use these methods in wind noise detection and analyzing the behaviour of wind noise around a recording device. Four audio signal features zero-crossing rate, root mean square energy, sub-band spectral centroid and magnitude squared coherence were used in modeling the characteristics of wind noise with arguments presented for using them. Measurements were performed using a specific laboratory setup capable of measuring wind and recording audio. Recordings were performed outdoors with simultaneously recording a device in natural wind and another device inside a windshield and using devices with multiple microphones. Directly comparing the two simultaneous recordings a method for approximating absolute amount of wind noise present was suggested.
Wind detection was performed using logistic regression and Gaussian mixture model based classifiers, a Hidden Markov model was used in modelling the wind noise in different microphones around the recording device. Mathematical foundation for the methods was presented. The methods used were considered successful in characterizing and detecting the wind noise, with classifiers achieving high performance scores. The used methods also have potential to be applied in further considerations with different recording devices and data. Tuulimelu on yleinen ongelma ulkoilmassa suoritetuissa äänityksissä. Tämän työn tarkoituksena on tutkia erilaisia menetelmiä äänityksissä havaittavan tuulimelun karakterisointiin, sekä hyödyntää näitä menetelmiä tuulimelun havaitsemisessa sekä sen äänityslaitteen ympärillä käyttäytymisen tutkimisessa. Neljää äänisignaalin piirrettä, nollanylitysten nopeutta, neliöllistä keskiarvoenergiaa, alivyön spektrikeskusta sekä neliöityä koherenssia, käytettiin karakterisoimisessa. Perustelut käytölle esitettiin. Mittauksia suoritettiin käyttäen erityistä laboratoriojärjestelyä, joka mahdollisti tuulen mittaamisen sekä äänen nauhoittamisen. Nauhoitukset suoritettiin ulkona nauhoittaen samaan aikaan monimikrofonista laitetta luonnollisessa tuulessa ja toista samanlaista laitetta tuulisuojan sisällä. Tuulimelun absoluuttisen määrän arvioimiseen esitelttiin samanaikaisten nauhoitusten vertailua hyödyntävä menetelmä.
Tuulen havaitsemisessa käytettiin logistiseen regressioon sekä normaalisekoitemalliin perustuvia luokittelijoita. Markovin piilomallia käytettiin mallintamaan tuulimelun käyttäytymistä äänityslaitteen ympärillä. Menetelmien matemaattinen perusta esiteltiin. Käytetyt menetelmät suoriutuivat hyvin tuulimelun karakterisoimisessa ja havaitsemisessa. Luokittelijoiden arviointipisteet olivat korkeat. Käytettyjä menetelmiä voi hyödyntää myöhemmissäkin tarkasteluissa käyttäen erilaisia äänityslaitteita ja erilaista dataa.
Wind detection was performed using logistic regression and Gaussian mixture model based classifiers, a Hidden Markov model was used in modelling the wind noise in different microphones around the recording device. Mathematical foundation for the methods was presented. The methods used were considered successful in characterizing and detecting the wind noise, with classifiers achieving high performance scores. The used methods also have potential to be applied in further considerations with different recording devices and data.
Tuulen havaitsemisessa käytettiin logistiseen regressioon sekä normaalisekoitemalliin perustuvia luokittelijoita. Markovin piilomallia käytettiin mallintamaan tuulimelun käyttäytymistä äänityslaitteen ympärillä. Menetelmien matemaattinen perusta esiteltiin. Käytetyt menetelmät suoriutuivat hyvin tuulimelun karakterisoimisessa ja havaitsemisessa. Luokittelijoiden arviointipisteet olivat korkeat. Käytettyjä menetelmiä voi hyödyntää myöhemmissäkin tarkasteluissa käyttäen erilaisia äänityslaitteita ja erilaista dataa.