Smoke and Fire Segmentation from Images Using Weakly Supervised Neural Networks
Juntti, Raafael (2020)
Juntti, Raafael
2020
Tieto- ja sähkötekniikan kandidaattiohjelma - Degree Programme in Computing and Electrical Engineering, BSc (Tech)
Informaatioteknologian ja viestinnän tiedekunta - Faculty of Information Technology and Communication Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2020-04-29
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-202004263771
https://urn.fi/URN:NBN:fi:tuni-202004263771
Tiivistelmä
In this thesis, a deep convolutional semantic segmentation network is trained to annotate fire and smoke presence in still images. The network is trained without handmade segmentation ground truth available. A recently proposed weakly supervised instance segmentation method is utilized to generate the missing annotations. These annotations are then used to train a DeepLabV3+ model capable of real-time performance, potentially even on embedded devices.
The resulting model reaches IoU-scores in ranges of 0.38–0.43 for smoke, 0.53–0.59 for fire and 0.96–0.97 for the background-class (no fire or smoke present in pixel) on the multiple evaluation datasets used. Additionally, counting the events where fire or smoke is falsely present in the prediction mask, the resulting false positive rate (FPR) is in ranges of 0.024–0.100 for smoke and 0.11–0.27 for fire. Respective true positive rate (TPR) ranges were 0.48–0.65 for smoke and 0.91–0.95 for fire. Tässä kandidaatintyössä koulutetaan syvä konvoluutioverkko tulen ja savun semanttiseen segmentointiin (semantic segmentation) yksittäisistä kuvista ja ilman tarkoitukseen laadittua koulutusdataa, jossa tuli- ja savupeitteet olisi käsin määritelty kuviin. Hiljattain julkaistua, heikosti valvottua instanssisegmentointimenetelmää käytetään tuottamaan puuttuvat koulutusmaskit, ja näin kehitettyä koulutusdatajoukkoa vasten koulutetaan reaaliaikaiseen suoritukseen kykenevä DeepLabV3+-malli.
Tuloksena saatu malli saavuttaa IoU-arvon (intersection over union) 0.38–0.43 savulle, 0.53–0.59 tulelle ja 0.96–0.97 taustalle (pikselissä ei ole tulta tai savua) arviointiin käytetyillä datajoukoilla. Lisäksi, kun lasketaan tilanteita, joissa malli ennustaa virheellisesti tulta tai savua kuvista
joissa kumpaakaan ei esiinny, malli saavuttaa FPR-arvon (false positive rate) väliltä 0.024–0.100 savulle ja 0.11–0.27 tulelle. Vastaavat TPR-arvot (true positive rate) tilanteille joissa tuli ja savu tunnistetaan oikein, ovat väleiltä 0.48–0.65 savulle ja 0.91–0.95 tulelle.
The resulting model reaches IoU-scores in ranges of 0.38–0.43 for smoke, 0.53–0.59 for fire and 0.96–0.97 for the background-class (no fire or smoke present in pixel) on the multiple evaluation datasets used. Additionally, counting the events where fire or smoke is falsely present in the prediction mask, the resulting false positive rate (FPR) is in ranges of 0.024–0.100 for smoke and 0.11–0.27 for fire. Respective true positive rate (TPR) ranges were 0.48–0.65 for smoke and 0.91–0.95 for fire.
Tuloksena saatu malli saavuttaa IoU-arvon (intersection over union) 0.38–0.43 savulle, 0.53–0.59 tulelle ja 0.96–0.97 taustalle (pikselissä ei ole tulta tai savua) arviointiin käytetyillä datajoukoilla. Lisäksi, kun lasketaan tilanteita, joissa malli ennustaa virheellisesti tulta tai savua kuvista
joissa kumpaakaan ei esiinny, malli saavuttaa FPR-arvon (false positive rate) väliltä 0.024–0.100 savulle ja 0.11–0.27 tulelle. Vastaavat TPR-arvot (true positive rate) tilanteille joissa tuli ja savu tunnistetaan oikein, ovat väleiltä 0.48–0.65 savulle ja 0.91–0.95 tulelle.
Kokoelmat
- Kandidaatintutkielmat [6534]