Efficient Deep Learning for Person Detection
Eloranta, Olli (2020)
Eloranta, Olli
2020
Tietotekniikan DI-tutkinto-ohjelma - Degree Programme in Information Technology, MSc (Tech)
Informaatioteknologian ja viestinnän tiedekunta - Faculty of Information Technology and Communication Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2020-05-22
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-202004294553
https://urn.fi/URN:NBN:fi:tuni-202004294553
Tiivistelmä
This work researches how an efficient object detection neural network can be implemented. The object detectors use image classification networks in their pipeline as so-called feature extractors, and their efficiencies are researched as well. The best practices for speeding up both classification and detection networks are presented. The main concepts of machine learning, neural networks and object detection are also presented to form an understanding in the subject.
Based on the neural network research, an SSD-MobileNetV2 object detector model is trained with multiple different parameters to evaluate how the parameters affect the detection speed and accuracy. Changing the input image size and number of channels in the network greatly affect the performance of the model, but other effects on performance are discussed as well. The results can be used to more quickly select the appropriate parameters for training a object detector, depending on the application. Tässä työssä tutkitaan miten tehokkaita neuroverkkoja toteutetaan hahmontunnistukseen. Tehokkuudella tarkoitetaan hyvää hyötysuhdetta nopeuden ja tarkkuuden välillä. Hahmontunnistusverkot käyttävät yhtenä osanaan myös kuvien luokitteluverkkoa niin sanottuna piirteenirroittajana, joten näitä molempia tutkitaan verkkoa nopeuttavien menetelmien löytämiseksi. Yleiset käsitteet koneoppimisesta, neuroverkoista ja hahmontunnistuksesta on esitelty ymmärryksen syventämiseksi.
Tutkimuksen perusteella työhön valittiin yksi neuroverkkoarkkitehtuuri, SSD-MobileNetV2, jonka koulutusparametreja muutettiin niiden vaikutusten selvittämiseksi. Vaikutuksia arvioitiin keskenään, ja merkittävimmiksi tekijöiksi havaittiin syötetyn kuvan koko ja neuroverkon kanavien määrä. Tehdyn tutkimuksen avulla voidaan nopeammin löytää eri sovelluskohteisiin sopiva arkkitehtuuri.
Based on the neural network research, an SSD-MobileNetV2 object detector model is trained with multiple different parameters to evaluate how the parameters affect the detection speed and accuracy. Changing the input image size and number of channels in the network greatly affect the performance of the model, but other effects on performance are discussed as well. The results can be used to more quickly select the appropriate parameters for training a object detector, depending on the application.
Tutkimuksen perusteella työhön valittiin yksi neuroverkkoarkkitehtuuri, SSD-MobileNetV2, jonka koulutusparametreja muutettiin niiden vaikutusten selvittämiseksi. Vaikutuksia arvioitiin keskenään, ja merkittävimmiksi tekijöiksi havaittiin syötetyn kuvan koko ja neuroverkon kanavien määrä. Tehdyn tutkimuksen avulla voidaan nopeammin löytää eri sovelluskohteisiin sopiva arkkitehtuuri.