Puulajitunnistus konvoluutioneuroverkoilla
Koskinen, Santeri (2021)
Koskinen, Santeri
2021
Tietotekniikan DI-ohjelma - Master's Programme in Information Technology
Informaatioteknologian ja viestinnän tiedekunta - Faculty of Information Technology and Communication Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2021-09-03
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-202108206678
https://urn.fi/URN:NBN:fi:tuni-202108206678
Tiivistelmä
Tässä diplomityössä tutkitaan neuroverkon parametrien sekä koulutusaineiston laadun vaikutusta automaattiseen puulajitunnistukseen. Tutkimusta varten työssä koulutetaan puun runkojen kuvia ja metadataa käyttävä konvoluutioneuroverkko tunnistamaan näytteitä neljän Suomen metsissä yleisesti esiintyvän puulajin väliltä. Neuroverkon koulutusta ja tulosten mittaamista varten käytetään yksityistä 23 600 runkokuvasta per puulaji koostuvaa aineistoa.
Tuloksena saadaan 72,5 % luokittelutarkkuus testiaineistolle. Konvoluutioneuroverkon syötteenä toimivien kuvien koon kasvatus ja metadatan käyttö todetaan luokittelutulosta parantaviksi menetelmiksi. Kuvien esiprosessointimenetelmistä kuvien skaalaaminen välille [0, 1] osoittautuu toimivimmaksi menetelmäksi. Koulutusaineistosta huonojen kuvien poistolla ei saavuteta merkittävää parannusta luokittelutulokseen. This master’s thesis researches the impact neural network parameters and training data quality have on automatic tree species recognition. For this research, a convolutional neural network using images of tree trunks and their metadata is trained to classify samples between four different tree species commonly found in Finnish forests. A private dataset consisting of 23,600 tree trunk images for each tree species is used for training the net and validating the results.
A 72.5 % classification accuracy for the testing dataset is achieved. Increasing the size of the images used by the convolutional neural network as well as the use of metadata are found to increase classification accuracy. For the image preprocessing methods, scaling images to range [0, 1] is found out to be the most effective method. The removal of bad images from the training dataset does not increase the classification accuracy substantially.
Tuloksena saadaan 72,5 % luokittelutarkkuus testiaineistolle. Konvoluutioneuroverkon syötteenä toimivien kuvien koon kasvatus ja metadatan käyttö todetaan luokittelutulosta parantaviksi menetelmiksi. Kuvien esiprosessointimenetelmistä kuvien skaalaaminen välille [0, 1] osoittautuu toimivimmaksi menetelmäksi. Koulutusaineistosta huonojen kuvien poistolla ei saavuteta merkittävää parannusta luokittelutulokseen.
A 72.5 % classification accuracy for the testing dataset is achieved. Increasing the size of the images used by the convolutional neural network as well as the use of metadata are found to increase classification accuracy. For the image preprocessing methods, scaling images to range [0, 1] is found out to be the most effective method. The removal of bad images from the training dataset does not increase the classification accuracy substantially.