Objektintunnistuksen optimointi resurssirajoitteisissa mikrokontrollereissa: TinyML:n ja FOMO-algoritmin hyödyntäminen sulautetuissa sovelluksissa
Piirainen, Jere (2025)
Piirainen, Jere
2025
Tieto- ja sähkötekniikan kandidaattiohjelma - Bachelor's Programme in Computing and Electrical Engineering
Informaatioteknologian ja viestinnän tiedekunta - Faculty of Information Technology and Communication Sciences
Hyväksymispäivämäärä
2025-05-13
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-202505135391
https://urn.fi/URN:NBN:fi:tuni-202505135391
Tiivistelmä
Tässä kandidaatintyössä tutkitaan objektintunnistusmallien optimointia resurssirajoitteisissa mikrokontrolleriympäristöissä hyödyntäen koneoppimismallien suorittamista pienitehoisilla laitteilla (engl. Tiny Machine Learning, TinyML) ja FOMO-algoritmia (faster objects, more objects). Työn tavoitteena on selvittää, kyettäisiinkö kevennettyä objektintunnistusmallia käyttää sulautetuissa sovelluksissa, joissa laitteen suorituskyky, muistikapasiteetti ja energiankulutus ovat tiukasti rajattuja.
Käytännön osuudessa FOMO-malleja koulutettiin Edge Impulse -alustalla käyttäen osajoukkoa PASCAL VOC -kuva-aineistosta, jossa keskityttiin vain autojen tunnistamiseen. Mallin suunnittelussa tutkittiin eri syöteresoluutioita ja skaalausmenetelmiä, ja arvioitiin näiden vaikutuksia tunnistustarkkuuteen. Koulutuksen jälkeen Edge Impulse -alustan työkaluja hyödyntäen arvioitiin mallien suorituskykyä ja resurssivaatimuksia, kuten päättelylatenssia, RAM-muistin (engl. random access memory) käyttöä ja flash-muistin tarvetta, erityisesti STM32U545-sarjan Cortex-M33-mikrokontrolleriprofiilille.
Tuloksissa havaittiin, että 8-bittinen kvantisointi pienensi mallien muistijalanjälkeä merkittävästi ja nopeutti päättelyä jopa kymmenkertaisesti ilman olennaista heikkenemistä tunnistustarkkuudessa. Parhaimman kompromissin konfiguraatiolla (resoluutio 96\,\texttimes\,96, FOMO alpha 0,1, int8) saavutettiin noin 197 ms latenssi (vastaten noin 5 kuvaa sekunnissa 160 MHz kellotaajuudella), RAM-muistin käyttö alle 123,9 kB ja flash-muistitarve noin 77,4 kB, mikä osoittaa mallin soveltuvuuden reaaliaikaisiin mikrokontrollerisovelluksiin. Työ osoittaa, että FOMO-algoritmi yhdistettynä kvantisointiin ja huolelliseen optimointiin tarjoaa käyttökelpoisen ratkaisun objektintunnistukseen reunalaitteilla.
Johtopäätöksenä voidaan todeta, että resurssitehokkaan TinyML-mallin rakentaminen mikrokontrollerille on mahdollista nykyisillä työkaluilla, kunhan mallin konfiguraatiot ja esikäsittelyvaiheet suunnitellaan ympäristön rajoitteet huomioiden. Tulevaisuudessa mielenkiintoisia jatkotutkimusaiheita ovat muun muassa adaptiiviset skaalausmenetelmät ja moniluokkainen tunnistus.
Käytännön osuudessa FOMO-malleja koulutettiin Edge Impulse -alustalla käyttäen osajoukkoa PASCAL VOC -kuva-aineistosta, jossa keskityttiin vain autojen tunnistamiseen. Mallin suunnittelussa tutkittiin eri syöteresoluutioita ja skaalausmenetelmiä, ja arvioitiin näiden vaikutuksia tunnistustarkkuuteen. Koulutuksen jälkeen Edge Impulse -alustan työkaluja hyödyntäen arvioitiin mallien suorituskykyä ja resurssivaatimuksia, kuten päättelylatenssia, RAM-muistin (engl. random access memory) käyttöä ja flash-muistin tarvetta, erityisesti STM32U545-sarjan Cortex-M33-mikrokontrolleriprofiilille.
Tuloksissa havaittiin, että 8-bittinen kvantisointi pienensi mallien muistijalanjälkeä merkittävästi ja nopeutti päättelyä jopa kymmenkertaisesti ilman olennaista heikkenemistä tunnistustarkkuudessa. Parhaimman kompromissin konfiguraatiolla (resoluutio 96\,\texttimes\,96, FOMO alpha 0,1, int8) saavutettiin noin 197 ms latenssi (vastaten noin 5 kuvaa sekunnissa 160 MHz kellotaajuudella), RAM-muistin käyttö alle 123,9 kB ja flash-muistitarve noin 77,4 kB, mikä osoittaa mallin soveltuvuuden reaaliaikaisiin mikrokontrollerisovelluksiin. Työ osoittaa, että FOMO-algoritmi yhdistettynä kvantisointiin ja huolelliseen optimointiin tarjoaa käyttökelpoisen ratkaisun objektintunnistukseen reunalaitteilla.
Johtopäätöksenä voidaan todeta, että resurssitehokkaan TinyML-mallin rakentaminen mikrokontrollerille on mahdollista nykyisillä työkaluilla, kunhan mallin konfiguraatiot ja esikäsittelyvaiheet suunnitellaan ympäristön rajoitteet huomioiden. Tulevaisuudessa mielenkiintoisia jatkotutkimusaiheita ovat muun muassa adaptiiviset skaalausmenetelmät ja moniluokkainen tunnistus.
Kokoelmat
- Kandidaatintutkielmat [10016]