Syväoppimissäätimen rakentaminen vaihtoehdoksi PID-säätimelle
Raassina, Teemu (2019)
Raassina, Teemu
2019
Teknis-luonnontieteellinen
Tekniikan ja luonnontieteiden tiedekunta - Faculty of Engineering and Natural Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2019-06-07
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tty-201906111870
https://urn.fi/URN:NBN:fi:tty-201906111870
Tiivistelmä
Työssä rakennetaan syväoppimissäädin vaihtoehdoksi PID-säätimelle harmonisen värähtelijän ohjaukseen. Tutkimuksen innoittaja on Kangbeom Cheonin ja Jaehoon Kimin artikkeli, jossa toteutettiin vastaava tutkimus tasavirtamoottorin ohjaukseen. Tutkimustavoitteena on päästä mahdollisimman lähelle PID-säätimen suorituskykyä. Vastaavanlaisia syväoppimissäätimiä on esiintynyt kirjallisuudessa muutamia.
Syväoppimisen algoritmeilla on muista menetelmistä poikkeava ja omaleimainen tapa löytää luokittelu-, tunnistus- ja ryhmittely ongelmiin ratkaisuja autonomisesti. Tieteenalana syväoppiminen on vielä tuore ja siksi mahdollisuuksia on paljon. Puolestaan PID-säätimen yksinkertainen kolmiosainen rakenne ja tehokas toiminta tekee siitä teollisuudessa luultavasti eniten käytetyn järjestelmien säätimen.
Tutkimuksessa testattiin ensin PID-säätimen suorituskyky harmonisen värähtelijän säätöongelmassa ja sen toiminta taltioitiin syväoppimissäätimen opetusdataksi. Syväoppimissäätimiä rakennettiin kolme, joiden arkkitehtuureina käytettiin MLP-, RNN- ja LSTM-neuroverkkoja. Syväoppimissäätimien neuroverkot esiopetettiin tallennetulla opetusdatalla ja niiden toiminta tarkastettiin oskillaattorin ohjauksessa. Tämän jälkeen säätimet hienosäädettiin dynaamisesti ohjausprosessin ohessa PID-säätimen avulla.
Ohjaustuloksissa syväoppimissäätimet olivat kehityskelpoisia, mutta eivät ratkaisseet säätöongelmaa odotetusti, tai yltäneet lähelle PID-säätimen suorituskykyä. PID-säätimen ohjaama harmoninen värähtelijä ohjautui aina tavoitearvoon y_r, kun taas kohtuullisen suurella virhemarginaalilla MLP-arkkitehtuuria käyttävä syväoppimissäädin onnistui ohjauksessa 60 %, RNN-arkkitehtuurin säädin 34 % ja LSTM-säädin 20 % todennäköisyydellä. Keskimääräinen poikkeama tavoitearvosta (kymmenen ollessa maksimi) oli MLP-säätimelle 0,37, RNN-säätimelle 0,82 ja LSTM-säätimelle 0,92. Syväoppimissäätimien tuottama ohjaussignaali mukaili PID-säätimen ohjaussignaalin suoraviivaisuutta ja syväoppimissäätimien nopeissa asettumisajoissa piilee potentiaalia jatkotutkimukselle.
Jatkotutkimuksessa voitaisiin kokeilla erilaisia neuroverkkoarkkitehtuureja, kuten CNN- tai DBN-verkkoja. Myös kahden eri arkkitehtuurin yhdistäminen hybridiverkoksi on tutkimisen arvoinen. PID-säädintä on myös mahdollista hyödyntää neuroverkkojen opetuksessa ja verkon optimaalisten parametrien löytämisessä. Syväoppimissäätimelle seuraavia mielenkiintoisia tutkimuskohteita voisi olla robottien ohjaus ja ryhmäkäyttäytyminen.
Syväoppimisen algoritmeilla on muista menetelmistä poikkeava ja omaleimainen tapa löytää luokittelu-, tunnistus- ja ryhmittely ongelmiin ratkaisuja autonomisesti. Tieteenalana syväoppiminen on vielä tuore ja siksi mahdollisuuksia on paljon. Puolestaan PID-säätimen yksinkertainen kolmiosainen rakenne ja tehokas toiminta tekee siitä teollisuudessa luultavasti eniten käytetyn järjestelmien säätimen.
Tutkimuksessa testattiin ensin PID-säätimen suorituskyky harmonisen värähtelijän säätöongelmassa ja sen toiminta taltioitiin syväoppimissäätimen opetusdataksi. Syväoppimissäätimiä rakennettiin kolme, joiden arkkitehtuureina käytettiin MLP-, RNN- ja LSTM-neuroverkkoja. Syväoppimissäätimien neuroverkot esiopetettiin tallennetulla opetusdatalla ja niiden toiminta tarkastettiin oskillaattorin ohjauksessa. Tämän jälkeen säätimet hienosäädettiin dynaamisesti ohjausprosessin ohessa PID-säätimen avulla.
Ohjaustuloksissa syväoppimissäätimet olivat kehityskelpoisia, mutta eivät ratkaisseet säätöongelmaa odotetusti, tai yltäneet lähelle PID-säätimen suorituskykyä. PID-säätimen ohjaama harmoninen värähtelijä ohjautui aina tavoitearvoon y_r, kun taas kohtuullisen suurella virhemarginaalilla MLP-arkkitehtuuria käyttävä syväoppimissäädin onnistui ohjauksessa 60 %, RNN-arkkitehtuurin säädin 34 % ja LSTM-säädin 20 % todennäköisyydellä. Keskimääräinen poikkeama tavoitearvosta (kymmenen ollessa maksimi) oli MLP-säätimelle 0,37, RNN-säätimelle 0,82 ja LSTM-säätimelle 0,92. Syväoppimissäätimien tuottama ohjaussignaali mukaili PID-säätimen ohjaussignaalin suoraviivaisuutta ja syväoppimissäätimien nopeissa asettumisajoissa piilee potentiaalia jatkotutkimukselle.
Jatkotutkimuksessa voitaisiin kokeilla erilaisia neuroverkkoarkkitehtuureja, kuten CNN- tai DBN-verkkoja. Myös kahden eri arkkitehtuurin yhdistäminen hybridiverkoksi on tutkimisen arvoinen. PID-säädintä on myös mahdollista hyödyntää neuroverkkojen opetuksessa ja verkon optimaalisten parametrien löytämisessä. Syväoppimissäätimelle seuraavia mielenkiintoisia tutkimuskohteita voisi olla robottien ohjaus ja ryhmäkäyttäytyminen.