Apatiitin hienovaahdotuksen rikastepitoisuuden estimointi
Räihä, Petri (2023)
Räihä, Petri
2023
Automaatiotekniikan DI-ohjelma - Master's Programme in Automation Engineering
Tekniikan ja luonnontieteiden tiedekunta - Faculty of Engineering and Natural Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2023-11-30
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-202311099542
https://urn.fi/URN:NBN:fi:tuni-202311099542
Tiivistelmä
Työssä tutkitaan dataan perustuvien koneoppivien menetelmien soveltuvuutta apatiitin hienovaahdotusprosessista saatavan rikasteen pitoisuuden mallinnukseen. Tavoite on selvittää erilaisten mallien toimivuutta oikealla prosessista saadulla datalla. Tulevaisuudessa rikastepitoisuuden mallia voidaan mahdollisesti hyödyntää prosessin ohjauksessa ja tästä syystä työssä tutkitaan mallien toimivuutta lyhyellä ja pitkällä aikavälillä, jotta nähdään miten mallit vastaavat nopeisiin muutoksiin ja tapahtuuko niissä pidemmän ajan kuluessa tarkkuuden heikkenemistä.
Todellinen prosessista kerätty data osoittautui haastavaksi ja malleja oli vaikea saada toimimaan. Dataan valittujen muuttujien ja rikastepitoisuuden väliset riippuvuudet eivät kaikki olleet kovin lineaarisia ja datassa oli mukana virheellisiä arvoja. Tutkittavaksi poimittiin iso joukko malleja ja eri mallien lisäksi tutkitaan myös malleja yhdistäviä kaksikerroksisia malleja (Meta-Learner). Työssä tarkasteltavat mallit ovat: ANFIS, Support Vector Machine, NARX, MLP-Neuroverkko, Kernel Regression, Gaussian Process Regression ja lineaarinen regressiomalli. NARX vaikutti tarkkuudeltaan hyvälle, mutta minuuttitasolla tutkittuna se ei toiminut hyvin. NARX-malli käyttää vanhaa laboratoriossa analysoitua rikastepitoisuuden arvoa ja laboratorioanalyysin tulos oli liian dominoiva. NARX mallin ulostulo muuttui vain laboratorioanalyysitulosten mukana. Kaksikerroksinen malli, jossa NARX on mukana yhtenä sisääntulona toimi kompromissina, jossa tarkkuus oli kohtalaisen hyvä ja malli vaikutti reagoivan muutoksiin prosessissa myös laboratorio-analyysitulosten välissä.
Pitkällä aikavälillä mallit vaikuttivat toimivan kohtalaisen hyvin, vaikka mallien opettamisesta kuluu aikaa. Dataa oli käytössä vuoden ajalta ja sillä aikajaksolla mallien tarkkuus ei merkittävästi huonontunut. Työssä testattiin kuitenkin myös, miten mallit toimivat, jos ne opetetaan vuoden aikana uudelleen säännöllisesti. Uudelleenopettamisella ei saatu tarkkuutta paranemaan ja paras vaihtoehto vaikutti olevan harkitusti suoritettava manuaalinen opettaminen.
Mallinnusta varten ei ollut selkeää tietoa mitä muuttujia tulisi malleissa käyttää. Mallien vertailun lisäksi vertailtavana on myös laskennallisia muuttujien valintamenetelmiä. Muuttujien valintamenetelmiä on mukana kolme: F-testi, MRMR ja RRelief. Vertailussa tutkittiin myös, miten hyvin mallit toimivat laskennallisilla pääkomponenttianalyysillä (PCA) lasketuilla muuttujilla. Parhaaseen mallinnustulokseen päästiin muuttujajoukolla, johon oli valittu F-testillä parhaat pisteet saaneet muuttujat.
Mallien vertailun ja lyhyen aikavälin tarkastelujen perusteella kaksikerroksisella mallirakenteella saatiin paras lopputulos. Käytännössä kaksikerroksinen malli on ohjelmallisesti raskas ja haastava toteuttaa. Erityisesti mallin opettaminen ja optimointi on haastavaa, koska yksittäisiä malleja on opetettavana monta ja muutokset pohjamalleissa vaikuttavat toisen kerroksen mallin käyttäytymiseen. Työn perusteella kaksikerroksinen malli voi kuitenkin auttaa tilanteessa, jossa mikään malli ei yksinään tuota riittävän hyvää tulosta.
Todellinen prosessista kerätty data osoittautui haastavaksi ja malleja oli vaikea saada toimimaan. Dataan valittujen muuttujien ja rikastepitoisuuden väliset riippuvuudet eivät kaikki olleet kovin lineaarisia ja datassa oli mukana virheellisiä arvoja. Tutkittavaksi poimittiin iso joukko malleja ja eri mallien lisäksi tutkitaan myös malleja yhdistäviä kaksikerroksisia malleja (Meta-Learner). Työssä tarkasteltavat mallit ovat: ANFIS, Support Vector Machine, NARX, MLP-Neuroverkko, Kernel Regression, Gaussian Process Regression ja lineaarinen regressiomalli. NARX vaikutti tarkkuudeltaan hyvälle, mutta minuuttitasolla tutkittuna se ei toiminut hyvin. NARX-malli käyttää vanhaa laboratoriossa analysoitua rikastepitoisuuden arvoa ja laboratorioanalyysin tulos oli liian dominoiva. NARX mallin ulostulo muuttui vain laboratorioanalyysitulosten mukana. Kaksikerroksinen malli, jossa NARX on mukana yhtenä sisääntulona toimi kompromissina, jossa tarkkuus oli kohtalaisen hyvä ja malli vaikutti reagoivan muutoksiin prosessissa myös laboratorio-analyysitulosten välissä.
Pitkällä aikavälillä mallit vaikuttivat toimivan kohtalaisen hyvin, vaikka mallien opettamisesta kuluu aikaa. Dataa oli käytössä vuoden ajalta ja sillä aikajaksolla mallien tarkkuus ei merkittävästi huonontunut. Työssä testattiin kuitenkin myös, miten mallit toimivat, jos ne opetetaan vuoden aikana uudelleen säännöllisesti. Uudelleenopettamisella ei saatu tarkkuutta paranemaan ja paras vaihtoehto vaikutti olevan harkitusti suoritettava manuaalinen opettaminen.
Mallinnusta varten ei ollut selkeää tietoa mitä muuttujia tulisi malleissa käyttää. Mallien vertailun lisäksi vertailtavana on myös laskennallisia muuttujien valintamenetelmiä. Muuttujien valintamenetelmiä on mukana kolme: F-testi, MRMR ja RRelief. Vertailussa tutkittiin myös, miten hyvin mallit toimivat laskennallisilla pääkomponenttianalyysillä (PCA) lasketuilla muuttujilla. Parhaaseen mallinnustulokseen päästiin muuttujajoukolla, johon oli valittu F-testillä parhaat pisteet saaneet muuttujat.
Mallien vertailun ja lyhyen aikavälin tarkastelujen perusteella kaksikerroksisella mallirakenteella saatiin paras lopputulos. Käytännössä kaksikerroksinen malli on ohjelmallisesti raskas ja haastava toteuttaa. Erityisesti mallin opettaminen ja optimointi on haastavaa, koska yksittäisiä malleja on opetettavana monta ja muutokset pohjamalleissa vaikuttavat toisen kerroksen mallin käyttäytymiseen. Työn perusteella kaksikerroksinen malli voi kuitenkin auttaa tilanteessa, jossa mikään malli ei yksinään tuota riittävän hyvää tulosta.