Aurinkoenergiajärjestelmän tehon mallintaminen: Fysikaalisten ja koneoppimispohjaisten tehomallien vertailu
Anttalainen, Väinö (2025)
Anttalainen, Väinö
2025
Teknis-luonnontieteellinen DI-ohjelma - Master's Programme in Science and Engineering
Tekniikan ja luonnontieteiden tiedekunta - Faculty of Engineering and Natural Sciences
Hyväksymispäivämäärä
2025-03-26
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-202503263035
https://urn.fi/URN:NBN:fi:tuni-202503263035
Tiivistelmä
Joissain maissa aurinkoenergia on jo valtavirtaa, kun taas jossain maissa, kuten Suomessa, aurinkoenergia on vasta nousemassa aurinkovoimateknologian kehittyessä ja halventuessa. Jotta aurinkovoimalat toimisivat odotetusti, niiden tehon tuotantoa on tärkeää monitoroida vertaamalla todellista tehon tuotantoa mallinnettuun tehon tuotantoon. Koska yleisesti käytettyjen fysikaalisten tehomallien on näytetty antavan Suomen oloissa virheellisiä tuloksia esimerkiksi lumipeitteen ja alhaisen auringon säteilyn vuoksi erityisesti talvisin, työssä kokeillaan myös monimutkaisempia koneoppimispohjaisia tehomalleja. Aineistoa on viidestä aurinkoenergiajärjestelmästä neljästä eri sijainnista (Helsingistä, Turusta, Kuopiosta ja Sodankylästä).
Tämän työn tavoitteena on tarkastella tehomallien virhettä hetkittäisessä tehon tuotannossa sekä energian tuotannon virhettä kuukausi- ja vuositasolla. Lisäksi työssä pyritään selvittämään, pystytäänkö koneoppimismalleilla mallintamaan tehoa tarkemmin kuin fysikaalisilla malleilla. Työssä tarkastellaan kolmea fysikaalista mallia ja kahta koneoppimismallia.
Jotkin fysikaaliset mallit voidaan optimoida tiettyyn aurinkovoimajärjestelmään sopivaksi mikäli aiempaa aineistoa järjestelmästä on saatavilla. Tällaisia malleja kutsutaan tässä työssä täsmäkoulututetuiksi malleiksi. Jos aiempaa aineistoa ei ole saatavilla, on tehon mallintamiseen käytettävä yleisempiä fysikaalisia malleja, joita ei ole optimoitu kyseiseen järjestelmään. Tällaisia malleja kutsutaan tässä työssä yleisiksi malleiksi.
Tulosten perusteella yleiset fysikaaliset mallit näyttäisivät mallintavan tehon systemaattisesti liian suureksi, mikä kasvattaa virheitä myös energian tuotannon mallintamisessa. Käytettyjen virhetermien mukaan yleiset koneoppimismallit mallintavat tehoa tarkemmin kuin yleiset fysikaaliset mallit. Yleisillä koneoppimismalleilla ei ole samanlaista taipumusta mallintaa tehoa aina liian suureksi, mutta koneoppimismallit näyttäisivät mallintavan alhaiset tehon arvot liian suuriksi ja suuret tehon arvot liian alhaisiksi. Koska osa virheistä kumoutuu, on kuukausittaiset ja vuosittaiset energian tuotannon mallintamisen virheet fysikaalisia malleja pienempiä.
Täsmäkoulutus näyttäisi parantavan fysikaalisten ja koneoppimismallien tarkkuuksia ja vähentävän virheitä sekä tehon että energian tuotannon mallintamisessa. Täsmäkoulutuksen jälkeen toinen koneoppimismalleista antoi kaikista malleista pienimmät virhetermit, mutta tämän mallin kuukausittaiset ja vuosittaiset energian tuotannon mallinnuksen virheet yllättävästi kasvoivat pienentymisen sijaan.
Vaikka koneoppimismallit näyttäisivät virhetermien ja energian tuotannon virheiden perusteella toimivan fysikaalisia malleja paremmin, ei mallien tarkkuuksien ero vaikuta olevan kovin suuri. Suurimmat erot fysikaalisten ja koneoppimismallien välillä näyttäisivät olevan mallien monimutkaisuudessa ja siinä, millainen systemaattinen taipumus yleisillä malleilla on tehon mallintamisessa. Koska koneoppimismallit tarvitsevat havaintoja useammasta muuttujasta toimiakseen, voi niiden käyttö olla hankalampaa etenkin pienemmillä aurinkoenergiajärjestelmillä, joissa on vähemmän mittalaitteita. Koneoppimismallien käyttö voi olla kuitenkin hyödyllistä esimerkiksi kaupallisilla aurinkovoimajärjestelmillä, joissa halutaan monitoroida tehoa mahdollisimman tarkasti tehomallin monimutkaisuudesta huolimatta. In some countries solar energy is already mainstream while in others, like Finland, it is gaining popularity due to advancements and decreasing costs in solar energy technologies. To ensure that the solar power plants operate as expected, it is essential to monitor them by comparing the expected power production to the actual power production. Because commonly used power models have been shown to produce erroneous results in Finland, more complex machine learning models are also implemented in this thesis. The data used is from five different power plants across four locations: Helsinki, Turku, Kuopio, and Sodankylä.
The aim of this thesis is to study the errors that the models produce when modelling the instantaneous power productions, as well as the monthly and yearly energy yields. In addition, machine learning models are compared to physical models to determine if the added complexities of machine learning result in more accurate estimates. The comparison includes three physical models and two machine learning models. Some physical models can be optimized for a specific power system if data is available from that system. These models are referred to as fitted models. If previous data is not available, the models can’t be optimized to the system. These models are referred as general models.
Results indicate that the general physical models systematically overestimate produced power, leading to increased errors in estimated energy yields. Based on the used error terms, general machine learning models predict power more accurately than general physical models. Machine learning models tend to overestimate low power values and underestimate high power values, causing some errors to cancel each other out and resulting in lower errors in estimated energy yields compared to physical models.
Fitted models seem to be more accurate than general models, which is expected. One machine learning model outperformed all fitted models based on the error terms used. However, errors in monthly and yearly energy yield estimations increased unexpectedly.
Although machine learning models appear to model power more accurately than physical models, whether fitted or general, the differences are small. The biggest differences between physical and machine learning models seem to be the complexities of the models and the systematic tendencies of general models. Because machine learning models require observations from more variables than physical models, their use can be more challenging, especially for smaller power plants with fewer measuring tools. However, the slight accuracy gains can be beneficial for larger commercial power plants despite the added model complexity.
Tämän työn tavoitteena on tarkastella tehomallien virhettä hetkittäisessä tehon tuotannossa sekä energian tuotannon virhettä kuukausi- ja vuositasolla. Lisäksi työssä pyritään selvittämään, pystytäänkö koneoppimismalleilla mallintamaan tehoa tarkemmin kuin fysikaalisilla malleilla. Työssä tarkastellaan kolmea fysikaalista mallia ja kahta koneoppimismallia.
Jotkin fysikaaliset mallit voidaan optimoida tiettyyn aurinkovoimajärjestelmään sopivaksi mikäli aiempaa aineistoa järjestelmästä on saatavilla. Tällaisia malleja kutsutaan tässä työssä täsmäkoulututetuiksi malleiksi. Jos aiempaa aineistoa ei ole saatavilla, on tehon mallintamiseen käytettävä yleisempiä fysikaalisia malleja, joita ei ole optimoitu kyseiseen järjestelmään. Tällaisia malleja kutsutaan tässä työssä yleisiksi malleiksi.
Tulosten perusteella yleiset fysikaaliset mallit näyttäisivät mallintavan tehon systemaattisesti liian suureksi, mikä kasvattaa virheitä myös energian tuotannon mallintamisessa. Käytettyjen virhetermien mukaan yleiset koneoppimismallit mallintavat tehoa tarkemmin kuin yleiset fysikaaliset mallit. Yleisillä koneoppimismalleilla ei ole samanlaista taipumusta mallintaa tehoa aina liian suureksi, mutta koneoppimismallit näyttäisivät mallintavan alhaiset tehon arvot liian suuriksi ja suuret tehon arvot liian alhaisiksi. Koska osa virheistä kumoutuu, on kuukausittaiset ja vuosittaiset energian tuotannon mallintamisen virheet fysikaalisia malleja pienempiä.
Täsmäkoulutus näyttäisi parantavan fysikaalisten ja koneoppimismallien tarkkuuksia ja vähentävän virheitä sekä tehon että energian tuotannon mallintamisessa. Täsmäkoulutuksen jälkeen toinen koneoppimismalleista antoi kaikista malleista pienimmät virhetermit, mutta tämän mallin kuukausittaiset ja vuosittaiset energian tuotannon mallinnuksen virheet yllättävästi kasvoivat pienentymisen sijaan.
Vaikka koneoppimismallit näyttäisivät virhetermien ja energian tuotannon virheiden perusteella toimivan fysikaalisia malleja paremmin, ei mallien tarkkuuksien ero vaikuta olevan kovin suuri. Suurimmat erot fysikaalisten ja koneoppimismallien välillä näyttäisivät olevan mallien monimutkaisuudessa ja siinä, millainen systemaattinen taipumus yleisillä malleilla on tehon mallintamisessa. Koska koneoppimismallit tarvitsevat havaintoja useammasta muuttujasta toimiakseen, voi niiden käyttö olla hankalampaa etenkin pienemmillä aurinkoenergiajärjestelmillä, joissa on vähemmän mittalaitteita. Koneoppimismallien käyttö voi olla kuitenkin hyödyllistä esimerkiksi kaupallisilla aurinkovoimajärjestelmillä, joissa halutaan monitoroida tehoa mahdollisimman tarkasti tehomallin monimutkaisuudesta huolimatta.
The aim of this thesis is to study the errors that the models produce when modelling the instantaneous power productions, as well as the monthly and yearly energy yields. In addition, machine learning models are compared to physical models to determine if the added complexities of machine learning result in more accurate estimates. The comparison includes three physical models and two machine learning models. Some physical models can be optimized for a specific power system if data is available from that system. These models are referred to as fitted models. If previous data is not available, the models can’t be optimized to the system. These models are referred as general models.
Results indicate that the general physical models systematically overestimate produced power, leading to increased errors in estimated energy yields. Based on the used error terms, general machine learning models predict power more accurately than general physical models. Machine learning models tend to overestimate low power values and underestimate high power values, causing some errors to cancel each other out and resulting in lower errors in estimated energy yields compared to physical models.
Fitted models seem to be more accurate than general models, which is expected. One machine learning model outperformed all fitted models based on the error terms used. However, errors in monthly and yearly energy yield estimations increased unexpectedly.
Although machine learning models appear to model power more accurately than physical models, whether fitted or general, the differences are small. The biggest differences between physical and machine learning models seem to be the complexities of the models and the systematic tendencies of general models. Because machine learning models require observations from more variables than physical models, their use can be more challenging, especially for smaller power plants with fewer measuring tools. However, the slight accuracy gains can be beneficial for larger commercial power plants despite the added model complexity.