Syväoppimisen haasteet : Mitä haasteita syväoppimiseen liittyy tällä hetkellä?
Kaskikallio, Emil (2023)
Kaskikallio, Emil
2023
Tieto- ja sähkötekniikan kandidaattiohjelma - Bachelor's Programme in Computing and Electrical Engineering
Informaatioteknologian ja viestinnän tiedekunta - Faculty of Information Technology and Communication Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2023-05-22
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-202305035076
https://urn.fi/URN:NBN:fi:tuni-202305035076
Tiivistelmä
Syväoppiminen on mahdollistanut monia uuden sukupolven toimintoja kuten kohteiden, kirjoitetun kielen ja puheen tunnistuksen. Nämä toiminnot ovat osaltaan mahdollistaneet älykkäät sovellukset kuten autonomiset ajoneuvot ja teollisuuden automatisoinnin sekä erilaiset tekoälysovellukset kuten IBM Watsonin, Amazon Alexan tai ChatGPTen. Tämän teknologian soveltamiseen liittyy kuitenkin haasteita, joiden ymmärtäminen on tärkeää, kun tätä teknologiaa halutaan kehittää. Luottamusta vaativissa tehtävissä, kuten rahaliikenteessä, ajoneuvoliikenteessä, oikeuskäsittelyssä ja terveydenhuollossa, tekoälyn tekemä päätöksentekoprosessi nousee ensiarvoisen tärkeäksi. Samaan aikaan uusi teknologia altistaa myös uudenlaisille haavoittuvuuksille, joiden löytäminen on myös keskeisessä osassa sen kehitystyötä. Samaan aikaan tämän teknologian tarvitsemat resurssit luovat jo nyt haasteen sen kasvavalle kysynnälle.
Tämä tutkielma tutkii systemaattisen kirjallisuuskatsauksen pohjalta syväoppimista ja sen keskeisiä haasteita ja kehityssuuntia haasteiden ympärillä. Tutkielma tarkastelee ensin syväoppimisen ja tekoälyn yhteyttä sekä syväoppimiseen liittyvää taustateoriaa. Tämä jälkeen tarkastellaan keskeisiä haasteita, jotka voivat rajoittaa syväoppimisen hyödyntämistä erilaisissa sovelluskohteissa. Haasteet, joita tässä tutkielmassa esitellään, ovat neuroverkkojen kouluttamisen vaativuus, unohtaminen jatkuvassa oppimisessa, päätöksenteko, tarvittavat resurssit laitetasolla ja digitaalisesti sekä haavoittuvuudet hyökkäyksille.
Tutkimuksessa ilmeni, että syväoppivien neuroverkkojen kouluttaminen ja ylläpito on teknisesti haastavaa sekä resursseja kuluttavaa. Neuroverkkojen koulutusaineisto voi koostua miljoonista koulutusesimerkeistä ja kouluttamiseen voi kulua päiviä tai viikkoja huolimatta moderneista rinnakkaisista laskentamenetelmistä. Samalla selvisi, että koulutusaineistojen koon esimerkiksi kielimalleille tulisi kasvaa merkittävästi nykyisestä saavuttaakseen ihmisen tasoisen tarkkuuden. Toisaalta ilmeni myös, että neuroverkoilla on haasteita jatkuvassa oppimisessa, mikä osaltaan hankaloittaa niiden jatkuvaa kehittämistä ja ylläpitoa. Potentiaalisena kehityssuuntana laskentatehon haasteisiin löydettiin paremmasta laitteistokiihdytyksestä esimerkiksi kenttäohjelmoitavilla porttimatriiseilla (FPGA). Jatkuvan oppimisen ongelmaan löydettiin tutkimusta erilaisista kaskois- tai kolmoismuistiverkoista ja joustavan oppimisen menetelmistä. Tekoälyn päätöksentekoprosessin ymmärrettävyydessä puolestaan havaittiin haasteita, jotka voivat hankaloittaa tekoälyn hyödyntämistä luottamusta vaativissa tehtävissä. Ilmeni myös, että neuroverkot ovat haavoittuvaisia erilaisille hyökkäyksille. Samalla nousi esiin, että löydettyjä haavoittuvuuksia voidaan kuitenkin hyödyntää neuroverkkojen luotettavuuden testaamiseen. Löydetyt haasteet ovat keskeisiä tekoälyn soveltamisen kannalta ja vaativat lisää tutkimusta monilla eri osa-alueilla.
Tämä tutkielma tutkii systemaattisen kirjallisuuskatsauksen pohjalta syväoppimista ja sen keskeisiä haasteita ja kehityssuuntia haasteiden ympärillä. Tutkielma tarkastelee ensin syväoppimisen ja tekoälyn yhteyttä sekä syväoppimiseen liittyvää taustateoriaa. Tämä jälkeen tarkastellaan keskeisiä haasteita, jotka voivat rajoittaa syväoppimisen hyödyntämistä erilaisissa sovelluskohteissa. Haasteet, joita tässä tutkielmassa esitellään, ovat neuroverkkojen kouluttamisen vaativuus, unohtaminen jatkuvassa oppimisessa, päätöksenteko, tarvittavat resurssit laitetasolla ja digitaalisesti sekä haavoittuvuudet hyökkäyksille.
Tutkimuksessa ilmeni, että syväoppivien neuroverkkojen kouluttaminen ja ylläpito on teknisesti haastavaa sekä resursseja kuluttavaa. Neuroverkkojen koulutusaineisto voi koostua miljoonista koulutusesimerkeistä ja kouluttamiseen voi kulua päiviä tai viikkoja huolimatta moderneista rinnakkaisista laskentamenetelmistä. Samalla selvisi, että koulutusaineistojen koon esimerkiksi kielimalleille tulisi kasvaa merkittävästi nykyisestä saavuttaakseen ihmisen tasoisen tarkkuuden. Toisaalta ilmeni myös, että neuroverkoilla on haasteita jatkuvassa oppimisessa, mikä osaltaan hankaloittaa niiden jatkuvaa kehittämistä ja ylläpitoa. Potentiaalisena kehityssuuntana laskentatehon haasteisiin löydettiin paremmasta laitteistokiihdytyksestä esimerkiksi kenttäohjelmoitavilla porttimatriiseilla (FPGA). Jatkuvan oppimisen ongelmaan löydettiin tutkimusta erilaisista kaskois- tai kolmoismuistiverkoista ja joustavan oppimisen menetelmistä. Tekoälyn päätöksentekoprosessin ymmärrettävyydessä puolestaan havaittiin haasteita, jotka voivat hankaloittaa tekoälyn hyödyntämistä luottamusta vaativissa tehtävissä. Ilmeni myös, että neuroverkot ovat haavoittuvaisia erilaisille hyökkäyksille. Samalla nousi esiin, että löydettyjä haavoittuvuuksia voidaan kuitenkin hyödyntää neuroverkkojen luotettavuuden testaamiseen. Löydetyt haasteet ovat keskeisiä tekoälyn soveltamisen kannalta ja vaativat lisää tutkimusta monilla eri osa-alueilla.
Kokoelmat
- Kandidaatintutkielmat [10827]
