Selitettävän tekoälyn yleisimmät toteutustavat autonomisessa ajamisessa
Rinne, Valtteri (2025)
Rinne, Valtteri
2025
Tieto- ja sähkötekniikan kandidaattiohjelma - Bachelor's Programme in Computing and Electrical Engineering
Informaatioteknologian ja viestinnän tiedekunta - Faculty of Information Technology and Communication Sciences
Hyväksymispäivämäärä
2025-05-16
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-202505165677
https://urn.fi/URN:NBN:fi:tuni-202505165677
Tiivistelmä
Selitettävää tekoälyä tarvitaan kriittisissä sovelluksissa, kuten autonomisessa ajamisessa, selittämään monimutkaisten tekoälyjärjestelmien toimintaa. Selitettävän tekoälyn tehtävänä on tehdä järjestelmistä ihmisille läpinäkyviä, luotettavia, ymmärrettäviä ja turvallisia. Tämä kandidaatintutkielma on toteutettu kirjallisuuskatsauksena, ja sen tavoitteena on esitellä ja havainnollistaa autonomisessa ajamisessa sovellettavien selitettävän tekoälymenetelmien toimintaa. Lisäksi kuvataan menetelmien käytännön sovelluskohteita sekä vertaillaan niitä toisiinsa. Menetelmien toimintaa keskitytään havainnollistamaan teknisestä ja matemaattisesta näkökulmasta. Esiteltävät menetelmät jaetaan mallista riippumattomiin ja mallista riippuviin menetelmiin.
LIME, SHAP, Grad-CAM ja VisualBackProp ovat yleisesti käytettyjä selitettävän tekoälyn menetelmiä autonomisessa ajamisessa. Selitettävyys on toteutettu kuvaamalla niitä piirteitä, jotka vaikuttavat eniten mallien päätöksentekoon. LIME ja SHAP ovat mallista riippumattomia menetelmiä, eli niitä voidaan hyödyntää itseajavan ajoneuvon minkä tahansa tekoälyjärjestelmän selittämisessä. LIME tuottaa lokaaleja selityksiä asettamalla monimutkaisen mallin tutkittavan osan päälle yksinkertaisen, selitettävän mallin. Peliteorian Shapley-arvoihin perustuva SHAP kykenee tuottamaan myös globaaleja selityksiä. Molemmat esitellyt mallista riippumattomat menetelmät tuottavat painokertoimia, joista nähdään tärkeimmät päätöksentekoon vaikuttavat piirteet. Näistä menetelmistä LIME on nopeampi.
Grad-CAM ja VisualBackProp ovat mallista riippuvia ja visuaalisia menetelmiä, joita voidaan hyödyntää itseajavien ajoneuvojen konvoluutioneuroverkkoihin perustuvissa havaitsemisjärjestelmissä. Vastavirta-algoritmia hyödyntämällä ne luovat syötekuvan perusteella tärkeyskartan, johon on korostettu eniten tarkasteltavan mallin päätöksentekoon vaikuttavat syötekuvan alueet. VisualBackProp on tehokas ja reaaliaikainen, koska se takaisinsyöttää pelkkiä arvoja gradienttien sijaan. Grad-CAM on puolestaan hitaampi, sillä se käyttää vastavirta-algoritmille tyypillisesti gradienttien arvoja.
Koska reaaliaikaisuus on autonomisessa ajamisessa tärkeä vaatimus ja esitellyt mallit ovat VisualBackProp poisluettuna verrattain hitaita, työssä esitetään jatkotutkimusehdotus mallien optimoinnille ja uusien menetelmien kehittämiselle. Myös nopeasti kehittyvien suurten kielimallien hyödyntämistä reaaliaikaisiin, luonnollisen kielen selityksiin voitaisiin tutkia lisää.
LIME, SHAP, Grad-CAM ja VisualBackProp ovat yleisesti käytettyjä selitettävän tekoälyn menetelmiä autonomisessa ajamisessa. Selitettävyys on toteutettu kuvaamalla niitä piirteitä, jotka vaikuttavat eniten mallien päätöksentekoon. LIME ja SHAP ovat mallista riippumattomia menetelmiä, eli niitä voidaan hyödyntää itseajavan ajoneuvon minkä tahansa tekoälyjärjestelmän selittämisessä. LIME tuottaa lokaaleja selityksiä asettamalla monimutkaisen mallin tutkittavan osan päälle yksinkertaisen, selitettävän mallin. Peliteorian Shapley-arvoihin perustuva SHAP kykenee tuottamaan myös globaaleja selityksiä. Molemmat esitellyt mallista riippumattomat menetelmät tuottavat painokertoimia, joista nähdään tärkeimmät päätöksentekoon vaikuttavat piirteet. Näistä menetelmistä LIME on nopeampi.
Grad-CAM ja VisualBackProp ovat mallista riippuvia ja visuaalisia menetelmiä, joita voidaan hyödyntää itseajavien ajoneuvojen konvoluutioneuroverkkoihin perustuvissa havaitsemisjärjestelmissä. Vastavirta-algoritmia hyödyntämällä ne luovat syötekuvan perusteella tärkeyskartan, johon on korostettu eniten tarkasteltavan mallin päätöksentekoon vaikuttavat syötekuvan alueet. VisualBackProp on tehokas ja reaaliaikainen, koska se takaisinsyöttää pelkkiä arvoja gradienttien sijaan. Grad-CAM on puolestaan hitaampi, sillä se käyttää vastavirta-algoritmille tyypillisesti gradienttien arvoja.
Koska reaaliaikaisuus on autonomisessa ajamisessa tärkeä vaatimus ja esitellyt mallit ovat VisualBackProp poisluettuna verrattain hitaita, työssä esitetään jatkotutkimusehdotus mallien optimoinnille ja uusien menetelmien kehittämiselle. Myös nopeasti kehittyvien suurten kielimallien hyödyntämistä reaaliaikaisiin, luonnollisen kielen selityksiin voitaisiin tutkia lisää.
Kokoelmat
- Kandidaatintutkielmat [10827]
