Kehoteinjektio ja suojautumismenetelmät LLM-pohjaisissa sovelluksissa
Rinne, Onni (2025)
Rinne, Onni
2025
Tieto- ja sähkötekniikan kandidaattiohjelma - Bachelor's Programme in Computing and Electrical Engineering
Informaatioteknologian ja viestinnän tiedekunta - Faculty of Information Technology and Communication Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2025-05-13
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-202505115272
https://urn.fi/URN:NBN:fi:tuni-202505115272
Tiivistelmä
Suurten kielimallien teknologisen kehityksen myötä kielimalleja on alettu integroimaan osaksi erilaisia käyttötarkoituksia omaavia sovelluksia. Sovellusten monimutkainen rakenne ja uusi rajapinta kielimallin ja sovelluksen välillä lisäävät turvallisuusriskejä. Uusi, kielimallien mahdollistama hyökkäysmuoto on kehoteinjektio, jossa käytetään hyväksi kielimallin kykyä noudattaa luonnollisen kielen muodossa olevia ohjeita. Tutkielman tavoitteena on esitellä erilaisia kehoteinjektiota ja kehoteinjektioita vastaan kehitettyjä jo olemassa olevia suojautumismenetelmiä, mutta myös kirjallisuudessa ehdotettuja potentiaalisia ratkaisuja. Tutkielma keskittyy LLM-pohjaisten sovellusten kehoteinjektioon ja suojautumismenetelmiin ongelmanratkaisun näkökulmasta.
Tutkielma on kirjallisuuskatsaus, jonka lähteet ovat tuoreita ja tieteellisiä julkaisuja vuosilta 2022–2024. Lähteet valittiin mukaan tutkielmaan tuoreuden ja tutkielmaan vahvasti liittyvän sisällön perusteella. Suurin osa lähteistä on vertaisarvioituja, mutta mukana on myös vertaisarvioimattomia tieteellisiä julkaisuja, sillä osa lähteistä on todella uusia ja siten myös ajankohtaisia. Lähteet kerättiin hyödyntäen Google Scholar -palvelua ja Tampereen yliopiston Andor -palvelua.
Tutkielmassa esitellään LLM-pohjaisia sovelluksia vastaan käytettäviä keskeisiä kehoteinjektioiden tyyppejä ja luokitellaan hyökkäykset tavoitteen mukaan kehotevuotohyökkäyksiin ja tavoitteen kaappaushyökkäyksiin, sekä hyökkäyksen toteutusmenetelmän mukaan suoriin ja epäsuoriin hyökkäyksiin. Tutkielmassa selvisi, että yleisen tason suojautumismenetelmiä ovat kehotteen ja vastauksen puhdistus, kyselyn parametrisointi ja erillisen kehoteinjektioita valvovan kielimallin käyttö. Kirjallisuudesta löydettiin myös ratkaisuehdotuksia, joista ensimmäinen keskittyy tehtäväkohtaiseen hienosäätöön ja alemman tason malliin, jolla ei ole kykyä seurata ohjeita. Kaksi muuta ehdotusta liittyvät jokseenkin kyselyn parametrisointiin, ja ne pohjautuvat kehotteen sisältämien luotettavien ohjeiden allekirjoittamiseen. Lisäksi tutkielmassa selvisi, etteivät nykyiset suojautumismenetelmät ole riittäviä, vaan LLM-pohjaiset sovellukset ovat vieläkin haavoittuvia kehoteinjektioita vastaan. Huomattiin kuitenkin, että tietyt ratkaisut torjuvat melko tehokkaasti tiettyjä kehoteinjektioiden muotoja, ja ratkaisuja yhdistelemällä voitaisiin saavuttaa tehokas suoja kehoteinjektioita vastaan.
Tutkielma on kirjallisuuskatsaus, jonka lähteet ovat tuoreita ja tieteellisiä julkaisuja vuosilta 2022–2024. Lähteet valittiin mukaan tutkielmaan tuoreuden ja tutkielmaan vahvasti liittyvän sisällön perusteella. Suurin osa lähteistä on vertaisarvioituja, mutta mukana on myös vertaisarvioimattomia tieteellisiä julkaisuja, sillä osa lähteistä on todella uusia ja siten myös ajankohtaisia. Lähteet kerättiin hyödyntäen Google Scholar -palvelua ja Tampereen yliopiston Andor -palvelua.
Tutkielmassa esitellään LLM-pohjaisia sovelluksia vastaan käytettäviä keskeisiä kehoteinjektioiden tyyppejä ja luokitellaan hyökkäykset tavoitteen mukaan kehotevuotohyökkäyksiin ja tavoitteen kaappaushyökkäyksiin, sekä hyökkäyksen toteutusmenetelmän mukaan suoriin ja epäsuoriin hyökkäyksiin. Tutkielmassa selvisi, että yleisen tason suojautumismenetelmiä ovat kehotteen ja vastauksen puhdistus, kyselyn parametrisointi ja erillisen kehoteinjektioita valvovan kielimallin käyttö. Kirjallisuudesta löydettiin myös ratkaisuehdotuksia, joista ensimmäinen keskittyy tehtäväkohtaiseen hienosäätöön ja alemman tason malliin, jolla ei ole kykyä seurata ohjeita. Kaksi muuta ehdotusta liittyvät jokseenkin kyselyn parametrisointiin, ja ne pohjautuvat kehotteen sisältämien luotettavien ohjeiden allekirjoittamiseen. Lisäksi tutkielmassa selvisi, etteivät nykyiset suojautumismenetelmät ole riittäviä, vaan LLM-pohjaiset sovellukset ovat vieläkin haavoittuvia kehoteinjektioita vastaan. Huomattiin kuitenkin, että tietyt ratkaisut torjuvat melko tehokkaasti tiettyjä kehoteinjektioiden muotoja, ja ratkaisuja yhdistelemällä voitaisiin saavuttaa tehokas suoja kehoteinjektioita vastaan.
Kokoelmat
- Kandidaatintutkielmat [10645]
