RAG-järjestelmien ajallisen yhteneväisyyden ja tietokonfliktien haasteet
Niemelä, Eetu (2025)
Niemelä, Eetu
2025
Tieto- ja sähkötekniikan kandidaattiohjelma - Bachelor's Programme in Computing and Electrical Engineering
Informaatioteknologian ja viestinnän tiedekunta - Faculty of Information Technology and Communication Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2025-06-02
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-202505286340
https://urn.fi/URN:NBN:fi:tuni-202505286340
Tiivistelmä
Tämä kandidaatintutkielma tarkastelee RAG-järjestelmien kohtaamia ajallisia haasteita ja tietokonflikteja, jotka vaikuttavat näiden järjestelmien luotettavuuteen ja käytettävyyteen. Hakutehostettua generaatiota käyttävät järjestelmät (Retrieval-Augmented Generation, RAG) ovat nousseet keskeiseksi menetelmäksi modernien tekoälyratkaisujen kehittämisessä, yhdistäen suurten kielimallien generointikyvyt ulkoiseen tiedonhakuun.
Tutkielmassa kartoitetaan kirjallisuuskatsauksen menetelmin RAG-järjestelmissä ilmeneviä tietokonfliktityyppejä: konteksti-muistikonflikteja, kontekstin välisiä konflikteja ja muistin välisiä konflikteja. Lisäksi analysoidaan ajallisia haasteita, kuten ajallista sovitusvirhettä, tietolähteiden epätasapainoa ja huomiovinoumaa aikariippuvaisissa kyselyissä. Erityisesti dynaamiset, nopeasti muuttuvat faktat ovat osoittautuneet haasteellisiksi RAG-järjestelmille.
Tutkielmassa esitellään ja vertaillaan teknisiä ratkaisumenetelmiä, kuten FLARE, Iter-RetGen, CD2 ja kontrastiivinen oppiminen, sekä tarkastellaan niiden vahvuuksia ja heikkouksia eri käyttötilanteissa. Kontrastiivinen oppiminen on osoittautunut erityisen tehokkaaksi aikariippuvaisten kyselyjen käsittelyssä, kun taas CD2-menetelmä tarjoaa ratkaisuja kielimallien harhojen vähentämiseen. Tutkimuksen perusteella optimaalinen ratkaisu RAG-järjestelmien ajallisiin haasteisiin saattaa löytyä eri lähestymistapojen vahvuuksien yhdistämisestä. Jatkotutkimuksissa voisi keskittyä kehittämään hybridimenetelmiä, jotka yhdistävät aikamääritteiden tarkan tunnistamisen ja luotettavan päätöksenteon ristiriitaisissa tilanteissa
Tutkielmassa kartoitetaan kirjallisuuskatsauksen menetelmin RAG-järjestelmissä ilmeneviä tietokonfliktityyppejä: konteksti-muistikonflikteja, kontekstin välisiä konflikteja ja muistin välisiä konflikteja. Lisäksi analysoidaan ajallisia haasteita, kuten ajallista sovitusvirhettä, tietolähteiden epätasapainoa ja huomiovinoumaa aikariippuvaisissa kyselyissä. Erityisesti dynaamiset, nopeasti muuttuvat faktat ovat osoittautuneet haasteellisiksi RAG-järjestelmille.
Tutkielmassa esitellään ja vertaillaan teknisiä ratkaisumenetelmiä, kuten FLARE, Iter-RetGen, CD2 ja kontrastiivinen oppiminen, sekä tarkastellaan niiden vahvuuksia ja heikkouksia eri käyttötilanteissa. Kontrastiivinen oppiminen on osoittautunut erityisen tehokkaaksi aikariippuvaisten kyselyjen käsittelyssä, kun taas CD2-menetelmä tarjoaa ratkaisuja kielimallien harhojen vähentämiseen. Tutkimuksen perusteella optimaalinen ratkaisu RAG-järjestelmien ajallisiin haasteisiin saattaa löytyä eri lähestymistapojen vahvuuksien yhdistämisestä. Jatkotutkimuksissa voisi keskittyä kehittämään hybridimenetelmiä, jotka yhdistävät aikamääritteiden tarkan tunnistamisen ja luotettavan päätöksenteon ristiriitaisissa tilanteissa
Kokoelmat
- Kandidaatintutkielmat [10645]
