Tekoälyn ja multimodaalisuuden hyödyntäminen hakukoneissa
Liukkonen, Veikka (2024)
Liukkonen, Veikka
2024
Tieto- ja sähkötekniikan kandidaattiohjelma - Bachelor's Programme in Computing and Electrical Engineering
Informaatioteknologian ja viestinnän tiedekunta - Faculty of Information Technology and Communication Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2024-06-10
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-202405306525
https://urn.fi/URN:NBN:fi:tuni-202405306525
Tiivistelmä
Tekoäly on kehittynyt viime vuosina nopeasti ja suuriin kielimalleihin (engl. Large Language Model, LLM) perustuvia keskustelubotteja käytetään monipuolisesti. Suosituimmat hakukoneet eivät ole kuitenkaan juuri kehittyneet ulkoisesti viime vuosikymmenen aikana. Multimodaalisuudella tarkoitetaan eri moodien yhdistämistä. Erilaisia moodeja ovat esimerkiksi ääni, kuva ja teksti. Tämän työn tavoitteena on tutkia, miten tekoälyä ja multimodaalisuutta voidaan hyödyntää hakukoneissa. Multimodaalisuutta tarkastellaan tässä suhteessa tekoälyyn. Tarkastelun kohteena on siis se, miten hakukoneiden multimodaalisia ominaisuuksia voidaan kehittää tekoälyn avulla.
Suuret kielimallit ovat edistyneitä tekoälymalleja, jotka kykenevät käsittelemään luonnollista kieltä. Niiden luotettavuudessa on kuitenkin merkittäviä ongelmia. Kielimallit voivat viitata olemattomiin lähteisiin tai antaa epäolennaisia tuloksia. Suurten kielimallien toiminta ei ole myöskään läpinäkyvää, joten mahdollisia vinoumia niiden päätöksenteossa on vaikea havaita. Suurten kielimallien ongelmat johtuvat muun muassa koulutusdatan vinoumista ja aihepiiristä riippuen ylisovittumisesta, joka johtuu parametrien liiallisesta määrästä suhteessa koulutusdataan. Voidaan siis todeta, että yleisimmät, ChatGPT:n kaltaiset, suuriin kielimalleihin perustuvat keskustelubotit eivät ole luotettavia lähteitä tiedonhaussa.
Erilaisia tekoälysovelluksia käytetään yleisesti hakukoneissa. Erityisesti akateemisissa hakukoneissa on pyritty hyödyntämään suuria kielimalleja tiedonhaun helpottamiseen. Suurten kielimallien ongelmat ilmenevät siten myös tekoälyä hyödyntävissä hakukoneissa. Multimodaalisuuden mahdollisuuksia ei ole vielä hyödynnetty laajasti hakukoneissa. Hakutuloksissa eli hakukoneiden tulosteissa esiintyy useita eri moodeja, mutta syötteissä moodien yhdistäminen on vielä rajallista. Suuret kielimallit pystyvät käsittelemään tekstin lisäksi myös visuaalisia syötteitä, joten tekoäly voisi mahdollistaa edistyneempien multimodaalisten ominaisuuksien käytön hakukoneissa.
Tekoäly luo uusia mahdollisuuksia sille, mitä hakukoneet voivat tarjota, mutta sen ongelmia ei voi jättää huomiotta. Oikein toteutettuna tekoäly mahdollistaa hakukoneiden nykyistä monipuolisemmat syötteet ja osuvammat tulokset. Erityisesti suurilla kielimalleilla voitaisiin kehittää hakukoneita nykyisestään helpottamalla käyttäjän ja hakukoneen välistä kommunikaatiota esimerkiksi mahdollistamalla luonnollisen kielen käytön syötteessä.
Suuret kielimallit ovat edistyneitä tekoälymalleja, jotka kykenevät käsittelemään luonnollista kieltä. Niiden luotettavuudessa on kuitenkin merkittäviä ongelmia. Kielimallit voivat viitata olemattomiin lähteisiin tai antaa epäolennaisia tuloksia. Suurten kielimallien toiminta ei ole myöskään läpinäkyvää, joten mahdollisia vinoumia niiden päätöksenteossa on vaikea havaita. Suurten kielimallien ongelmat johtuvat muun muassa koulutusdatan vinoumista ja aihepiiristä riippuen ylisovittumisesta, joka johtuu parametrien liiallisesta määrästä suhteessa koulutusdataan. Voidaan siis todeta, että yleisimmät, ChatGPT:n kaltaiset, suuriin kielimalleihin perustuvat keskustelubotit eivät ole luotettavia lähteitä tiedonhaussa.
Erilaisia tekoälysovelluksia käytetään yleisesti hakukoneissa. Erityisesti akateemisissa hakukoneissa on pyritty hyödyntämään suuria kielimalleja tiedonhaun helpottamiseen. Suurten kielimallien ongelmat ilmenevät siten myös tekoälyä hyödyntävissä hakukoneissa. Multimodaalisuuden mahdollisuuksia ei ole vielä hyödynnetty laajasti hakukoneissa. Hakutuloksissa eli hakukoneiden tulosteissa esiintyy useita eri moodeja, mutta syötteissä moodien yhdistäminen on vielä rajallista. Suuret kielimallit pystyvät käsittelemään tekstin lisäksi myös visuaalisia syötteitä, joten tekoäly voisi mahdollistaa edistyneempien multimodaalisten ominaisuuksien käytön hakukoneissa.
Tekoäly luo uusia mahdollisuuksia sille, mitä hakukoneet voivat tarjota, mutta sen ongelmia ei voi jättää huomiotta. Oikein toteutettuna tekoäly mahdollistaa hakukoneiden nykyistä monipuolisemmat syötteet ja osuvammat tulokset. Erityisesti suurilla kielimalleilla voitaisiin kehittää hakukoneita nykyisestään helpottamalla käyttäjän ja hakukoneen välistä kommunikaatiota esimerkiksi mahdollistamalla luonnollisen kielen käytön syötteessä.
Kokoelmat
- Kandidaatintutkielmat [8918]