reCAPTCHA-järjestelmän ongelmat bottien estokeinona
Viitanen, Lauri (2021)
Viitanen, Lauri
2021
Tietojenkäsittelytieteiden kandidaattiohjelma - Bachelor's Programme in Computer Sciences
Informaatioteknologian ja viestinnän tiedekunta - Faculty of Information Technology and Communication Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2021-01-20
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-202012319238
https://urn.fi/URN:NBN:fi:tuni-202012319238
Tiivistelmä
Verkkobotit, eli itsenäisesti verkossa toimivat tietokoneohjelmat, kattavat suuren osan internetin verkkoliikenteestä. Verkkosivustot sisältävät paljon osa-alueita ja toimintoja, joiden ulkopuolelle verkkobotit halutaan sulkea. ReCAPTCHA-järjestelmä on Googlen kaupallinen toteutus CAPTCHA-testistä (Completely Automated Public Turing test to tell Computers and Humans Apart). Sen keskeisin vaatimus on olla tietokoneohjelmalle mahdoton, mutta ihmiskäyttäjälle mahdollinen ratkaistava.
ReCAPTCHA-järjestelmä perustuu käyttäjän toiminnan ja istuntotietojen perusteella tehtävään riskianalyysiin, jonka perusteella määritetään todennäköisyys sille, että kyseessä on ihmiskäyttäjä. Tässä tutkielmassa esitetään kirjallisuuskatsaus, jonka tarkoituksena on selvittää, pystyykö reCAPTCHA-järjestelmä tunnistamaan ja pysäyttämään verkkobotit pysyen samanaikaisesti ihmiskäyttäjille helppokäyttöisenä.
Tutkielmassa käsitellään CAPTCHA-testin teoriaa ja reCAPTCHA-järjestelmän historiaa vuosina 2003–2014 julkaistujen tutkimusten perusteella. Nykyään käytössä olevien reCAPTCHA-versioiden arviointi perustuu vuosina 2016–2020 julkaistuissa tutkimuksissa tehtyihin havaintoihin. Työssä keskitytään reCAPTCHA-järjestelmän ohjelmallisiin ratkaisujärjestelmiin, ihmisratkaisijoita työllistäviin ratkaisupalveluihin, testien saavutettavuusongelmiin ja riskianalyysijärjestelmän suorittamaan tiedonkeruuseen. Tarkastelussa pääpaino on reCAPTCHA-järjestelmän versiossa 2, sillä sitä uudemmista versioista 3 ja Enterprise ei vielä löydy tutkimusmateriaalia.
Aiheesta tehtyjen tutkimusten pohjalta voidaan todeta, että järjestelmä ei ole täysin varma bottien estokeino. Sen pystyy ohittamaan botit, jotka hyödyntävät kehittyneitä ratkaisujärjestelmiä tai ratkaisupalveluita. Tämän lisäksi reCAPTCHA-järjestelmän testien saavutettavuus ja riskianalyysin eettisyys ovat kyseenalaisia. Huomioitavaa on kuitenkin, että reCAPTCHA-järjestelmä on tietoturvajärjestelmille tyypillisesti jatkuvassa muutoksen tilassa. Turvallisuustasoa ei voida todeta kuin sen tarkasteluhetken osalta, sillä kehittyvät teknologiat saattavat altistaa sen turvallisuusuhille tulevaisuudessa.
ReCAPTCHA-järjestelmä perustuu käyttäjän toiminnan ja istuntotietojen perusteella tehtävään riskianalyysiin, jonka perusteella määritetään todennäköisyys sille, että kyseessä on ihmiskäyttäjä. Tässä tutkielmassa esitetään kirjallisuuskatsaus, jonka tarkoituksena on selvittää, pystyykö reCAPTCHA-järjestelmä tunnistamaan ja pysäyttämään verkkobotit pysyen samanaikaisesti ihmiskäyttäjille helppokäyttöisenä.
Tutkielmassa käsitellään CAPTCHA-testin teoriaa ja reCAPTCHA-järjestelmän historiaa vuosina 2003–2014 julkaistujen tutkimusten perusteella. Nykyään käytössä olevien reCAPTCHA-versioiden arviointi perustuu vuosina 2016–2020 julkaistuissa tutkimuksissa tehtyihin havaintoihin. Työssä keskitytään reCAPTCHA-järjestelmän ohjelmallisiin ratkaisujärjestelmiin, ihmisratkaisijoita työllistäviin ratkaisupalveluihin, testien saavutettavuusongelmiin ja riskianalyysijärjestelmän suorittamaan tiedonkeruuseen. Tarkastelussa pääpaino on reCAPTCHA-järjestelmän versiossa 2, sillä sitä uudemmista versioista 3 ja Enterprise ei vielä löydy tutkimusmateriaalia.
Aiheesta tehtyjen tutkimusten pohjalta voidaan todeta, että järjestelmä ei ole täysin varma bottien estokeino. Sen pystyy ohittamaan botit, jotka hyödyntävät kehittyneitä ratkaisujärjestelmiä tai ratkaisupalveluita. Tämän lisäksi reCAPTCHA-järjestelmän testien saavutettavuus ja riskianalyysin eettisyys ovat kyseenalaisia. Huomioitavaa on kuitenkin, että reCAPTCHA-järjestelmä on tietoturvajärjestelmille tyypillisesti jatkuvassa muutoksen tilassa. Turvallisuustasoa ei voida todeta kuin sen tarkasteluhetken osalta, sillä kehittyvät teknologiat saattavat altistaa sen turvallisuusuhille tulevaisuudessa.
Kokoelmat
- Kandidaatintutkielmat [8907]