Suurilla kielimalleilla on suuri potentiaali automaattisessa ohjelmakorjauksessa
Gradov, Alexander (2023)
Gradov, Alexander
2023
Tietojenkäsittelytieteiden kandidaattiohjelma - Bachelor's Programme in Computer Sciences
Informaatioteknologian ja viestinnän tiedekunta - Faculty of Information Technology and Communication Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2023-12-22
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-2023122111163
https://urn.fi/URN:NBN:fi:tuni-2023122111163
Tiivistelmä
Automaattinen ohjelmakorjaus (engl. Automatic Program Repair, APR) on tuore teknologia, jonka tarkoituksena on korjata ohjelmavirheitä ilman ihmistä. Vaikka perinteiset APR-työkalut pystyvät jo ratkaisemaan yksinkertaisia virheitä, ne eivät ole puutteidensa vuoksi vielä valmiita yleiskäyttöön. Tälle työlle on asetu kaksi tavoitetta. Ensimmäinen on herättää kiinnostusta uutta ja mielenkiintoista teknologiaa kohtaan. Toinen on vastata tutkimuskysymykseen.
Tämä työ on kirjallisuuskatsaus. Se käsittelee tuoreita aiheeseen liittyviä artikkeleita ja konferenssipapereita, jotka julkaistiin vuosina 2022–2023. Tämä rajoitus tehtiin, jotta voitiin havaita kuinka ChatGPT ja vastaavat teknologiat käsittelevät automaattista virheenkorjausta. Ensin tässä työssä tarkastellaan pinnallisesti, mitä on APR ja mitä haasteita liittyvät perinteisiin APR-työkaluihin. Sitten yritetään vastata tutkimuskysymykseen ja ymmärtää, pystyvätkö kielimallit onnistumaan automaattisessa ohjelmakorjauksessa paremmin kuin olemassa olevat APR-työkalut.
Työ osoittaa, että suurilla kielimalleilla on suuri potentiaali automaattisessa ohjelmakorjauksessa. Kielimallit pystyvät jo nyt korjaamaan virheet paremmin kuin olemassa olevat APR-työkalut. Suuret ja ohjelmointikieliin erikoistuneet kielimallit tuottavat vielä parempia tuloksia. Tällä hetkellä paras työkalu virheiden korjaamiseen on Codex. Se on rakennettu OpenAI:n suurten GPT-kielimallien päälle, kuten myös ChatGPT, ja on erikoistunut ohjelmistokoodin luomiseen. Vaikka Codex on omisteinen ohjelmisto, joka ei ole joustava eikä sovellu yleiseen käyttöön, se on silti hyvä esimerkki siitä, että suuret kielimallit pystyvät korjaamaan koodivirheitä hyvällä tasolla.
Tämä työ on kirjallisuuskatsaus. Se käsittelee tuoreita aiheeseen liittyviä artikkeleita ja konferenssipapereita, jotka julkaistiin vuosina 2022–2023. Tämä rajoitus tehtiin, jotta voitiin havaita kuinka ChatGPT ja vastaavat teknologiat käsittelevät automaattista virheenkorjausta. Ensin tässä työssä tarkastellaan pinnallisesti, mitä on APR ja mitä haasteita liittyvät perinteisiin APR-työkaluihin. Sitten yritetään vastata tutkimuskysymykseen ja ymmärtää, pystyvätkö kielimallit onnistumaan automaattisessa ohjelmakorjauksessa paremmin kuin olemassa olevat APR-työkalut.
Työ osoittaa, että suurilla kielimalleilla on suuri potentiaali automaattisessa ohjelmakorjauksessa. Kielimallit pystyvät jo nyt korjaamaan virheet paremmin kuin olemassa olevat APR-työkalut. Suuret ja ohjelmointikieliin erikoistuneet kielimallit tuottavat vielä parempia tuloksia. Tällä hetkellä paras työkalu virheiden korjaamiseen on Codex. Se on rakennettu OpenAI:n suurten GPT-kielimallien päälle, kuten myös ChatGPT, ja on erikoistunut ohjelmistokoodin luomiseen. Vaikka Codex on omisteinen ohjelmisto, joka ei ole joustava eikä sovellu yleiseen käyttöön, se on silti hyvä esimerkki siitä, että suuret kielimallit pystyvät korjaamaan koodivirheitä hyvällä tasolla.
Kokoelmat
- Kandidaatintutkielmat [8709]