Menetelmä Magic: The Gathering -korttien tunnistamiseen kuvista
Hursti, Lauri (2020)
Hursti, Lauri
2020
Tietojenkäsittelyopin maisteriohjelma - Master's Programme in Computer Science
Informaatioteknologian ja viestinnän tiedekunta - Faculty of Information Technology and Communication Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2020-07-21
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-202007066339
https://urn.fi/URN:NBN:fi:tuni-202007066339
Tiivistelmä
Tutkielmassa kuvataan menetelmä, jolla voidaan tunnistaa monta päällekkäistä Magic: The Gathering -korttia yhdestä valokuvasta. Menetelmä täydentää olemassa olevia kortintunnistusohjelmia ja pystyy käsittelemään hyvin luonnollisten kuvien tavanomaisia vaihteluita ja häiriöitä. Aiemmista ratkaisuista poiketen kortit tunnistetaan lukemalla niiden nimet.
Menetelmä ensin paikantaa korttien nimet ja tämän jälkeen tunnistaa ne. Paikantamiseen käytetään algoritmia, joka etsii kuvasta tekstin osilta näyttäviä yhdistettyjä komponentteja. Löydetyt yhdistetyt komponentit edelleen klusteroidaan nimiä ympäröiviksi laatikoiksi. Tunnistamiseen käytetään tehtävään sopivaa konvoluutio- ja rekursiivisen neuroverkon yhdistelmää.
Esitetty menetelmä saavuttaa hyvän tunnistuskyvyn ja täsmällisyyden. Suurimmasta osasta syötteitä kaikki kortit tunnistetaan oikein. Verrattuna yleisiin tekstintunnistuksen- ja paikannuksen algoritmeihin, tutkielman menetelmä on laskennallisesti kevyt ja sen käyttämät koneoppimismallit vievät vain vähän tilaa. Nämä ominaisuudet mahdollistavat käytön myös mobiiliympäristöissä.
Tunnistusmenetelmän mallien opettamiseen on luotu kaksi synteettistä kuva-aineistoa. Validointiin on manuaalisesti luotu erillinen aineisto. Sekä menetelmän toteutus että kaikki aineistot on julkaistu avoimella lisenssillä GitHub-sivustolla.
Menetelmä ensin paikantaa korttien nimet ja tämän jälkeen tunnistaa ne. Paikantamiseen käytetään algoritmia, joka etsii kuvasta tekstin osilta näyttäviä yhdistettyjä komponentteja. Löydetyt yhdistetyt komponentit edelleen klusteroidaan nimiä ympäröiviksi laatikoiksi. Tunnistamiseen käytetään tehtävään sopivaa konvoluutio- ja rekursiivisen neuroverkon yhdistelmää.
Esitetty menetelmä saavuttaa hyvän tunnistuskyvyn ja täsmällisyyden. Suurimmasta osasta syötteitä kaikki kortit tunnistetaan oikein. Verrattuna yleisiin tekstintunnistuksen- ja paikannuksen algoritmeihin, tutkielman menetelmä on laskennallisesti kevyt ja sen käyttämät koneoppimismallit vievät vain vähän tilaa. Nämä ominaisuudet mahdollistavat käytön myös mobiiliympäristöissä.
Tunnistusmenetelmän mallien opettamiseen on luotu kaksi synteettistä kuva-aineistoa. Validointiin on manuaalisesti luotu erillinen aineisto. Sekä menetelmän toteutus että kaikki aineistot on julkaistu avoimella lisenssillä GitHub-sivustolla.