Verkkokaupan tuotekategoriahallinnan automatisointi : Koneavusteinen tuotteiden sijoittelu muuttuvassa kategoriapuussa
Myllymäki, Robert (2021)
Myllymäki, Robert
2021
Tietotekniikan DI-ohjelma - Master's Programme in Information Technology
Informaatioteknologian ja viestinnän tiedekunta - Faculty of Information Technology and Communication Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2021-11-11
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-202111088275
https://urn.fi/URN:NBN:fi:tuni-202111088275
Tiivistelmä
Verkkokaupan suosion nopea kasvu koronapandemian myötä on siivittänyt verkkokauppaa harjoittavien yritysten tuloksen positiivista kehitystä. Suosion kasvu on myös nostanut tarpeen laajentaa tuotevalikoimia aiempaa nopeammin ja samalla tehokkaammin.
Tässä työssä tutkitaan verkkokaupan tuotekategoriahallinnan automatisoinnin mahdollisuuksia koneoppimisen keinoin. Tavoitteena oli selvittää, miten tehdään tuoteluokittelua todella suurella kategoriamäärällä ja kuinka hyviä tuloksia voidaan saavuttaa. Työssä päädyttiin kokeilemaan suomenkielisellä tekstillä koulutettua FinBERT-mallia tuotetietojen piirteiden louhinnassa.
Tässä tutkimuksessa analysoidaan kahden verkkokaupan tuotetietoja ja kategoriarakennetta sekä suoritetaan näiden esitietojen perusteella muutama alustava testi FinBERT-mallin suorituskyvylle valittujen verkkokauppojen tuotetiedon luokittelussa. Vaikka kovinkaan kattavia kokeellisia tutkimuksia ei ehditty tehdä, saadut tulokset kuitenkin rohkaisevat jatkamaan aiheen tutkimista edelleen. Rapid growth of popularity in e-commerce business due the corona pandemic has a positive impact to companies' profit. Given that, the need to expand the range of products with faster and more efficient way has risen.
This thesis aims for finding ways to automate product category management using machine learning approaches. The goal was to find out how to perform product classifying with extremely large number of categories and how good results is possible to gain. In this thesis FinBERT, model trained with Finnish language, was selected for testing how well it can perform in feature extraction of product data.
In this research product data and category structure of two e-commerces are analyzed and few experimentations for performance of FinBERT model in product classification are done using this gathered information. Even there was no time for doing comprehensive experimentations within allocated time the results still encourage to continue experimenting and researching the topic.
Tässä työssä tutkitaan verkkokaupan tuotekategoriahallinnan automatisoinnin mahdollisuuksia koneoppimisen keinoin. Tavoitteena oli selvittää, miten tehdään tuoteluokittelua todella suurella kategoriamäärällä ja kuinka hyviä tuloksia voidaan saavuttaa. Työssä päädyttiin kokeilemaan suomenkielisellä tekstillä koulutettua FinBERT-mallia tuotetietojen piirteiden louhinnassa.
Tässä tutkimuksessa analysoidaan kahden verkkokaupan tuotetietoja ja kategoriarakennetta sekä suoritetaan näiden esitietojen perusteella muutama alustava testi FinBERT-mallin suorituskyvylle valittujen verkkokauppojen tuotetiedon luokittelussa. Vaikka kovinkaan kattavia kokeellisia tutkimuksia ei ehditty tehdä, saadut tulokset kuitenkin rohkaisevat jatkamaan aiheen tutkimista edelleen.
This thesis aims for finding ways to automate product category management using machine learning approaches. The goal was to find out how to perform product classifying with extremely large number of categories and how good results is possible to gain. In this thesis FinBERT, model trained with Finnish language, was selected for testing how well it can perform in feature extraction of product data.
In this research product data and category structure of two e-commerces are analyzed and few experimentations for performance of FinBERT model in product classification are done using this gathered information. Even there was no time for doing comprehensive experimentations within allocated time the results still encourage to continue experimenting and researching the topic.