Työntekijöiden osaamisen arvioiminen sisäisen viestinnän perusteella Bayes-verkkoa käyttämällä
Saarimäki, Daniel (2020)
Saarimäki, Daniel
2020
Teknis-luonnontieteellinen DI-ohjelma - Master's Programme in Science and Engineering
Tekniikan ja luonnontieteiden tiedekunta - Faculty of Engineering and Natural Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2020-11-09
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-202009297175
https://urn.fi/URN:NBN:fi:tuni-202009297175
Tiivistelmä
Monilla moderneilla ja erityisesti pienempiä projekteja paljon tekevillä yrityksillä on jatkuva tarve sovittaa työntekijöiden osaamisalueet tarjolla oleviin projekteihin tehokkuuden maksimoimiseksi. Tämä vaatii kattavaa tietoa työntekijöiden hallitsemista taidoista. Yritykset voivat kerätä työntekijöiltä tietoa heidän osaamisestaan erilaisin menetelmin, mutta riskinä aina on, ettei kriittisellä hetkellä satu esimerkiksi olemaan saatavilla tietoa juuri käsillä olevaan projektiin suunnitelluista tekniikoista sekä työntekijöiden suhteesta näihin tekniikoihin.
Tässä diplomityössä tutkitaan voiko tarvittavaa tietoa työntekijöiden osaamisalueista johtaa yrityksen sisäisissä kommunikaatiokanavissa käydyistä sähköisistä keskusteluista. Lisäksi tutkitaan Bayes-verkon eli erilaisia tapahtumia ja niiden välisiä riippuvuussuhteita esittävän graafirakenteen soveltuvuutta kerätyn tietotaitoa kuvaavan tiedon säilömiseen sekä käsittelyyn. Bayes-verkot ovat saavuttaneet suosiota oppilaan taitoihin mukautuvissa opetussovelluksissa, joissa oppilaan hallitsemia ja hallitsemattomia asioita pyritään selvittämään erilaisten koekysymysten vastausten perusteella.
Vaikka Bayes-verkko todetaan työssä hyväksi tavaksi kuvata työntekijän osaamista, joudutaan referenssinä käytetyt opetuskäyttöön rakennetut mallit toteamaan soveltumattomiksi työssä todettuihin tarpeisiin. Tämä yhdessä tavallisesta poikkeavan tekstianalyysitarpeen sekä työn rajallisen skaalan kanssa johtaa siihen, ettei työssä sovelleta edistyneempiä luonnollisen kielen prosessoinnin menetelmiä tai oppivia algoritmeja, kuten esimerkiksi lauserakenneanalyysiä tai neuroverkkoja. Lopputuloksena on algoritmi, joka pystyy tuottamaan jonkin verran tietoa yrityksen käytössä olevasta kokonaistietomäärästä, mutta ei tuota riittävän luotettavaa tietoa yksittäisten työntekijöiden osaamisesta.
Luonnollisen kaoottinen keskusteludata todetaan tutkimuksen pohjalta huonoksi tiedon lähteeksi, ellei analyysissä käytetä edistyneempiä luonnollisen kielen analysointikeinoja yksittäisten viestien tarkoituksen tarkempaan selvittämiseen. Tekstin analysoinnin hyödyllisyyttä voitaisiin myös lisätä merkittävästi ottamalla mukaan muualta saatua ennakkotietoa jo algoritmin toiminnan aikana sekä parantamalla Bayes-verkon rakennetta. Tässä työssä käytettävä Bayes-verkon rakenne johdetaan toisen järjestelmän taitokategorioista, mikä osoittautuu epäoptimaaliseksi ratkaisuksi. Many modern enterprises, especially those that have a lot of smaller projects, have a continuous need to fit the expertise of their employees to the available projects in order to maximize productivity. This requires good knowledge of the skills possessed by the employees. Enterprises can collect information of the skills of their employees using various methods, but there's always the risk that at the critical moment there's no knowledge of the employee skills regarding the exact technology or technique required for the project.
In this masters' thesis I research if the required information regarding employee expertise could be inferred from the discussions that happen in the internal communication channels within an organisation. I also research if Bayesian networks, graph structures used for presenting various events and their probability relations, are suitable for containing and operating on the collected skill information. Bayesian networks have acquired popularity in adaptive educational applications where the application tries to infer the learning state of a student in various subjects based on a series of exam questions.
Even though Bayesian networks are noted to be a good way to represent the knowledge of an employee, the models developed for educational use were found to be ill-suited for the needs outlined in this research. This in combination with the unusual text analysis needs and the limited scale of the thesis means that advanced natural language processing methods and intelligent algorithms such as sentence structure processing and neural networks are not implemented. The result is an algorithm that can produce some amount of information regarding the knowledge available to an organisation, but fails to produce reliable knowledge regarding the skills of a single employee.
The chaotic and natural conversation data was found to be a poor source of information, unless the analysis uses more advanced natural language processing methods to infer the purpose of individual messages. The usefulness of text analysis could also be increased significantly by taking into account prior information received from other sources during the algorithm and by improving the structure of the Bayesian network. In this thesis the structure of the Bayesian network was based on the skill categories of another system, which turned out to be a suboptimal solution.
Tässä diplomityössä tutkitaan voiko tarvittavaa tietoa työntekijöiden osaamisalueista johtaa yrityksen sisäisissä kommunikaatiokanavissa käydyistä sähköisistä keskusteluista. Lisäksi tutkitaan Bayes-verkon eli erilaisia tapahtumia ja niiden välisiä riippuvuussuhteita esittävän graafirakenteen soveltuvuutta kerätyn tietotaitoa kuvaavan tiedon säilömiseen sekä käsittelyyn. Bayes-verkot ovat saavuttaneet suosiota oppilaan taitoihin mukautuvissa opetussovelluksissa, joissa oppilaan hallitsemia ja hallitsemattomia asioita pyritään selvittämään erilaisten koekysymysten vastausten perusteella.
Vaikka Bayes-verkko todetaan työssä hyväksi tavaksi kuvata työntekijän osaamista, joudutaan referenssinä käytetyt opetuskäyttöön rakennetut mallit toteamaan soveltumattomiksi työssä todettuihin tarpeisiin. Tämä yhdessä tavallisesta poikkeavan tekstianalyysitarpeen sekä työn rajallisen skaalan kanssa johtaa siihen, ettei työssä sovelleta edistyneempiä luonnollisen kielen prosessoinnin menetelmiä tai oppivia algoritmeja, kuten esimerkiksi lauserakenneanalyysiä tai neuroverkkoja. Lopputuloksena on algoritmi, joka pystyy tuottamaan jonkin verran tietoa yrityksen käytössä olevasta kokonaistietomäärästä, mutta ei tuota riittävän luotettavaa tietoa yksittäisten työntekijöiden osaamisesta.
Luonnollisen kaoottinen keskusteludata todetaan tutkimuksen pohjalta huonoksi tiedon lähteeksi, ellei analyysissä käytetä edistyneempiä luonnollisen kielen analysointikeinoja yksittäisten viestien tarkoituksen tarkempaan selvittämiseen. Tekstin analysoinnin hyödyllisyyttä voitaisiin myös lisätä merkittävästi ottamalla mukaan muualta saatua ennakkotietoa jo algoritmin toiminnan aikana sekä parantamalla Bayes-verkon rakennetta. Tässä työssä käytettävä Bayes-verkon rakenne johdetaan toisen järjestelmän taitokategorioista, mikä osoittautuu epäoptimaaliseksi ratkaisuksi.
In this masters' thesis I research if the required information regarding employee expertise could be inferred from the discussions that happen in the internal communication channels within an organisation. I also research if Bayesian networks, graph structures used for presenting various events and their probability relations, are suitable for containing and operating on the collected skill information. Bayesian networks have acquired popularity in adaptive educational applications where the application tries to infer the learning state of a student in various subjects based on a series of exam questions.
Even though Bayesian networks are noted to be a good way to represent the knowledge of an employee, the models developed for educational use were found to be ill-suited for the needs outlined in this research. This in combination with the unusual text analysis needs and the limited scale of the thesis means that advanced natural language processing methods and intelligent algorithms such as sentence structure processing and neural networks are not implemented. The result is an algorithm that can produce some amount of information regarding the knowledge available to an organisation, but fails to produce reliable knowledge regarding the skills of a single employee.
The chaotic and natural conversation data was found to be a poor source of information, unless the analysis uses more advanced natural language processing methods to infer the purpose of individual messages. The usefulness of text analysis could also be increased significantly by taking into account prior information received from other sources during the algorithm and by improving the structure of the Bayesian network. In this thesis the structure of the Bayesian network was based on the skill categories of another system, which turned out to be a suboptimal solution.