Internetin tiedonlouhinta
Martikkala, Johannes (2020)
Martikkala, Johannes
2020
Tieto- ja sähkötekniikan kandidaattiohjelma - Degree Programme in Computing and Electrical Engineering, BSc (Tech)
Informaatioteknologian ja viestinnän tiedekunta - Faculty of Information Technology and Communication Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2020-03-12
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-202002202265
https://urn.fi/URN:NBN:fi:tuni-202002202265
Tiivistelmä
Tässä työssä käsitellään internetin tiedonlouhintaa eli webin louhintaa (engl. web mining). Työ käsittelee tiedonlouhinnan yleistä teoriaa, minkä pohjalta muodostetaan kattavaa näkemystä webin louhinnan tutkimusalueen kehittymisestä ja määrittelystä. Webin louhinta jaetaan kolmeen eri osa-alueeseen, joiden käyttötarkoituksia ja eroavaisuuksia tarkastellaan. Työssä käsitellään käytännön sovelluksia eri webin tiedonlouhinnan kategorioista, missä tutkitaan yleisimpiä ja tunnetuimpia webin tiedonlouhinnan sovelluksia. Työ tarkastelee sovellusten toteutustapoja ja käsittelee webin louhinnan etiikkaa.
Työssä todetaan, että webin louhinta on tutkimusalue, jonka pohjalta kehitetyt työkalut ovat antaneet mahdollisuuden käsitellä webin eri osa-alueita tehokkaalla ja monipuolisella tavalla. Tutkimusalue määritellään tiedonlouhintana, jossa data kerätään webistä. Webin louhinta koostuu kolmesta eri osa-alueesta, joita ovat rakenteen, sisällön ja käytön louhinta. Osa-alueiden sovelluksia on monia, joista tunnetuimpia nykypäivänä ovat webin sisäinen hakukone ja palvelun tarjoajien toteuttama kohdennettu sisältö. Webin louhinta on itsessään eettisesti pitävää, jos se toteutetaan datalla, jota on lupa käyttää.
Työssä todetaan, että webin louhinta on tutkimusalue, jonka pohjalta kehitetyt työkalut ovat antaneet mahdollisuuden käsitellä webin eri osa-alueita tehokkaalla ja monipuolisella tavalla. Tutkimusalue määritellään tiedonlouhintana, jossa data kerätään webistä. Webin louhinta koostuu kolmesta eri osa-alueesta, joita ovat rakenteen, sisällön ja käytön louhinta. Osa-alueiden sovelluksia on monia, joista tunnetuimpia nykypäivänä ovat webin sisäinen hakukone ja palvelun tarjoajien toteuttama kohdennettu sisältö. Webin louhinta on itsessään eettisesti pitävää, jos se toteutetaan datalla, jota on lupa käyttää.
Kokoelmat
- Kandidaatintutkielmat [8314]