Big Datan visualisointi JavaScriptillä
Kilpilampi, Aleksi (2024)
Kilpilampi, Aleksi
2024
Tietojenkäsittelytieteiden kandidaattiohjelma - Bachelor's Programme in Computer Sciences
Informaatioteknologian ja viestinnän tiedekunta - Faculty of Information Technology and Communication Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2024-09-19
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-202409048540
https://urn.fi/URN:NBN:fi:tuni-202409048540
Tiivistelmä
Tässä kandidaatintyössä tutkitaan sitä, mitä big data ja tiedon visualisointi ovat ja mikä on JavaScriptin rooli tässä. Tutkimuskysymyksenä on myös se, löytyykö JavaScriptistä kirjastoja jotka ovat suosittuja tai hyödyllisiä juuri big datan visualisoinnin suhteen. Tämä kandidaatintyö on toteutettu kirjallisuuskatsauksena.
Työssä esitellään mitä big data on, minkälaisia ominaisuuksia sillä on sekä mitä esimerkkejä löytyy käytössä olevista big data -järjestelmistä. Tämän lisäksi esitellään mitä hyötyjä ja vaikeuksia big datan visualisointiin liittyy. Näihin haasteisiin etsitään ratkaisuja erilaisista apumenetelmistä ja JavaScriptin kirjastoista, alkaen tiedon prosessointiin liittyvistä virtualisoinnista, MapReduce-algoritmista sekä tiedon suodattamisesta ja aggrekoinnista. Tiedon visualisointiin JavaScriptillä esitellään peruskirjastoja sekä erikoistuneemmista kirjastoista D3.js, DyGraphs sekä Crossfade.js.
Työn tuloksissa huomattiin, että big datan visualisointiin liittyy hyötyjä, sillä ihmissilmä erottaa rakenteita ja epäsäännöllisyyksiä erityisen hyvin juuri visuaalisista malleista. Moni lääketieteellinen läpimurto on onnistunut juuri tämän menetelmän avulla. Tuloksissa havaittiin myös, että big datan visualisoiminen on usein kolmiosainen prosessi, alkaen tiedon hajautetun tiedon keräämisestä virtualisoinnin ja esimerkiksi Hadoopin avulla. Tätä tietoa voidaan joutua prosessoida ennen hakuja tai visualisointia suodattamisen tai aggrekoinnin avulla. JavaScriptin rooliksi jää tämän käsitellyn tiedon visualisointi, ja D3.js osoittautui hyväksi kirjastoksi tämän suhteen, johtuen sen interaktiivisista ominaisuuksista sekä laajasta muokattavuuspotentiaalista, jolla se saatiin osaksi monenlaisia erilaisia tutkimuksia. JavaScript ei siis ole yksinään ratkaisu big datan visualisoinnin haasteisiin, vaan ainoastaan yksi osa monivaiheista prosessia.
Työssä esitellään mitä big data on, minkälaisia ominaisuuksia sillä on sekä mitä esimerkkejä löytyy käytössä olevista big data -järjestelmistä. Tämän lisäksi esitellään mitä hyötyjä ja vaikeuksia big datan visualisointiin liittyy. Näihin haasteisiin etsitään ratkaisuja erilaisista apumenetelmistä ja JavaScriptin kirjastoista, alkaen tiedon prosessointiin liittyvistä virtualisoinnista, MapReduce-algoritmista sekä tiedon suodattamisesta ja aggrekoinnista. Tiedon visualisointiin JavaScriptillä esitellään peruskirjastoja sekä erikoistuneemmista kirjastoista D3.js, DyGraphs sekä Crossfade.js.
Työn tuloksissa huomattiin, että big datan visualisointiin liittyy hyötyjä, sillä ihmissilmä erottaa rakenteita ja epäsäännöllisyyksiä erityisen hyvin juuri visuaalisista malleista. Moni lääketieteellinen läpimurto on onnistunut juuri tämän menetelmän avulla. Tuloksissa havaittiin myös, että big datan visualisoiminen on usein kolmiosainen prosessi, alkaen tiedon hajautetun tiedon keräämisestä virtualisoinnin ja esimerkiksi Hadoopin avulla. Tätä tietoa voidaan joutua prosessoida ennen hakuja tai visualisointia suodattamisen tai aggrekoinnin avulla. JavaScriptin rooliksi jää tämän käsitellyn tiedon visualisointi, ja D3.js osoittautui hyväksi kirjastoksi tämän suhteen, johtuen sen interaktiivisista ominaisuuksista sekä laajasta muokattavuuspotentiaalista, jolla se saatiin osaksi monenlaisia erilaisia tutkimuksia. JavaScript ei siis ole yksinään ratkaisu big datan visualisoinnin haasteisiin, vaan ainoastaan yksi osa monivaiheista prosessia.
Kokoelmat
- Kandidaatintutkielmat [8996]