Harhaanjohtava visualisointi : Johdattelevien grafiikoiden vaikutus lukijan tulkintaan
Ahola, Mari (2023)
Ahola, Mari
2023
Master's Programme in Computing Sciences
Informaatioteknologian ja viestinnän tiedekunta - Faculty of Information Technology and Communication Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2023-05-28
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-202304274751
https://urn.fi/URN:NBN:fi:tuni-202304274751
Tiivistelmä
Tilastot ovat merkittävä osa ihmisen arkea. Ne vaikuttavat yksilön tapaan tehdä päätöksiä ja luoda mielikuvia senhetkisestä maailmasta. Nykypäivänä tietoa on paljon, mutta vain harvalla on aikaa tai kiinnostusta perehtyä valtavaan määrään numeerista dataa. Sen vuoksi data visualisoidaan muotoon, jossa sitä voidaan tarkastella mahdollisimman pienessä tilassa mahdollisimman monipuolisesti. Lukijan nähtäväksi jää siis vain grafiikat, joiden avulla hän voi ymmärtää datan kokonaiskuvan ja vertailla sen yksityiskohtia.
Kaikki grafiikat eivät kuitenkaan ole luotettavia. Tutkielmassa perehdytään tapoihin, joilla grafiikoista voidaan tehdä harhaanjohtavia. Esiteltäviä menetelmiä ovat esimerkiksi vääränlaisten kaaviotyyppien käyttäminen, roskagrafiikka, grafiikan elementtien vääristely ja datan liioittelu. Johdattelua tapahtuu siis hyvin monella eri tavalla. Työssä oltiin kuitenkin kiinnostuneita tutkimaan, onko harhaanjohtavilla menetelmillä todellista vaikutusta lukijan tulkintaan.
Tutkielman yhteydessä toteutettiin kyselytutkimus, jonka tarkoituksena oli selvittää, vaikuttaako visuaalinen johdattelu lukijan tapaan tulkita tilastoja. Tutkimuksessa tarkasteltiin myös iän, koulutustason ja sukupuolen vaikutusta lukijan tulkintaan. Kyselytutkimus toteutettiin 123 vapaaehtoisen vastaajan avulla. Vastaajia pyydettiin tulkitsemaan ja arvioimaan yhdeksää eri kaaviota, joista osaan oli käytetty johdattelevia visualisointeja. Vastauksia tarkasteltiin ristiintaulukoinnin avulla. Johdattelevien kaavioiden vaikutusta mitattiin McNemar-testillä. Sukupuolen, iän ja koulutustason
vaikutuksia tutkittiin χ2-testin ja Kruskal-Wallisin testin avulla.
Tutkimustulokset osoittivat, että harhaanjohtavia visualisointeja sisältävät kaaviot saivat tilastollisesti merkitsevästi erilaisia vastauksia kuin vertailukaaviot. Johdattelevat kaaviot saivat myös vertailukaavioita enemmän vääriä vastauksia. Tulosten perusteella voidaan päätellä, että harhaanjohtavat visualisoinnit vaikuttavat lukijan tapaan tulkita tilastoja. Iällä, sukupuolella ja koulutustasolla oli merkitystä osaan vastauksista. Koulutustason vaikutus osoittautui tilastollisesti merkitseväksi kolmen kaavion kohdalla. Sukupuolen ja koulutustason merkitys näkyi myös vastaajien tavoissa arvioida kaavioita tai omaa luottamustaan sosiaalisessa mediassa esitettyjä tilastoja kohtaan. Selittävien muuttujien vaikutus oli kuitenkin melko pieni ja kohdistui vain osaan kaavioista ja kysymyksistä.
Tutkimuksen koko oli otannaltaan ja sisällöltään pieni. Vaikka tutkimus osoitti johdattelulla olevan vaikutusta, on aihetta syytä tutkia laajemmin. Tutkimuksen perusteella voidaan kuitenkin todeta, että visualisointi on monimutkainen kokonaisuus, jota olisi syytä opettaa nykyistä enemmän jo alemmilla koulutusasteilla. Statistics are an integral part of everyday life. They help individuals to make informed decisions and promote understanding about the world. Nowadays there is a lot of information but only a few have time or knowledge to study a large amount of numerical data. Because of that, the data is visualized in a form that is as small as possible and contains as much information as possible. The reader only needs to see the graphics that show both the overall picture of the data and the small details that can be compared with each other.
However, all the graphics are not trustworthy. Visualization can be used to mislead the reader in many ways that are described in this thesis. For example, wrong chart type, chart junk, distorted elements and exaggeration can be used to mislead the reader. However, do these methods have an effect on the reader’s interpretation?
A questionnaire was conducted to find out if the misleading visualizations have an effect on the reader’s interpretation of statistics. The sample consisted of 123 respondents from different ages, genders and educational levels. The respondents were asked to interpret and evaluate nine different graphs. Some graphs were misleading. The responses were analyzed with cross tabulations, χ2-test, McNemar test and Kruskal-Wallis test.
McNemar test was used to determine if there were differences in the distributions of the answers to two similar graphs. The results showed that misleading methods have a statistically significant impact on reader’s interpretation of statistics. Misleading graphs also got more wrong responses than others. The effect of age, gender and educational level were tested with χ2-test and Kruskal-Wallis test. These variables had a little impact on the reader’s interpretations, but the effect was seen only in some parts of the data.
The sample size and questionnaire were small, so the topic should be researched more. However, this research showed that misleading visualizations have an effect. As the visualization is such a complicated topic, it should be taught more on the lower educational levels.
Kaikki grafiikat eivät kuitenkaan ole luotettavia. Tutkielmassa perehdytään tapoihin, joilla grafiikoista voidaan tehdä harhaanjohtavia. Esiteltäviä menetelmiä ovat esimerkiksi vääränlaisten kaaviotyyppien käyttäminen, roskagrafiikka, grafiikan elementtien vääristely ja datan liioittelu. Johdattelua tapahtuu siis hyvin monella eri tavalla. Työssä oltiin kuitenkin kiinnostuneita tutkimaan, onko harhaanjohtavilla menetelmillä todellista vaikutusta lukijan tulkintaan.
Tutkielman yhteydessä toteutettiin kyselytutkimus, jonka tarkoituksena oli selvittää, vaikuttaako visuaalinen johdattelu lukijan tapaan tulkita tilastoja. Tutkimuksessa tarkasteltiin myös iän, koulutustason ja sukupuolen vaikutusta lukijan tulkintaan. Kyselytutkimus toteutettiin 123 vapaaehtoisen vastaajan avulla. Vastaajia pyydettiin tulkitsemaan ja arvioimaan yhdeksää eri kaaviota, joista osaan oli käytetty johdattelevia visualisointeja. Vastauksia tarkasteltiin ristiintaulukoinnin avulla. Johdattelevien kaavioiden vaikutusta mitattiin McNemar-testillä. Sukupuolen, iän ja koulutustason
vaikutuksia tutkittiin χ2-testin ja Kruskal-Wallisin testin avulla.
Tutkimustulokset osoittivat, että harhaanjohtavia visualisointeja sisältävät kaaviot saivat tilastollisesti merkitsevästi erilaisia vastauksia kuin vertailukaaviot. Johdattelevat kaaviot saivat myös vertailukaavioita enemmän vääriä vastauksia. Tulosten perusteella voidaan päätellä, että harhaanjohtavat visualisoinnit vaikuttavat lukijan tapaan tulkita tilastoja. Iällä, sukupuolella ja koulutustasolla oli merkitystä osaan vastauksista. Koulutustason vaikutus osoittautui tilastollisesti merkitseväksi kolmen kaavion kohdalla. Sukupuolen ja koulutustason merkitys näkyi myös vastaajien tavoissa arvioida kaavioita tai omaa luottamustaan sosiaalisessa mediassa esitettyjä tilastoja kohtaan. Selittävien muuttujien vaikutus oli kuitenkin melko pieni ja kohdistui vain osaan kaavioista ja kysymyksistä.
Tutkimuksen koko oli otannaltaan ja sisällöltään pieni. Vaikka tutkimus osoitti johdattelulla olevan vaikutusta, on aihetta syytä tutkia laajemmin. Tutkimuksen perusteella voidaan kuitenkin todeta, että visualisointi on monimutkainen kokonaisuus, jota olisi syytä opettaa nykyistä enemmän jo alemmilla koulutusasteilla.
However, all the graphics are not trustworthy. Visualization can be used to mislead the reader in many ways that are described in this thesis. For example, wrong chart type, chart junk, distorted elements and exaggeration can be used to mislead the reader. However, do these methods have an effect on the reader’s interpretation?
A questionnaire was conducted to find out if the misleading visualizations have an effect on the reader’s interpretation of statistics. The sample consisted of 123 respondents from different ages, genders and educational levels. The respondents were asked to interpret and evaluate nine different graphs. Some graphs were misleading. The responses were analyzed with cross tabulations, χ2-test, McNemar test and Kruskal-Wallis test.
McNemar test was used to determine if there were differences in the distributions of the answers to two similar graphs. The results showed that misleading methods have a statistically significant impact on reader’s interpretation of statistics. Misleading graphs also got more wrong responses than others. The effect of age, gender and educational level were tested with χ2-test and Kruskal-Wallis test. These variables had a little impact on the reader’s interpretations, but the effect was seen only in some parts of the data.
The sample size and questionnaire were small, so the topic should be researched more. However, this research showed that misleading visualizations have an effect. As the visualization is such a complicated topic, it should be taught more on the lower educational levels.