Tiedon määrä on kasvanut viime vuosina valtavasti. Mitä enemmän tietoa on saatavilla ja mitä monimutkaisempaa asiaa kuvataan, sitä tärkeämpää on havainnollistaa se visuaalisesti. Datan visualisointi mahdollistaa datan tutkimisen ja tehokkaan viestinnän, ja se on ihan ansaitusti noussut esille useiden eri alojen teknologioissa. Hyvä datan visualisointi on totuudenmukainen esitys, joka on ymmärrettävä ja tarjoaa lisäarvoa katsojalle. Datan visualisoinnin työkalujen määrä on kasvanut merkittävästi tällä vuosikymmenellä, ja nykyään kuka tahansa voi luoda vaikuttavia visualisointeja. Siksi on tärkeää ymmärtää, mikä visualisoinnin tehtävä on, ja mitä sillä voi saavuttaa.

Datan ja luetun ymmärtämisen merkitys on yhä tärkeämpää, kun kuka tahansa voi laatia esityksiä käyttäen hyväkseen Internetistä kerättyä dataa. Organisaation kannalta helpompi ja nopeampi datan visualisointi mahdollistaa ajan käytön siirtämisen datan käsittelystä datan tutkimiseen.

Kannattaako datan visualisointiin käyttää aikaa, ja miten paljon? Onko sillä rahallista hyötyä? Usein pinnalle visualisoinnissa näkyy vain esiteltävät raportit. Tärkeä hyöty, joka ei näy pinnalle, on päivittyneiden työkalujen ja prosessien kehittämisen myötä tuleva toimintatapojen muutos. Tehokas visualisointi tuo mukanaan dataan pureutumisen, ja monesti myös datan käsittelyn tehostamisen. Toisaalta, useimmin kaikkea dataa ei aina saa tähän prosessiin mukaan, vaan kokeilu aloitetaan osajoukolla tai selkeällä sovelluskohteella. Se, missä tätä kannattaa soveltaa, vaatii usein kokeilua ja esimerkkien näkemistä ensin muualta, ennen kuin itse osaa edes nähdä mahdolliset sovelluskohteet omassa työssään.

Mitä datan visualisoinnilla voi saavuttaa?

Kuvalla on suurin arvo silloin, kun se pakottaa meidät näkemään jotain, mitä emme odottaneet näkevämme. Usein trendejä, korrelaatioita ja mittaustulosten välisiä relaatioita on hankala hahmottaa pelkistä luvuista, mutta kuvaa katsomalla trendit on helppo hahmottaa. Visualisoinnin tuoma hyöty on helpoin esittää esimerkillä. Alla on taulukoituna neljän eri mittauksen tulokset. Silmämääräisesti luvut näyttävät viimeistä mittausta lukuun ottamatta hyvin samankaltaisilta.

I II III IV
X Y X Y X Y X Y
10 8,04 10 9,14 10 7,46 8 6,58
8 6,95 8 8,14 8 6,77 8 5,76
13 7,58 13 8,74 13 12,74 8 7,71
9 8,81 9 8,77 9 7,11 8 8,84
11 8,33 11 9,26 11 7,81 8 8,47
14 9,96 14 8,1 14 8,84 8 7,04
6 7,24 6 6,13 6 6,08 8 5,25
4 4,26 4 3,1 4 5,39 19 12,5
12 10,84 12 9,13 12 8,15 8 5,56
7 4,82 7 7,26 7 6,42 8 7,91
5 5,68 5 4,74 5 5,73 8 6,89

Usein ensimmäinen askel datan käsittelyssä on laskea aineistolle tunnuslukuja. Tässä tapauksessa laskettaessa aineistoille tilastolliset tunnusluvut, saadaan tulokseksi, että kaikkien sarakkeiden keskiarvot, varianssit ja x:n ja y:n väliset korrelaatiot ovat samat: X:n keskiarvo kaikissa neljässä mittauksesa on 9, Y:n keskiarvo 7,5, X:n varianssi 11, ja Y:n varianssi 4,12. Myöskin kaikissa X:n ja Y:n välinen korrelaatio on 0,816. Äkkiseltään näyttäisi, että tulokset ovat siis pitkälti yhtenevät.

Visualisoituna luvut kertovat kuitenkin toisen tarinan:

Tässä tapauksessa pelkästään tuloksia ja tunnuslukuja tuijottamalla, eri mittausten osoittamat tulokset olisivat menneet ohitsemme, sillä mittaukset kuvaavat selkeästi eri ilmiöitä, vaikka niiden tunnusluvut ovatkin samat.

Visualisointiprosessi on usein (tai mielellään olisi) osa laajempaa datan analysointia, missä dataa tutkitaan ensin visualisointiohjelmistojen avulla, etsitään muuttujien välille relaatioita, ja kootaan kokonaiskuva datasta. Parhaimmillaan visualisoinnit ovat data-analyysiprosessin tukena, hyvin datan havainnollistavien kuvien avulla relaatiot ja korrelaatiot muuttujien välillä on helpompi nähdä, jonka jälkeen niiden varaan voi alkaa rakentamaan edistyneempää metriikkaa.

Mitä uutta visualisoinnissa on tapahtunut?

Visualisointi ei sinällään ole uusi trendi. Erilaisia datan visualisointeja on harrastettu jo 1700-luvulta alkaen, osoittamaan Napoleonin sotaretkien mieskatoa (C.J. Minard), brittiarmeijan kuolinsyitä (F. Nightingale) ja epidemioiden leviämistä (J. Snow). Hans Rosling popularisoi visualisointeja myös menestyksekkäästi tällä vuosikymmenellä kuvaamalla väestönkehityksen trendejä helposti ymmärrettävällä tavalla. Mikä datan visualisoinnista on nykyään tehnyt uutta, on interaktiivisten visualisointiohjelmistojen ja kirjastojen leviäminen.

Viime vuosina etenkin ohjelmistot kuten Tableau ja Qlik ovat tuoneet datan visualisointia suuren yleisön tietoisuuteen. Excelin ja muiden taulukkolaskentaohjelmien kyvyt datan käsittelyyn loppuvat hyvin lyhyeen, ja tähän markkinarakoon uudet visualisointiohjelmistot ovat iskeneet. Interaktiivisten visualisointien laatiminen on aiemmin vaatinut paljon työtä ja ohjelmointiosaamista, nykyään sitä varten on olemassa graafisia käyttöliittymiä. Tämän myötä yhä useampi on päässyt kokeilemaan datan visualisointia. Visualisointityökalujen kehittyminen on jopa tuonut mukanaan mahdollisuuden integroida visualisoinnit olemassa oleviin järjestelmiin, jonka myötä organisaation käyttämä data voidaan nykyään esittää helppolukuisemmin moderneilla järjestelmillä olemassa olevien alustojen päällä.

Interaktiivinen visualisointi mahdollistaa käyttäjälle datan tutkimisen itsenäisesti. Olennaisesti interaktiivinen visualisointi on näin määriteltynä eksploratiivista visualisointia: visualisoinnissa annetaan käyttäjälle vastuu ja mahdollisuus omien johtopäätösten tekemisestä. Interaktiivisen visualisoinnin myötä samassa tilassa ja samassa kuvaajassa voi esittää enemmän dataa useammasta eri näkökulmasta, kuin vain esittämällä staattisen kuvaajan. Tulkinnan ja datan arvo siis kasvaa. Interaktiivisen visualisoinnin tehtävä on lisätä datan saavutettavuutta ja antaa lisäarvoa käyttökokemukselle.

Karkea erottelu eri visualisointimalleille

Vastapainona eksploratiiviselle visualisoinnille on selittävä (explanatory) visualisointi. Suurin osuus staattisista visualisoinneista pyrkii olemaan selittäviä visualisointeja, eli niissä kuvan laatija on ottanut vastuun siitä, minkä viestin hän pyrkii antamaan katsojalle kuvan kautta.

Eksploratiivinen vai selittävä visualisointi?

Nyrkkisääntönä, kun käyttäjän halutaan itse tutkivan dataa, eksploratiivinen visualisointi on tähän sopiva valinta. Tällaisia tapauksia yleensä ovat ne, kun data visualisoinnin alla päivittyy, jolloin alkuperäiselle datalle tehdyt havainnot ja niitä korostavat visualisointitekniikat sekä valittu näkökulma vanhentuvat. Tällöin on hyödyllisempää laatia visualisointi, joka mahdollistaa sen, että käyttäjä voi valita itse oman näkökulmansa dataan. Esimerkiksi yrityksen toiminnasta voi olla hyödyllisempää laatia eksploratiivinen johdon raportti kuin esittää yksi valittu näkökulma. Tällöin johto voi itse tutkia raportin tietoja ja saada paremman käsityksen yrityksen toiminnasta.

Kun datasta halutaan tuoda esille tietty viesti, selittävä visualisointi sopii silloin. Tällöin valitaan näkökulma dataan, ja viestiä alleviivataan siihen sopivalla visualisoinnilla. Auton nopeusmittari lienee lähinnä arkipäivää oleva esimerkki selittävästä visualisoinnista.

Molemmissa esitystavoissa visualisoinnin valitsemiseen vaikuttaa eniten itse datan laatu. Se, esitetäänkö katsojalle tekstuaalista, määrällistä vai muun mallista dataa, vaikuttaa siihen, millainen visualisointi sopii esitettävälle datalle. Tätä varten perusopinnot visualisoinnista, tilastotieteestä, psykologiasta ja viestinnästä ovat hyödyksi.

Analysointiprosessin tukena interaktiivinen visualisointi on parhaimmillaan, kun käyttäjä haluaa tutkia datan relaatioita nopeasti ja eri tavoin. Siinä hyvä visualisointiohjelmisto nopeuttaa työskentelyä, ja mahdollistaa tulosten esittämisen ja jakamisen.

Interaktiivinen datan visualisointi ja sen edistäminen

Datan visualisointi helpottaa sen tulkitsemista. Visualisointia todennäköisesti harrastetaan lähes kaikilla työpaikoilla muodossa tai toisessa, mutta interaktiivinen visualisointi tekee vielä tuloaan. Tarinankerrontaa datalla ei opeteta toistaiseksi missään, joten sen hyötykäyttö organisaatioissa on lapsenkengissään. Isolta osin kyse tiedon visualisoinnissa on siitä, kenen aikaa käytetään mihinkin, ja onko tieto helposti omaksuttavassa muodossa. Visualisoimalla tietoa ja tekemällä datalle interaktiivisia visualisointeja, siirretään usein datan käsittelyyn kulutettavaa aikaa kehittäjiltä analyytikoille ja lukijalle. Se, milloin tämä on järkevää, täytyy miettiä käyttökohteen mukaan.

Alkuun pääseminen tällaisessa hankkeessa vaatii ensin ymmärryksen organisaation datasta ja sen käyttökohteista. Mikä tahansa visualisointi vaatii alleen datamallin, ja pitkälti datan visualisoinnin vaatimukset ovat samoja, kuin tehokkaan datan käsittelyn vaatimukset. Sen jälkeen voi alkaa valita sopivia ja itselle luontevalta tuntuvia työkaluja, joilla datan saa visualisoitua, ja tulokset esitettyä organisaation käyttämissä alustoissa.

Erilaisia esimerkkejä ja inspiraatiota visualisoinneista voi hakea esimerkiksi osallistumalla käyttäjäryhmien tapaamisiin. Ainakin Tableau ja Qlik kannustavat käyttäjiään tapaamaan ja jakamaan kokemuksiaan. ALM Partners fasilitoi syyskuussa Tableau User Group Meetingin. Mikäli aihealue kiinnostaa, olet tervetullut osallistumaan tapahtumaan. Ilmoittautuminen on Eventbriten kautta, missä on myös lisätietoja tapahtumasta.

Luettavaa

Paras tapa opiskella asiaa on katsoa paljon esimerkkejä ja lukea aihepiirin teoksia. Esimerkiksi tämän kirjoituksen lähteinä ovat kirjat:

Data Visualization – A Handbook for Data Driven Design, Andy Kirk
The Truthful Art – Data, Charts, and Maps For Communication, Alberto Cairo
Storytelling with data – A Data Visualization Guide for Business Professionals, Cole, Nussbaumer, Knaflic

Erilaisia visualisointeja voi kokeilla esimerkiksi Tableaulla, Qlik Sensellä, Microsoft PowerBI:llä, Google Chartsillad3.js:llä tai Bokehilla. Uusia työkaluja on ja tulee lisää kaiken aikaa, tärkeintä on löytää sellainen, mikä on itselle helpoin ja käyttökelpoisin.

 

Antti Väisänen
Kehittäjä, ALM Partners

Jotta sivuston käyttö olisi sinulle sujuvaa, ALM Partners yhteistyökumppaneineen käyttää evästeitä. Jatkamalla lukemista hyväksyt evästeet. Lisätietoja

The cookie settings on this website are set to "allow cookies" to give you the best browsing experience possible. If you continue to use this website without changing your cookie settings or you click "Accept" below then you are consenting to this.

Close