Sparklines: trends in tabellen

Om goede data-analyses te maken is het cruciaal dat men data op een goede, begrijpbare, manier voorstelt. Dit leidt tot betere inzichten en op termijn dus ook tot betere data-driven business beslissingen. In deze blogpost staan we stil bij het belang van het correct presenteren van data en bekijken we een populaire visualisatietechniek: de sparklines!

Data analyse & aggregaten

In de rol van data-analist (of data scientist) krijgt man vaak de vraag om data op een zodanige manier te manipuleren en transformeren zodat men een beter inzicht in de onderliggende gegevens verkrijgt. Om dit inzicht te verkrijgen gaat de data-analist vaak aggregaten bouwen op één of meerdere niveaus. Zo kan men bij het analyseren van klantengegevens een aggregaat bouwen op het niveau van bv. de individuele klant om inzicht te krijgen in de producten die elke klant koopt. Maar evengoed kan men een aggregaat bouwen op het niveau van de klant’s woonplaats om te weten welk productsegment populair is in welk gebied en hoeveel klanten terug te vinden zijn in elk geografisch gebied. Vaak worden de aggregaten iteratief verfijnd in samenwerking met de klanten/opdrachtgevers om zo de businessvraagstukken beter te begrijpen en het resultaat tijdig bij te sturen waar nodig.

Eens men een aggregaat van gegevens heeft gebouwd kan men dit door middel van verscheidene artefacten presenteren. De drie populairste vormen om aggregaten te presenteren zijn:

  1. Visualisaties, waar men de bekomen data visueel gaat voorstellen door middel van een grafische component (histogram, trendlijn, …). Zo kan men op een snelle manier een globaal beeld krijgen van de onderliggende data. Het nadeel van visualisaties is dat men vaak de details over de onderliggende informatie niet meer ziet.
  2. Tabellen, waar men textueel in verschillende kolommen weergeeft hoe de data zich gedraagt per rij. Dit geeft goed de details van de data weer, maar het is moeilijker om via een tabel een globaal zicht op de data te krijgen. Ook is het moeilijker om trends in een tabelstructuur weer te geven.
  3. Interactieve dashboards, waar men door eenvoudige manipulaties doorheen data kan navigeren en parameters kan aanpassen. Dit is een sterke presentatietechniek, maar niet altijd even eenvoudig te bouwen (hoewel er de laatste jaren een enorme evolutie is ontstaan in de dashboarding tools).

Sparklines: een vernieuwde presentatievorm

Naast de drie traditionele vormen om aggregaten voor te stellen, is er de laatste jaren in de (academische) informatie visualisatie community gewerkt aan nieuwe – betere – voorstellingen van geaggregeerde data. Een van die nieuwe technieken is sparklines, een zeer kleine lijngrafiek zonder assen of coordinaten. Dit laat toe om op een heel kleine ruimte een verloop of trend aan te tonen. Zo kunnen sparklines perfect binnen een tabel of tekst geplaatst worden om het verloop van een parameter aan te geven. Onderstaand ziet men een voorbeeld van een sparkline die de aandelenkoers weergeeft (Bron: Wikipedia).

sparkline_wikipedia

De democratisering van Sparklines: integratie in populaire data-analyse tools

sparkline_alcDe laatste tijd worden sparklines steeds populairder buiten het academische milieu. Een belangrijke drijfveer is hiervoor ongetwijfeld de integratie van sparklines in populaire analyse tools zoals onder andere Excel. Met enkele eenvoudige klikken kan je de rijen van je tabel uitbereiden met kleine lijn- of bargrafiekjes. Zo hebben wij in een project voor een klant onlangs sparklines gebruikt om trends aan te tonen voor bepaalde parameters (zie screenshot links). De klant was overigens zeer tevreden over deze presentatievorm.

Conclusie

Als data-scientist grijpen we vaak terug naar de traditionele methodes om data en bijhorende aggregaten voor te stellen. Toch blijft het belangrijk om ook de nieuwe visualisatietrends te volgen. Dit laat toe om data nog begrijpbaarder voor te stellen. Een voorbeeld hiervan is sparklines, dewelke de laatste jaren ook in de standaard analyse tools zijn ingebakken.

 

Leave a Reply

Your email address will not be published.