big data


  • Data Archipel – Analyse op Gekruiste Persoonsgegevens

    Data Archipel – Analyse op Gekruiste Persoonsgegevens

    Posted on

    by

    in

    Analytics op persoonsgegevens moet steeds in overeenstemming gebeuren met de privacywetgeving, waarbij principes zoals finaliteit, proportionaliteit, transparantie en information security practices gerespecteerd dienen te worden. De fragmentatie van de overheid levert een bijkomende uitdaging op. Wanneer namelijk persoonsgegevens uit verschillende bronnen gekruist worden in één centraal datawarehouse, blijven de aanleverende overheidsbedrijven enerzijds wel verantwoordelijk voor

    Continue reading→


  • Uitdagingen voor Analytics: Causaliteit en co.

    Uitdagingen voor Analytics: Causaliteit en co.

    Posted on

    by

    in

    Aanleiding van deze blog is een mail die ik ontving betreffende de moeilijkheid in analytics om causaliteit, en niet louter correlatie, tussen twee fenomenen vast te stellen. De suggestie dat dit met klassieke statistiek ook niet zou kunnen, en er dus eigenlijk geen probleem is, is  betwistbaar. Wél staat vast dat causaliteit vaak een moeilijke kwestie is. Waar gaat

    Continue reading→


  • Geavanceerd Event Driven Engineering

    Geavanceerd Event Driven Engineering

    Posted on

    by

    in

    Een Event Driven Architecture (EDA) is een sterke architectuur om de communicatie tussen IT-systemen te organizeren. EDA is echter niet het enige wat je met Events kan doen. In deze blog bekijken we een aantal geavanceerde mogelijkheden binnen de ruimere context van Event Driven Engineering.

    Continue reading→


  • Comparer des géocodeurs

    Comparer des géocodeurs

    Posted on

    by

    in

    Nous sommes en plein cœur de Londres, quartier Soho. Fin août 1854, une épidémie de choléra fait rage, 616 personnes perdent la vie. La “théorie des miasmes”, qui estime que le choléra – comme la peste – se propage par l’air, convainc la majorité des scientifiques. Sauf un certain John Snow. Pour étayer son intuition, il a une idée

    Continue reading→


  • Watson, revisited

    Watson, revisited

    Posted on

    by

    in

    In deze tweede blog over het Watson fenomeen gaan we dieper in op de systemen en tools die onder de  noemer Watson Analytics beschikbaar zijn, hetzij in een test versie, hetzij in een commerciële versie. Gelet op het grote succes van de Watson computer die het kan opnemen tegen top concurrenten in de Quiz Jeopardy

    Continue reading→


  • Elementary, my dear Watson !

    Elementary, my dear Watson !

    Posted on

    by

    in

      Je hoeft geen Sherlock Holmes te zijn om te weten wie Watson is … We hebben het hier echter over Watson van IBM. En wat daar precies achter zit is toch niet zo “Elementair, mijn beste Watson !”. Vandaar deze blog als poging om één en ander te verduidelijken. Het zal blijken dat Watson zo’n beetje de rode draad is

    Continue reading→


  • Comment mentir avec un graphique

    Comment mentir avec un graphique

    Posted on

    by

    in

    Lorsqu’il s’agit de communiquer des chiffres, qu’ils soient financiers, électoraux, démographiques, sportifs, scientifiques ou bien d’autres choses encore, tout le monde s’accordera pour dire qu’il n’y a rien de mieux qu’un graphique. Il est aujourd’hui difficile de trouver un journal qui ne contienne pas au moins une infographie ou un rapport d’activité quelconque qui ne

    Continue reading→


  • Big data & krakend ijs onder anonimisatie

    Big data & krakend ijs onder anonimisatie

    Posted on

    by

    in ,

    Inleiding Elk bedrijf bezit wel persoonsgegevens. Denken we maar aan winkels, banken en transportbedrijven. Deze gegevens kunnen interessant zijn voor andere doeleinden dan waarvoor ze initieel verzameld werden. Dit kan binnen het eigen bedrijf zijn, maar gegevens kunnen ook voor externen (bedrijven, onderzoeksinstellingen) waarde hebben. Helaas/gelukkig kunnen deze gegevens omwille van de privacywet niet zomaar

    Continue reading→


  • (bijna) 40 jaar R  – Hype of succes verhaal ?

    (bijna) 40 jaar R  – Hype of succes verhaal ?

    Posted on

    by

    in

    In IT kringen is de programmeertaal  C en zijn varianten al jaren een begrip. Wat weinig mensen weten is dat in de jaren 70 in hetzelfde Bell labs een andere programmeertaal het levenslicht zag. Deze taal was niet bedoeld als all-purpose programmeertaal maar eerder als interactieve toolkit voor statistische data-analyse,  met nadrukkelijke aandacht voor grafische visualisatie

    Continue reading→


  • “Datamining zorgt voor ongelijke behandeling en reduceert controleurs tot aapjes”: een reactie

    “Datamining zorgt voor ongelijke behandeling en reduceert controleurs tot aapjes”: een reactie

    Posted on

    by

    in

    Een artikel in DeMorgen kopt: “Slimme software herleidt belastingcontroleurs ‘tot aapjes’”, en daaronder: “Digitale selectie zorgt voor ongelijke behandeling belastingplichtigen”. We begrijpen uit het artikel dat Financiën zich voor haar controles nu voor 80% baseert op risicoprofielen die door datamining naar voren worden geschoven, en dat dit tot grote frustratie leidt bij inspecteurs en controleurs.

    Continue reading→