Typologie van de anomalieën, een kader voor actie: de case van machine learning

De kwaliteit van een gegeven is de geschiktheid ervan voor gebruik en voor de beoogde doelstellingen (‘fitness for use’) (Boydens, 1999, Boydens 2014). In dit artikel gaan we bekijken hoe een rigoureuze typologie van de anomalieën een kader biedt voor de verbetering van de kwaliteit van de gegevens, in verschillende domeinen, waaronder machine learning. Continue reading

Typologie des anomalies, un cadre pour l’action : le cas du machine learning

La qualité d’une donnée désigne son adéquation aux usages et objectifs visés (« fitness for use ») (Boydens, 1999, Boydens 2014). Dans cet article nous allons voir comment une typologie rigoureuse des anomalies offre un cadre pour l'amélioration de la qualité des données, dans de nombreux domaines, dont le machine learning. Continue reading

Cours-conférence "Data Quality Tools", ULB, 13 mars 2019, par Gani Hamiti, Smals

Gani Hamiti donnera un cours-conférence à l’ULB le 13 mars 2019 de 18 heures à 20 heures, suivi d’une réception. Dans le cadre du cours STIC-B-510 « Qualité de l’information et des documents numériques » de la filière STIC de l’Université libre de Bruxelles, Gani … Continue reading

Gérer les doublons dans une Graph Database

Dans nos blogs précédents (1, 2, 3, 4), nous avons mis en évidence le fait que les structures de graphes étaient très adaptées à la recherche de comportement frauduleux. En étant plongés quotidiennement dans des données issues de diverses bases … Continue reading

Data simplification and abstraction (Part II) : pistes opérationnelles & ROI

Dans son rapport publié le 27 août 2015, l'ASA (Agence pour la Simplification Administrative) - DAV (Dienst Administratieve Vereenvouding) indique que les "les charges administratives ont connu une diminution globale en 2014 d'environ 400 millions d'euros" en Belgique, notamment via l'adoption … Continue reading

"Mapping the World of Data Problems" : la qualité des données vue par la communauté IT

 En novembre 2012, O’Reilly Media a édité un “livre-événement” en matière de "data quality" : Q. E. McCallum, Bad Data Handbook, Mapping the World of Data Problems, O’Reilly Media, 2012, 246 p. Cet ouvrage collectif  sur la qualité des données est … Continue reading