“Data Observability”, een nieuwe topic in het “Data Quality” landschap?

In de afgelopen twee jaar zijn er steeds meer tools voor “data observability” verschenen: voegen ze waarde toe aan het landschap van gegevenskwaliteit? Wat zijn hun potentiële functies met betrekking tot preventieve en curatieve benaderingen van gegevenskwaliteit? Hoe volwassen zijn deze tools op dit moment? Continue reading

“Data Observability”, un nouveau topic dans le paysage “Data Quality” ?

Depuis deux ans apparaissent des outils de “data observability” : ont-ils une valeur ajoutée dans le paysage “data quality” ? Quelles sont leurs fonctionnalités potentielles par rapport aux approches “data quality” préventives et curatives ? Quelle est la maturité actuelle de ces outils ? Continue reading

Geocodering: welke tool voor welke behoefte?

Om een adres te kunnen plaatsen op een kaart, om een reisweg uit te stippelen of om alle winkels in een bepaalde wijk te bepalen, moet er eerst een belangrijke stap genomen worden: geocodering. Deze handeling houdt in dat een postadres zoals “Av. Fonsny 20, 1060 Bruxelles” enerzijds “gestandaardiseerd” kan worden (bordeaux gedeelte van onderstaande afbeelding), en anderzijds dat deze geografische coördinaten toegewezen krijgt (“location” in de afbeelding). Continue reading

Typologie van de anomalieën, een kader voor actie: de case van machine learning

De kwaliteit van een gegeven is de geschiktheid ervan voor gebruik en voor de beoogde doelstellingen (‘fitness for use’) (Boydens, 1999, Boydens 2014). In dit artikel gaan we bekijken hoe een rigoureuze typologie van de anomalieën een kader biedt voor de verbetering van de kwaliteit van de gegevens, in verschillende domeinen, waaronder machine learning. Continue reading

Géocodage : quel outil pour quel besoin ?

Pour être capable de positionner une adresse sur une carte, pour calculer un itinéraire ou pour identifier l’ensemble des commerces dans un quartier donné, il est nécessaire de passer par une étape fondamentale : le géocodage. Cette opération consiste, à partir d’une adresse postale, comme “Av. Fonsny 20, 1060 Bruxelles”, d’une part à la “standardiser” (partie bordeaux de l’image ci-dessous), d’autre part à lui assigner des coordonnées géographiques (“location” dans l’image).   Continue reading

Typologie des anomalies, un cadre pour l’action : le cas du machine learning

La qualité d’une donnée désigne son adéquation aux usages et objectifs visés (« fitness for use ») (Boydens, 1999, Boydens 2014). Dans cet article nous allons voir comment une typologie rigoureuse des anomalies offre un cadre pour l’amélioration de la qualité des données, dans de nombreux domaines, dont le machine learning. Continue reading

Machine Learning : data quality challenges in the scope of a “fitness for use” (ULB, 18/05/22, 14h, on line)

La prochaine journée FNRS “Analyse critique et amélioration de la qualité de l’information numérique” aura lieu le 18 mai de 14h à 15h30 en mode on line.    Le thème cette année, « Apprentissage automatique (ML) : les challenges de la qualité … Continue reading

Data Quality Tools : retours d’expérience et nouveautés

Isabelle Boydens(*), Isabelle Corbesier(**) et Gani Hamiti(**) (*) Data Quality Expert, Research Team (**) Data Quality Analyst, Databases Team La problématique de la qualité des données (ou “fitness for use“, adéquation aux usages) est maintenant reconnue au plan international comme … Continue reading