Typologie des anomalies, un cadre pour l’action : le cas du machine learning

La qualité d’une donnée désigne son adéquation aux usages et objectifs visés (« fitness for use ») (Boydens, 1999, Boydens 2014). Dans cet article nous allons voir comment une typologie rigoureuse des anomalies offre un cadre pour l’amélioration de la qualité des données, dans de nombreux domaines, dont le machine learning. Continue reading

Machine Learning : data quality challenges in the scope of a “fitness for use” (ULB, 18/05/22, 14h, on line)

La prochaine journée FNRS “Analyse critique et amélioration de la qualité de l’information numérique” aura lieu le 18 mai de 14h à 15h30 en mode on line.    Le thème cette année, « Apprentissage automatique (ML) : les challenges de la qualité … Continue reading

Data Quality Tools : retours d’expérience et nouveautés

Isabelle Boydens(*), Isabelle Corbesier(**) et Gani Hamiti(**) (*) Data Quality Expert, Research Team (**) Data Quality Analyst, Databases Team La problématique de la qualité des données (ou “fitness for use“, adéquation aux usages) est maintenant reconnue au plan international comme … Continue reading

Data Quality : “Anomalies & Transactions Management System” (ATMS), prototype & “work in progress”

ATMS

En 2019, nous annoncions un Proof of Concept relatif à la mise en place ultérieure d’un service générique d’ATMS (Anomalies & Transactions Management System). Nous en rappelons ici les principales motivations en termes de Data Quality et de ROI, illustrées sur la base de use cases ainsi que les spécifications fonctionnelles. Nous en développerons ensuite les avancées sur le plan technique et en évoquerons les perspectives de développement ultérieur. Continue reading

Data Quality: “Anomalies & Transactions Management System” (ATMS), prototype & “work in progress”

In 2019 kondigden we een Proof of Concept aan voor de latere invoering van een generieke ATMS service (Anomalies & Transactions Management System). We halen hier opnieuw de voornaamste redenen aan op het vlak van Data Quality en  ROI, aangetoond met use cases alsook de functionele specificaties. Vervolgens gaan we van daaruit over op de  technische voortgang en bespreken we de verdere ontwikkelperspectieven. Continue reading

Géocodage : contourner les lacunes d’OpenStreetMap (partie 2)

Dans notre article précédent, nous présentions les difficultés que nous avons rencontrées dans notre tentative de géocoder (convertir une adresse en coordonnées géographiques, et standardiser cette adresse) avec Nominatim, le géocodeur d’OpenStreetMap. Nous avons aussi évoqué qu’en modifiant légèrement les … Continue reading

Géocodage : contourner les lacunes d’OpenStreetMap (partie 1)

Pour divers clients, nous avons été à la recherche d’une solution permettant de nettoyer (standardiser) des adresses postales, principalement en Belgique. Nous avions besoin d’une solution « on-premise », idéalement en Open-Source. Nous avons voulu construire une solution basée sur … Continue reading

« I want to talk to a HUMAN! » : impact de la qualité des bases de connaissances sur les chatbots (29/01/2020, ULB)

Rencontre « Data quality » FNRS-ULB-Smals le 29/01/2020 à l’Université libre de Bruxelles La prochaine réunion du groupe de contact FNRS « Analyse critique et amélioration de la qualité de l’information numérique » se tiendra le mercredi 29 janvier 2020 dès 13h30 à l’Université libre … Continue reading