Honey, I scraped the kids – over taalmodellen en privacy

Through the looking glass

De datasets die ten grondslag liggen van enorme taalmodellen zijn zonder veel poespas gescraped van het internet. Een korte zoektocht naar persoonsgebonden gegevens hierin, brengt al snel heel wat boven water. Continue reading

Data Quality Tools : retours d’expérience et nouveautés

Isabelle Boydens(*), Isabelle Corbesier(**) et Gani Hamiti(**) (*) Data Quality Expert, Research Team (**) Data Quality Analyst, Databases Team La problématique de la qualité des données (ou “fitness for use“, adéquation aux usages) est maintenant reconnue au plan international comme … Continue reading

Data Quality : “Anomalies & Transactions Management System” (ATMS), prototype & “work in progress”

ATMS

Isabelle Boydens(*), Gani Hamiti(**), Rudy Van Eeckhout(***) (*) Data Quality Expert, Research Team (**) Data Quality Analyst, Databases Team (***) Databases R&D, Databases Team En 2019, nous annoncions un Proof of Concept relatif à la mise en place ultérieure d’un … Continue reading

Géocodage : contourner les lacunes d’OpenStreetMap (partie 2)

Dans notre article précédent, nous présentions les difficultés que nous avons rencontrées dans notre tentative de géocoder (convertir une adresse en coordonnées géographiques, et standardiser cette adresse) avec Nominatim, le géocodeur d’OpenStreetMap. Nous avons aussi évoqué qu’en modifiant légèrement les … Continue reading

Géocodage : contourner les lacunes d’OpenStreetMap (partie 1)

Pour divers clients, nous avons été à la recherche d’une solution permettant de nettoyer (standardiser) des adresses postales, principalement en Belgique. Nous avions besoin d’une solution « on-premise », idéalement en Open-Source. Nous avons voulu construire une solution basée sur … Continue reading

E-discovery to the rescue

E-discovery is een algemene term voor technieken en software waarmee men informatie wil ontdekken in grote hoeveelheden heterogene documenten. Typische contexten waarin e-discovery wordt toegepast zijn gerechtelijke onderzoeken, onderzoeksjournalistiek, audits, of aanvragen in het kader van wetten op openbaarheid van bestuur. Continue reading

Anomalies & Transactions Management System (ATMS) : enjeux, concepts, réalisations et travail en cours

Cet article de blog a pour objet d’introduire le concept d’ATMS (Anomalies & Transactions Management System) : après en avoir montré l’importance fondamentale dans le cadre du « back tracking »  récemment évoqué dans un article de blog de mai 2018, nous en … Continue reading