[FR]

Data Quality : “Anomalies & Transactions Management System” (ATMS), prototype & “work in progress”

Posted on

2020-12-08

by

Isabelle Boydens

in [FR], Blog post

Cet article a été mis à jour le 20 novembre 2024.. En 2019, nous annoncions un Proof of Concept relatif à la mise en place ultérieure d’un service générique d’ATMS (Anomalies & Transactions Management System). Nous en rappelons ici les principales motivations en termes de Data Quality et de ROI, illustrées sur la base de use cases ainsi que les spécifications…
Continue reading→
Digital mailroom : Vers une plus grande automatisation de la salle de courrier avec l’intelligence artificielle

Posted on

2020-11-17

by

Katy Fokou

in [FR], Blog post

Les administrations reçoivent quotidiennement une grande quantité de documents sous forme électronique ou par courrier. Ces documents sont ensuite envoyés vers les services adéquats et/ou vers un système de gestion électronique documentaire après extraction de métadonnées. Ce processus de gestion électronique de documents commence par la numérisation c.-à-d. que les documents sont scannés et un
Continue reading→
Les graphes de connaissance : quelques applications

Posted on

2020-06-19

by

Katy Fokou

in [FR], Blog post

Le blog « Les graphes de connaissance, incontournable pour l’intelligence artificielle » publié précédemment sur ce site introduisait les « knowledge graphs » (ou graphes de connaissance) ainsi que leur potentiel. On poursuit ici en s’intéressant à quelques applications concrètes qui peuvent aider à identifier des use cases intéressants pour notre organisation. La recherche sémantique C’est une des premières
Continue reading→
Géocodage : contourner les lacunes d’OpenStreetMap (partie 2)

Posted on

2020-05-05

by

Vandy Berten

in [FR], Blog post

Dans notre article précédent, nous présentions les difficultés que nous avons rencontrées dans notre tentative de géocoder (convertir une adresse en coordonnées géographiques, et standardiser cette adresse) avec Nominatim, le géocodeur d’OpenStreetMap. Nous avons aussi évoqué qu’en modifiant légèrement les adresses que Nominatim n’avait par reconnues, elles le devenaient. Nous avons considéré un ensemble de
Continue reading→
Les graphes de connaissance, incontournable pour l’intelligence artificielle

Posted on

2020-04-22

by

Katy Fokou

in [FR], Blog post

La technologie des graphes a déjà été abordée dans des articles précédents [1] [2] qui mettaient en évidence l’utilité des graphes pour l’analyse de réseaux dans le cadre de la recherche de comportements frauduleux. En effet, de façon générale, les graphes sont relativement faciles à développer et à “comprendre” ce qui en fait un des
Continue reading→
Géocodage : contourner les lacunes d’OpenStreetMap (partie 1)

Posted on

2020-02-17

by

Vandy Berten

in [FR], Blog post

Pour divers clients, nous avons été à la recherche d’une solution permettant de nettoyer (standardiser) des adresses postales, principalement en Belgique. Nous avions besoin d’une solution « on-premise », idéalement en Open-Source. Nous avons voulu construire une solution basée sur OpenStreetMap, qui permettait de rencontrer ces deux contraintes. Mais il s’est vite avéré qu’OpenStreetMap n’était
Continue reading→
Named Entity Recognition : une application pratique du NLP

Posted on

2019-12-06

by

Katy Fokou

in [FR], Blog post

Dans le secteur public, les administrations font face à un nombre considérable de documents à gérer. Ces documents doivent être indexés et organisés tel qu’il soit possible de retrouver facilement de l’information. Dans ce contexte le NER ou Named Entity Recognition, une technique basée sur le machine learning et le Natural Language Processing (NLP), est
Continue reading→
NLP & modèles de langage

Posted on

2019-11-06

by

Katy Fokou

in [FR], Blog post

Ce blog introduit les modèles de langage statistiques qui sont nécessaires à la résolution de nombreux problèmes liés au traitement automatique du langage naturel ou NLP (Natural Language Processing). Parmi ces problèmes, on peut citer la traduction automatique, la reconnaissance vocale, les systèmes de questions-réponses, l’optical character recognition (OCR) et les problèmes de génération de
Continue reading→
Data quality : mesurer la similarité interne

Posted on

2019-09-05

by

Vandy Berten

in [FR], Blog post

Dans notre article précédent, nous présentons une méthode permettant de mesurer et visualiser l’importance des valeurs rares dans une liste de données où l’on s’attend à une grande redondance, souvent signes d’un problème de qualité. La méthode en question se basait uniquement sur un comptage des occurrences des valeurs, sans du tout en examiner le
Continue reading→
Data Quality : mesurer les valeurs rares

Posted on

2019-05-09

by

Vandy Berten

in [FR], Blog post

Des données, à partir du moment où elles vivent et sont alimentées, souffrent presque systématiquement de problèmes de qualité. Le domaine de la Qualité des données (Data Quality) est vaste, très actif tant dans le monde académique qu’industriel. Il y a bien évidemment des aspects méthodologiques (améliorer les processus pour que les données qui rentrent
Continue reading→