[FR]
-
Data Quality : “Anomalies & Transactions Management System” (ATMS), prototype & “work in progress”
Cet article a été mis à jour le 20 novembre 2024.. En 2019, nous annoncions un Proof of Concept relatif à la mise en place ultérieure d’un service générique d’ATMS (Anomalies & Transactions Management System). Nous en rappelons ici les principales motivations en termes de Data Quality et de ROI, illustrées sur la base de use cases ainsi que les spécifications…
-
Digital mailroom : Vers une plus grande automatisation de la salle de courrier avec l’intelligence artificielle
Les administrations reçoivent quotidiennement une grande quantité de documents sous forme électronique ou par courrier. Ces documents sont ensuite envoyés vers les services adéquats et/ou vers un système de gestion électronique documentaire après extraction de métadonnées. Ce processus de gestion électronique de documents commence par la numérisation c.-à-d. que les documents sont scannés et un
-
Les graphes de connaissance : quelques applications
Le blog « Les graphes de connaissance, incontournable pour l’intelligence artificielle » publié précédemment sur ce site introduisait les « knowledge graphs » (ou graphes de connaissance) ainsi que leur potentiel. On poursuit ici en s’intéressant à quelques applications concrètes qui peuvent aider à identifier des use cases intéressants pour notre organisation. La recherche sémantique C’est une des premières
-
Géocodage : contourner les lacunes d’OpenStreetMap (partie 2)
Dans notre article précédent, nous présentions les difficultés que nous avons rencontrées dans notre tentative de géocoder (convertir une adresse en coordonnées géographiques, et standardiser cette adresse) avec Nominatim, le géocodeur d’OpenStreetMap. Nous avons aussi évoqué qu’en modifiant légèrement les adresses que Nominatim n’avait par reconnues, elles le devenaient. Nous avons considéré un ensemble de
-
Les graphes de connaissance, incontournable pour l’intelligence artificielle
La technologie des graphes a déjà été abordée dans des articles précédents [1] [2] qui mettaient en évidence l’utilité des graphes pour l’analyse de réseaux dans le cadre de la recherche de comportements frauduleux. En effet, de façon générale, les graphes sont relativement faciles à développer et à “comprendre” ce qui en fait un des
-
Géocodage : contourner les lacunes d’OpenStreetMap (partie 1)
Pour divers clients, nous avons été à la recherche d’une solution permettant de nettoyer (standardiser) des adresses postales, principalement en Belgique. Nous avions besoin d’une solution « on-premise », idéalement en Open-Source. Nous avons voulu construire une solution basée sur OpenStreetMap, qui permettait de rencontrer ces deux contraintes. Mais il s’est vite avéré qu’OpenStreetMap n’était
-
Named Entity Recognition : une application pratique du NLP
Dans le secteur public, les administrations font face à un nombre considérable de documents à gérer. Ces documents doivent être indexés et organisés tel qu’il soit possible de retrouver facilement de l’information. Dans ce contexte le NER ou Named Entity Recognition, une technique basée sur le machine learning et le Natural Language Processing (NLP), est
-
NLP & modèles de langage
Ce blog introduit les modèles de langage statistiques qui sont nécessaires à la résolution de nombreux problèmes liés au traitement automatique du langage naturel ou NLP (Natural Language Processing). Parmi ces problèmes, on peut citer la traduction automatique, la reconnaissance vocale, les systèmes de questions-réponses, l’optical character recognition (OCR) et les problèmes de génération de
-
Data quality : mesurer la similarité interne
Dans notre article précédent, nous présentons une méthode permettant de mesurer et visualiser l’importance des valeurs rares dans une liste de données où l’on s’attend à une grande redondance, souvent signes d’un problème de qualité. La méthode en question se basait uniquement sur un comptage des occurrences des valeurs, sans du tout en examiner le
-
Data Quality : mesurer les valeurs rares
Des données, à partir du moment où elles vivent et sont alimentées, souffrent presque systématiquement de problèmes de qualité. Le domaine de la Qualité des données (Data Quality) est vaste, très actif tant dans le monde académique qu’industriel. Il y a bien évidemment des aspects méthodologiques (améliorer les processus pour que les données qui rentrent
Keywords:
analytics Artificial intelligence big data blockchain BPM chatbot cloud computing cost cutting cryptography data center data quality development EDA egov Event GIS Information management Machine Learning Managing IT costs methodology Mobile Natural Language Processing Open Source Privacy Productivity Security social software design software engineering standards







