data quality


  • Data quality : mesurer la similarité interne

    Data quality : mesurer la similarité interne

    Posted on

    by

    in ,

    Dans notre article précédent, nous présentons une méthode permettant de mesurer et visualiser l’importance des valeurs rares dans une liste de données où l’on s’attend à une grande redondance, souvent signes d’un problème de qualité. La méthode en question se basait uniquement sur un comptage des occurrences des valeurs, sans du tout en examiner le contenu.  Classiquement, pour standardiser des…

    Continue reading→


  • Data Quality : mesurer les valeurs rares

    Data Quality : mesurer les valeurs rares

    Posted on

    by

    in ,

    Des données, à partir du moment où elles vivent et sont alimentées, souffrent presque systématiquement de problèmes de qualité. Le domaine de la Qualité des données (Data Quality) est vaste, très actif tant dans le monde académique qu’industriel. Il y a bien évidemment des aspects méthodologiques (améliorer les processus pour que les données qui rentrent soient les plus “propres” possible),…

    Continue reading→


  • Anomalies & Transactions Management System (ATMS) : enjeux, concepts, réalisations et travail en cours

    Anomalies & Transactions Management System (ATMS) : enjeux, concepts, réalisations et travail en cours

    Posted on

    by

    in ,

    Cet article de blog a pour objet d’introduire le concept d’ATMS (Anomalies & Transactions Management System) : après en avoir montré l’importance fondamentale dans le cadre du « back tracking »  récemment évoqué dans un article de blog de mai 2018, nous en rappelons les principales références ; nous en évoquons ensuite les concepts généralisables, le ROI, l’originalité ainsi que les premières implémentations d’envergure…

    Continue reading→


  • Cours-conférence “Data Quality Tools”, ULB, 13 mars 2019, par Gani Hamiti, Smals

    Cours-conférence “Data Quality Tools”, ULB, 13 mars 2019, par Gani Hamiti, Smals

    Posted on

    by

    in

    Gani Hamiti donnera un cours-conférence à l’ULB le 13 mars 2019 de 18 heures à 20 heures, suivi d’une réception. Dans le cadre du cours STIC-B-510 « Qualité de l’information et des documents numériques » de la filière STIC de l’Université libre de Bruxelles, Gani Hamiti, Data Quality Analyst chez Smals, donnera un cours-conférence intitulé « Data Quality Tools : concepts and practical lessons from a vast operational…

    Continue reading→


  • Data Quality & « back tracking » : depuis les premières expérimentations à la parution d’un Arrêté Royal

    Data Quality & « back tracking » : depuis les premières expérimentations à la parution d’un Arrêté Royal

    Posted on

    by

    in ,

    Thomas Redman compare une base de donnée à un lac, alimenté par des flux aquatiques continus. La métaphore illustre l’approche qui sera évoquée dans ce blog en vue d’améliorer la qualité des données. 1. Les enjeux de  la qualité des données : rappel et exemple En effet, nettoyer “à l’infini” le fond du lac (via des algorithmes de “data cleansing”) n’est pas efficace…

    Continue reading→


  • La préservation du patrimoine scientifique à l’heure du numérique (31/01/2018, ULB)

    La préservation du patrimoine scientifique à l’heure du numérique (31/01/2018, ULB)

    Posted on

    by

    in

    Rencontre « Data quality » FNRS-ULB-Smals le 31/01/2018 à l’Université libre de Bruxelles La dernière réunion du groupe de contact FNRS « Analyse critique et amélioration de la qualité de l’information numérique » a eu lieu  mercredi 31 janvier 2018 à l’Université libre de Bruxelles (auditoire AY2.108, bâtiment A, campus du Solbosch). Téléchargez les slides d’Isabelle Boydens (1MB) et d’Anthony Leroy (16MB). Pluridisciplinaire, le groupe se situe au confluent…

    Continue reading→


  • Gérer les doublons dans une Graph Database

    Gérer les doublons dans une Graph Database

    Posted on

    by

    in ,

    Dans nos blogs précédents (1, 2, 3, 4), nous avons mis en évidence le fait que les structures de graphes étaient très adaptées à la recherche de comportement frauduleux. En étant plongés quotidiennement dans des données issues de diverses bases de données officielles, nous sommes également confrontés en permanence à la présence d’une grande quantité d’information de mauvaise qualité (1,…

    Continue reading→


  • La préservation du patrimoine scientifique à l’heure du numérique (31/01/2018, ULB)

    La préservation du patrimoine scientifique à l’heure du numérique (31/01/2018, ULB)

    Posted on

    by

    in ,

    Rencontre « Data quality » FNRS-ULB-Smals le 31/01/2018 à l’Université libre de Bruxelles La prochaine réunion du groupe de contact FNRS « Analyse critique et amélioration de la qualité de l’information numérique » se tiendra le mercredi 31 janvier 2018 à 14h00 à l’Université libre de Bruxelles (auditoire AY2.108, bâtiment A, campus du Solbosch). Téléchargez les slides d’Isabelle Boydens (1MB) et d’Anthony Leroy (16MB). Pluridisciplinaire, le groupe se situe…

    Continue reading→


  • Rencontre « Data quality » FNRS-ULB-Smals le 26/05/2017 à l’Université Libre de Bruxelles

    Rencontre « Data quality » FNRS-ULB-Smals le 26/05/2017 à l’Université Libre de Bruxelles

    Posted on

    by

    in

    La prochaine réunion du groupe de contact FNRS « Analyse critique et amélioration de la qualité de l’information numérique » se tiendra le vendredi 26 mai 2017 à 14h00 à l’Université Libre de Bruxelles (auditoire AY 2 108, bâtiment A campus du Solbosch). Nous aborderons cette année le thème de la qualité des données dans les systèmes embarqués :  “Temps réel, déterminisme et ordonnancement : trois défis majeurs des systèmes embarqués”. Joël Goossens, Professeur…

    Continue reading→


  • Rencontre « Data quality » FNRS-ULB-Smals le 11/05/2016 à l’Université Libre de Bruxelles

    Rencontre « Data quality » FNRS-ULB-Smals le 11/05/2016 à l’Université Libre de Bruxelles

    Posted on

    by

    in

    Téléchargez les slides d’Isabelle Boydens (1 MB) et d’Anthony Cleve (30 MB). ————————————————————————————————— La prochaine réunion du groupe de contact FNRS « Analyse critique et amélioration de la qualité de l’information numérique » se tiendra le mercredi 11 mai 2016 à 14h00 à l’Université Libre de Bruxelles (auditoire AY 2 108, bâtiment A campus du Solbosch). Nous aborderons cette année le thème suivant :  « Analyzing the evolution history of…

    Continue reading→