Research blog
-
Dédoublonnage et couplage : comment ça marche ?
Dans un article précédent à propos du webscraping, nous avons été confrontés à une situation où nous obtenions une liste de commerces, avec un nom et une adresse. Nous voulions, pour chacun de ces commerces, le lier à une liste de commerces “officielle”, à savoir celle de la Banque Carrefour des Entreprises, ayant une structure
-
Haystack – NLP framework for document search and QA
Haystack est une librairie Python open-source qui permet la construction de systèmes de questions-réponses (QA) et de systèmes de recherche sémantique de documents basé sur des modèles de langage type Transformer. Cette librairie intègre d’autres projets open-source tels que Elasticsearch, FAISS et HuggingFace. Haystack is een open-source Python library die toelaat om question answering en
-
De vier gezichten van EDA
Event Driven Architecture (EDA) is niet meer weg te schrijven uit moderne software-architectuur. Maar wanneer ben je nu effectief EDA aan het gebruiken? Soms kan het zijn dat dit paradigma in je software-systeem zit, zonder dat je er erg in hebt. En daarnaast gebeurt het ook vaak dat een architect zegt dat zijn systeem EDA
-
« Synthetic Data » – Webinar by Smals Research (december 01,2022)
“Fake it till you make it” : une introduction aux données synthétiques (Nederlandstalige tekst : zie onder) Un ensemble de données synthétiques est un ensemble de données fictives qui reproduit le plus fidèlement possible les caractéristiques d’un ensemble de données réelles. Un ensemble de données synthétiques correctement constitué peut, comme il s’agit de données purement fictives, être
-
Fake it till you make it – an introduction to synthetic data
Slides van de webinar voor Smals Academy op 01/12/2022 (texte français : voir ci-dessous) Een synthetische dataset is een fictieve dataset die de kenmerken van een echte dataset zo goed mogelijk nabootst. Een correct samengestelde synthetische dataset kan, omdat het om louter fictieve gegevens gaat, probleemloos gedeeld, hergebruikt of gepubliceerd worden. Zo kan de toegang tot
-
Tabula – Pdf-file Table Extractor
(NL) Tabula is een eenvoudige doch goed werkende tool om tabellen uit een pdf-bestand te halen. OCR is niet ondersteund, maar tabellen worden vrij goed automatisch gedetecteerd en de tool is ook goed integreerbaar. (FR) Tabula est un outil simple mais puissant pour extraire des tableaux d’un fichier PDF. L’OCR n’est pas pris en charge,
-
Opportuniteiten voor het verbeteren van de klantenondersteuning
Overal staan contactcenters onder druk om vragen van klanten, burgers en ondernemingen zo efficiënt mogelijk af te handelen. Wachttijden kunnen soms hoog oplopen, tot grote frustratie van wie zijn vraag beantwoord wil zien en antwoordverstrekkers die overstelpt worden en moeten omgaan met boze klanten. Elke sector kent pieken in het aantal vragen, afhankelijk van bepaalde
-
Speechly – Voice interface API
Speechly laat toe om spraak toe te voegen aan een toepassing, bijvoorbeeld voor het ingeven van gegevens of zoeken op basis van de stem. Daartoe biedt het een systeem voor spraakherkenning en natural language understanding (NLU): het herkennen van intents (wat wil de gebruiker?) en entiteiten (parameters zoals een datum of getal). Op vlak van
Keywords:
analytics Artificial intelligence big data blockchain BPM chatbot cloud computing cost cutting cryptography data center data quality development EDA egov Event GIS Information management Machine Learning Managing IT costs methodology Mobile Natural Language Processing Open Source Privacy Productivity Security social software design software engineering standards





