“Data Observability”, een nieuwe topic in het “Data Quality” landschap?

In de afgelopen twee jaar zijn er steeds meer tools voor “data observability” verschenen: voegen ze waarde toe aan het landschap van gegevenskwaliteit? Wat zijn hun potentiële functies met betrekking tot preventieve en curatieve benaderingen van gegevenskwaliteit? Hoe volwassen zijn deze tools op dit moment? Continue reading

Introductie tot de nieuwe eHealth pseudonimiseringsdienst

Heel wat systemen in de publieke sector bewaren gevoelige persoonsgegevens. We dienen te vermijden dat een interne of externe aanvaller die gegevens kan koppelen aan natuurlijke personen. Een waardevolle maatregel daarbij is om de gegevens niet langer onder rijksregisternummers maar onder pseudoniemen te bewaren. Dit artikel is een introductie tot een nieuwe eHealth pseudonimiseringsdienst, uitgedacht door Smals Research, die een bijzonder hoog niveau van veiligheid verschaft. Continue reading

LLMs voor code: the Good, the Bad and the Ugly

Om GPT-3 in te zetten als codegenerator moet je geschikte voorbeelden geven als prompt.

Wat is de stand van zaken wat betreft het genereren van code, en waar moeten we nog rekening mee houden? AI-assistenten of -plugins voor IDEs zijn een zegen voor wie ze goed kan aanwenden, maar komen, zoals alle AI-systemen, ook met de nodige caveats. Continue reading

Een eigen vraag- en antwoordsysteem op basis van taalmodellen

Naar aanleiding van de lancering van ChatGPT duiken er massaal tools op die toelaten om vragen te beantwoorden over je eigen content. Het wordt heel eenvoudig voorgesteld: upload je documenten (PDF, Word, etc.) en je kan quasi onmiddellijk vragen beginnen stellen, typisch in een chatbot-achtige omgeving.

In dit artikel geven we aan hoe zo’n question answering systeem in elkaar steekt en vertellen we wat meer over de kwaliteit die we kunnen verwachten van de output. Continue reading