Slides van de webinar voor InfoSecurity op 31/03/2021
Natural Language processing technologieën gebruiken we ondertussen dagelijks, in de vorm van chatbots en virtuele assistenten – denk Siri of Google Assistant – of in tools gaande van autocomplete tot automatische vertaling. In het Engels werkt dat vrij goed; Nederlands blijft moeilijker maar er is toch ook snelle vooruitgang. Hoe kan je nu zelf een systeem maken voor herkenning van entiteiten in Nederlandstalige documenten? Met een focus op tekst (spraak is voor een andere keer), werken we een praktisch voorbeeld uit waarvoor we gebruik maken van openlijk beschikbare documenten en open source componenten.
Les technologies de traitement du langage naturel sont désormais utilisées quotidiennement, sous la forme de chatbots et d'assistants virtuels - pensez à Siri ou Google Assistant - ou dans des outils allant de l'autocomplétion à la traduction automatique. En anglais, cela fonctionne assez bien; le néerlandais reste plus difficile mais les progrès sont rapides. Alors comment faire un système de reconnaissance des entités dans les documents néerlandais ? En nous concentrant sur le texte (la parole est pour une autre fois), nous élaborons un exemple pratique en utilisant des documents librement disponibles et des composants open source.
Languages: | Nederlands |
Author: | Joachim Ganseman |
Category: | Presentation |
Date: | 2021/04 |
License: | CC Attribution-NonCommercial-ShareAlike |
Keywords: | Artificial Intelligence, Open Source Software, NLP, NER |
Download: | Download |