Honey, I scraped the kids – over taalmodellen en privacy

Through the looking glass

De datasets die ten grondslag liggen van enorme taalmodellen zijn zonder veel poespas gescraped van het internet. Een korte zoektocht naar persoonsgebonden gegevens hierin, brengt al snel heel wat boven water. Continue reading