Smals Research

GEO: Zichtbaarheid van websites in het tijdperk van AI

Katy Fokou — Fri, 10 Jul 2026 15:04:42 +0000

Grote taalmodellen (LLM’s) veranderen geleidelijk de manier waarop wij online zoeken naar informatie. Google blijft momenteel de dominante zoekmachine, maar steeds meer gebruikers maken gebruik van generatieve AI-tools om een samenvattend antwoord op hun zoekopdrachten te verkrijgen. Deze ontwikkeling verandert de manier waarop merken, organisaties en overheidsinstanties hun inhoud op het web zichtbaar moeten maken. In deze context ontstaat een nieuw concept voor het optimaliseren van de zichtbaarheid van een website: Generative Engine Optimization, of GEO. In dit artikel geven wij een algemeen overzicht van GEO.

Basisbegrippen

Wat is GEO?

Zoekmachineoptimalisatie (SEO of Search Engine Optimization) was lange tijd de standaardmethode om de zichtbaarheid van een website in de zoekresultaten te verbeteren. Met de opkomst van generatieve AI is GEO echter naar voren gekomen als een nieuw optimalisatieparadigma. Het gaat om een reeks werkwijzen die erop gericht zijn de inhoud van een website te optimaliseren, zodat deze kan worden vermeld in de antwoorden die worden gegenereerd door AI-systemen zoals Google AI Overview, de Copilot Search-chatbot van Bing en ChatGPT. Terwijl traditionele zoekmachines een lijst met URL’s weergeven die op relevantie zijn gerangschikt, bieden generatieve machines een samengevat antwoord dat door een groot taalmodel wordt gegenereerd op basis van meerdere bronnen op het internet.

De evolutie van generatieve AI heeft het landschap van de zoekmachines ingrijpend veranderd door de introductie van nieuwe zoektools. Deze tools kunnen in twee groepen worden ingedeeld:

Traditionele zoekmachines, aangevuld met AI (AI Overviews): AI Overviews of AI-overzichten zijn in zoekmachines geïntegreerde functies die een samengevat antwoord op de zoekopdracht van de gebruiker bieden. In Google Search verschijnen deze overzichten bovenaan de resultatenpagina en genereren ze een samenvatting met citaten uit verschillende bronnen.
Zoekplatforms die from scratch met AI zijn ontworpen: deze chatbots stellen gebruikers in staat om iteratief te zoeken door aanvullende vragen te stellen. De links naar de bronnen zijn rechtstreeks in de gegenereerde antwoorden geïntegreerd. Enkele voorbeelden hiervan zijn zijn Perplexity AI, Gemini, Microsoft Copilot en ChatGPT.

Voorbeeld van een AI Overview in de Google-zoekmachine

De impact van generatieve AI op het zoeken op internet

Generatieve zoekmachines brengen ingrijpende veranderingen teweeg in het gedrag van gebruikers en in de zoeklogica.

Voorkeur voor samenvattingen boven klikken

Een belangrijke verandering is de toenemende voorkeur van gebruikers voor samengevatte antwoorden in plaats van links. Gebruikers verwachten steeds vaker nauwkeurige en contextuele antwoorden, die rechtstreeks door de AI worden geleverd; zoeken wordt steeds meer een gesprek in plaats van een cyclus van zoekopdracht-resultaten-klikken.

Verlies van gebruikerstracking

Generatieve zoekmachines vormen een grote uitdaging op het gebied van gebruikerstracking. In tegenstelling tot traditionele webanalysetools bieden deze platforms doorgaans geen toegang tot bepaalde technische data, zoals het IP-adres en het surfgedrag van gebruikers. Hierdoor wordt het moeilijker om het traject van gebruikers nauwkeurig te doorgronden, hun betrokkenheid te meten en de aangeboden ervaring te personaliseren.

De anonimisering van de gebruiker vormt een groter probleem voor commerciële bedrijven dan voor overheidsinstellingen. Wel gaat waardevolle informatie verloren, zoals het soort vragen dat burgers stellen en het (anonieme) gebruik van de website.

Controleverlies over de informatie die aan burgers en bedrijven wordt verstrekt

De informatie die op de websites van overheidsinstellingen aan bedrijven en burgers ter beschikking wordt gesteld kan subtiel en complex zijn, vooral als deze van juridische aard is. Dit kan het voor AI-modellen moeilijk maken om deze informatie te begrijpen, waardoor zij onjuiste antwoorden zouden genereren.

Belangrijkste verschillen tussen SEO en GEO

Terwijl SEO zich baseert op trefwoorden om de positie te verbeteren en verkeer naar een website te leiden, staat bij GEO de inhoud centraal. GEO heeft tot doel de zichtbaarheid in door AI gegenereerde samenvattingen te optimaliseren (zichtbaarheid op basis van vermeldingen), in plaats van zich uitsluitend te richten op de positie (ranking). De inhoud moet bijgevolg van hoge kwaliteit zijn en zodanig gestructureerd zijn dat deze gemakkelijk door een LLM kan worden geïnterpreteerd.

SEO-paradigma	GEO-paradigma
Doel: verkeer genereren naar specifieke URL’s door middel van positionering in de resultatenpagina’s van zoekmachines. ‘Klikgeoptimaliseerde’ inhoud creëren.	Doel: geciteerd worden in een door AI gegenereerde samenvatting.
Overeenstemming tussen zoekopdracht en website: trefwoorden, autoriteit van inkomende links.	Overeenstemming tussen zoekopdracht en website: semantische gelijkenis tussen de zoekopdracht en de inhoud van de website.
Resultaat: lijst met aanklikbare links.	Resultaat: samenvatting met citaten, gebaseerd op meerdere bronnen.
Betrokkenheid van gebruikers: gebruikers klikken en bezoeken verschillende websites.	Gebruikersbetrokkenheid: gebruikers ontvangen een samengevat antwoord en klikken op de geciteerde bronnen of gaan een gesprek aan met de AI.
Prestatiemeting: positie in de ranglijst en klikfrequentie.	Prestatiemeting: citatiefrequentie, dat wil zeggen de frequentie waarmee een website wordt gebruikt als referentie ter onderbouwing van beweringen in de door AI gegenereerde samenvatting.

Opmerking: binnen het kader van GEO hebben duidelijkheid, structuur en semantische rijkdom voorrang op de dichtheid van trefwoorden of backlinks. SEO blijft echter het fundament waarop elke GEO-strategie moet rusten.

Van zoekopdracht tot antwoord: hoe werkt generatief zoeken?

Het generatieproces van AI-overzichten zoals die verschijnen in de zoekmachine van Google volgt een vergelijkbaar patroon als dat van Retrieval-Augmented Generation (RAG). De algemene principes die hieronder worden beschreven, kunnen echter ook worden toegepast op andere zoekmachines die gebaseerd zijn op generatieve AI. Het genereren van deze overzichten verloopt volgens de volgende stappen::

Ontleding van de zoekopdracht (Query fan-out): de door de gebruiker ingediende zoekopdracht wordt opgesplitst in kleinere deelzoekopdrachten.
Retrieval: voor elke deelzoekopdracht wordt de traditionele webindex doorzocht om inhoud te identificeren die relevant is voor die deelzoekopdracht.
Filtering: de bronnen worden beoordeeld en gefilterd op basis van Experience, Expertise, Authority en Trustworthiness (E-E-A-T).
Herrangschikking (Reranking): de bronnen worden opnieuw gerangschikt op basis van hun uiteindelijke relevantie.
Samenvatting van het antwoord: genereren van de definitieve samenvatting.

Wat activeert de AI overviews?

AI overviews worden niet bij elke zoekopdracht geactiveerd en zijn afhankelijk van de aard van de vraag van de gebruiker. Volgens Google worden AI-overzichten geactiveerd wanneer de vragen complex zijn, meerdere afzonderlijke zoekopdrachten zouden vereisen en de zoekmachine veel vertrouwen heeft in de kwaliteit van de antwoorden.

In de regel wordt het antwoord gegenereerd voor de volgende soorten vragen:

Zoekopdrachten voor algemene informatie: hoe, wat, waarom
Vergelijkingen en advies

Voorbeelden van zoekopdrachten die wel of niet de AI overview activeren

Vraag	AI overview gegenereerd?
GEO-tools (productzoekopdracht)	No
What are the best tools for geo (“wat”)	Yes
How does generative engine impact public health compared to traditional search engine (complexe vraag)	Yes
jupyter notebook (zoeken product)	No
jupyter notebook versus marimo (vergelijking)	Yes
what is the capital of India (factuele kennis)	No

Strategie voor het optimaliseren van websites voor generatieve AI

Leveranciers van generatieve zoekmachines geven geen duidelijke optimalisatieregels en hun algoritmen zijn ondoorzichtig. In zijn documentatie over AI-overzichten geeft Google aan dat AI-functionaliteiten in grote lijnen op dezelfde principes berusten als de klassieke Google-zoekfunctie. Pagina’s moeten daarom voldoen aan de technische vereisten van de zoekmachine, zich houden aan het geldende zoekbeleid voor de toepassing en de essentiële SEO-praktijken vooropstellen, met name wat betreft het produceren van nuttige, betrouwbare en in de eerste plaats voor gebruikers ontworpen inhoud.

Door verschillende gespecialiseerde bronnen te raadplegen, kunnen wij echter de volgende best practices vaststellen.

Inhoud en vorm

Onderstaand advies is niet exhaustief, maar omvat de meest effectieve werkwijzen om de zichtbaarheid van inhoud te verbeteren. Het doel is om pagina’s voor AI-systemen gemakkelijker vindbaar, begrijpelijk en bruikbaar te maken.

Versterk de E-E-A-T-signalen: benadruk de ervaring, expertise, autoriteit en betrouwbaarheid van de inhoud.
- Citeer betrouwbare externe bronnen en verwijs, indien relevant, naar erkende instanties op het betreffende gebied.
- Werk de pagina’s regelmatig bij.
- Onderbouw met feitelijke elementen, zoals statistieken, kwantitatieve data of concrete voorbeelden.
Bied nuttige en onderscheidende inhoud aan: publiceer informatie met een hoge toegevoegde waarde.
Versterk de externe geloofwaardigheid: zorg voor inkomende links van erkende websites op dit gebied.
Verrijk de inhoud op semantisch vlak: gebruik nauwkeurige woordkeuze, vermijd dubbelzinnige formuleringen en organiseer de informatie rond vragen die gebruikers zich zouden kunnen stellen (in de vorm van een FAQ).

Structuur

Om ervoor te zorgen dat webcrawlers de inhoud gemakkelijk kunnen vinden, moet deze zo zijn ontworpen dat deze machinaal leesbaar is (machine-readable):

De inhoud in korte alinea’s structureren: de inhoud moet worden georganiseerd in afzonderlijke en semantisch onafhankelijke eenheden. De inhoud moet zo gestructureerd zijn dat deze direct antwoord geeft op vragen als “hoe doe ik dat“, “waarom“ of “wat zijn“ …
Gebruik Schema Markup (schema.org): de semantische markup biedt de AI een expliciete context voor een beter begrip en een betere opvraging van de informatie.
Gebruik een zeer gestructureerd HTML-formaat: maak gebruik van een strikte hiërarchie van tags (H1, H2, H3, lijsten, enz.) om de relaties tussen entiteiten te definiëren.

Voorbeeld van een webpagina die is gestructureerd in FAQ-formaat.

Goed om te weten

Overheidsinstellingen worden door zoekmachines beschouwd als betrouwbare en gezaghebbende bronnen.

Zoekmachines vormen geen monolithisch geheel. Sommige generatieve zoekmachines geven de voorkeur aan citaten, terwijl andere de nadruk leggen op de kwaliteit van de bron. Bovendien kunnen updates van de onderliggende LLM’s strategieën voor zichtbaarheid ongeldig maken.

Sociale media, YouTube en Reddit zijn belangrijke bronnen voor AI; het is voor overheidsinstellingen van belang om hun informatiekanalen naar burgers te diversifiëren.

Voor meer informatie over concrete praktijken voor website-optimalisatie kunt u de website https://elasticms.fgov.be/fr/news raadplegen.

Moeten institutionele websites kiezen voor een GEO-strategie of voor een chatbot? Experts beantwoorden deze vraag tijdens een rondetafelgesprek georganiseerd door het AI-competentiecentrum van Smals. U kunt de opname hier terugvinden.

Hoe de efficiëntie van een GEO-strategie meten?

In enkele maanden tijd zijn er talrijke tools op de markt verschenen die organisaties helpen om hun vermelding of weergave in door AI gegenereerde antwoorden te optimaliseren. Ook verschillende SEO-platforms integreren dit soort functionaliteiten inmiddels in hun pakketten.

Deze oplossingen zijn echter voornamelijk gericht op marketingteams die verantwoordelijk zijn voor het promoten van een merk en het meten van de zichtbaarheid daarvan. Hun indicatoren en toepassingen zijn daarom niet altijd direct toepasbaar in de context van de overheidssector, waar het promoten van een merk minder belangrijk is dan het verspreiden van betrouwbare, officiële en voor de burger gemakkelijk toegankelijke informatie.

Concreet beoordelen GEO-tools de zichtbaarheid van een organisatie door een groot aantal standaardzoekopdrachten in te voeren op platforms zoals ChatGPT, Google Search of Perplexity. Vervolgens analyseren zij de gegenereerde antwoorden om vast te stellen of de organisatie wordt genoemd, in welke context zij verschijnt en welke plaats zij inneemt ten opzichte van andere bronnen. Deze analyses maken het mogelijk om verschillende nuttige indicatoren te volgen voor het beoordelen en verbeteren van de zichtbaarheid in de door AI gegenereerde antwoorden:

Het citatiepercentage, dat wil zeggen de frequentie waarmee de website of de organisatie als bron wordt gebruikt;
De ‘share of voice’, die de aanwezigheid van de organisatie meet ten opzichte van andere genoemde bronnen;
De positie in het antwoord, bijvoorbeeld wanneer de website als primaire bron of als secundaire referentie wordt vermeld;
De toon van het antwoord, om vast te stellen of de formulering van het antwoord positief of negatief is.

Hieronder vind je een lijst met enkele platforms voor het optimaliseren van de zichtbaarheid:

Conclusie en aanbevelingen

Optimalisatie voor generatieve zoekmachines wordt essentieel, maar vervangt niet de basisprincipes van SEO (Search Engine Optimization). Voor overheidsinstellingen is het van prioritair belang om ervoor te zorgen dat officiële informatie niet alleen zichtbaar en betrouwbaar is, maar ook zodanig gestructureerd dat deze gemakkelijk door machines kan worden gelezen, met name voor platforms zoals Google Search en ChatGPT, die op grote schaal worden gebruikt voor zoekopdrachten.

Aangezien de werking van op AI gebaseerde zoekmachines echter een “black box“ blijft, kunnen overheidsinstanties niet garanderen dat hun officiële websites stelselmatig als de referentiebron zullen worden beschouwd, noch dat de door AI samengevatte informatie volledig accuraat zal zijn.De concrete oplossing bestaat er dan ook in de EEAT-signalen te versterken, de inhoud up-to-date te houden, de informatie te structureren rond duidelijke vragen van burgers en na te gaan hoe deze inhoud door AI-platforms wordt overgenomen.

Sovereignty and AI

Smals Research — Tue, 30 Jun 2026 12:25:50 +0000

(FR) Le 12 juin 2026, le gouvernement américain a émis une directive de contrôle des exportations sans précédent (interdisant l’utilisation par des citoyens non américains) qui a contraint Anthropic à suspendre l’accès à ses derniers modèles d’IA dans le monde entier.
De telles décisions suscitent naturellement de vives réactions et replacent le thème de la souveraineté numérique et de l’IA au cœur des débats. Comment nous protéger contre de telles décisions géopolitiques ? Katy Fokou de Smals Research partage sa vision sur la souveraineté de l’IA et examine les solutions pour mieux nous protéger face à la dépendance étrangère et aux décisions politiques imprévisibles.

Regardez et écoutez ici pour en savoir plus. Des sous-titres sont disponibles.
Attention : cette entretien a été enregistrée avant la directive américaine du 12 juin 2026.

(NL) Op 12 juni 2026 vaardigde de Amerikaanse overheid een ongekende exportcontrole-richtlijn uit (verbod van gebruik door niet-Amerikaanse staatsburgers) die Anthropic dwong om de toegang tot zijn nieuwste AI-modellen wereldwijd op te schorten.
Dergelijke beslissingen lokken begrijpelijkerwijs sterke reacties uit en plaatsen het thema digitale en AI-soevereiniteit opnieuw centraal op de agenda. Hoe wapenen we ons tegen dergelijke geopolitieke besluiten? Katy Fokou van Smals Research deelt haar visie op AI-soevereiniteit en bespreekt welke oplossingen er bestaan om ons beter te beschermen tegen buitenlandse afhankelijkheid en onvoorspelbare beleidskeuzes.

Kijk en ontdek het hier. Ondertitels zijn beschikbaar.
Opgelet: deze talk werd opgenomen vóór de Amerikaanse richtlijn van 12 juni 2026.

(EN) On June 12, 2026, the U.S. government issued an unprecedented export control directive (prohibiting use by non-U.S. citizens) that forced Anthropic to suspend access to its latest AI models worldwide.
Such decisions understandably provoke strong reactions and place the theme of digital and AI sovereignty back at the center of the agenda. How do we protect ourselves against such geopolitical decisions? Katy Fokou of Smals Research shares her vision on AI sovereignty and discusses solutions to better protect us against foreign dependency and unpredictable policy decisions.

Watch and listen here to find out. Subtitles are available.
Note: This talk was recorded prior to the U.S. directive of June 12, 2026.

GEO: Visibilité des sites web à l’ère de l’IA

Katy Fokou — Fri, 26 Jun 2026 15:41:53 +0000

Nederlandstalige versie

Les grands modèles de langage (LLM) transforment progressivement notre manière de chercher de l’information en ligne. Google reste aujourd’hui le moteur de recherche dominant, mais de plus en plus d’utilisateurs se tournent vers des outils d’IA générative pour obtenir des réponses synthétisées à leurs requêtes. Cette évolution change la manière dont les marques, les organisations et les administrations publiques doivent rendre leurs contenus visibles sur le web. C’est dans ce contexte qu’un nouveau concept d’optimisation de la visibilité d’un site apparaît : le Generative Engine Optimization, ou GEO. Dans cet article, nous introduisons dans les grandes lignes le GEO.

Concepts de base

Qu’est-ce que le GEO ?

Exemple d’aperçu IA dans le moteur de recherche Google

L’optimisation pour les moteurs de recherche (SEO ou Search Engine Optimisation) a longtemps été la méthode utilisée pour améliorer la visibilité d’un site web dans les résultats de recherche. Cependant, avec l’essor de l’IA générative le GEO est apparu comme un nouveau paradigme d’optimisation. Il s’agit d’un ensemble de pratiques visant à optimiser le contenu d’un site web afin qu’il puisse être cité dans les réponses générées par les systèmes IA tels que l’aperçu IA de Google (Google AI Overview), le chatbot Copilot Search de Bing et ChatGPT. Alors que les moteurs de recherche traditionnels fournissent une liste d’URL classées en fonction de leur pertinence, les moteurs génératifs fournissent une réponse synthétisée générée par un grand modèle de langage à partir de multiples sources web.

L’évolution de l’IA générative a profondément transformé le paysage des moteurs de recherche, en introduisant de nouveaux outils de recherche. Ces outils peuvent être classés en deux groupes :

Les moteurs de recherches traditionnels augmentés par l’IA (AI Overviews) : Les AI Overviews ou aperçus IA sont des fonctionnalités intégrées aux moteurs de recherche qui propose une réponse synthétisée à la requête de l’utilisateur. Dans Google Search, ces aperçus apparaissent en haut de la page de résultats et génèrent un résumé incluant des citations issues de différentes sources.
Les plateformes de recherche conçues from scratch avec l’IA : Ces chatbots permettent aux utilisateurs d’effectuer des recherches itératives en posant des questions complémentaires. Les liens vers les sources sont directement intégrés dans les réponses générées. Des exemples notables sont Perplexity AI, Gemini, Microsoft Copilot et ChatGPT.

Impact de l’IA générative sur la recherche web

Les moteurs de recherche basé sur l’IA générative introduisent des changements cruciaux dans le comportement des utilisateurs et dans la logique de recherche.

Préférence pour les résumés plutôt que les clics

Un changement majeur est la préférence croissante des utilisateurs pour les réponses résumées plutôt que pour les liens. Les utilisateurs s’attendent de plus en plus à des réponses précises et contextualisées, délivrées directement par l’IA ; la recherche est en train de devenir une conversation plus qu’un cycle requête-résultats-clics.

Perte du suivi de l’utilisateur

Les moteurs génératifs posent un défi important en matière de suivi des utilisateurs. Contrairement aux outils classiques d’analyse web, ces plateformes ne donnent généralement pas accès à certaines informations techniques, comme l’adresse IP et le comportement de navigation de l’utilisateur. Il devient donc plus difficile de comprendre précisément le parcours des utilisateurs, de mesurer leur engagement et de personnaliser l’expérience proposée.

L’anonymisation de l’utilisateur est d’avantage un problème pour les entreprises commerciales que pour les institutions publiques. Cependant, des informations précieuses telles que le type de questions posées par les citoyens et l’utilisation (anonyme) du site web, sont perdues.

Perte de contrôle sur l’information fournie aux citoyens et aux entreprises

Les informations mises à disposition des entreprises et des citoyens sur les sites des institutions publiques peuvent être subtiles et complexes notamment celles qui sont de nature juridique. Ceci peut rendre leur compréhension difficile pour les modèles d’IA qui généreraient des réponses incorrectes.

Principales différences entre SEO et GEO

Alors que le SEO repose sur les mots-clés pour améliorer le classement et diriger le trafic vers un site web, le GEO est centré sur le contenu. Son objectif est d’optimiser une visibilité accrue dans les résumés générés par l’IA (visibilité basée sur la citation), plutôt que de se concentrer uniquement sur le classement (ranking). Par conséquent, le contenu doit être de haute qualité et structuré de manière à être facilement interprétable par un LLM.

Paradigme SEO	Paradigme GEO
Objectif : générer du trafic vers des URL spécifiques grâce au positionnement dans les pages de résultats des moteurs de recherche. Créer du contenu « optimisé pour le clic ».	Objectif : obtenir des citations dans un résumé généré par l’IA.
Correspondance requête – site web : mots-clés, autorité des liens entrants.	Correspondance requête – site web : similarité sémantique entre la requête et le contenu du site.
Résultat : Liste de liens cliquables.	Résultat : résumé cohérent incluant des citations et basé sur plusieurs sources.
Engagement des utilisateurs : les utilisateurs cliquent et consultent plusieurs sites web.	Engagement des utilisateurs : les utilisateurs reçoivent une réponse synthétisée et cliquent sur les sources citées ou s’engage dans une conversation avec l’IA.
Mesure des performances : position dans le classement et taux de clics.	Mesure des performances : fréquence de citation, c’est-à-dire la fréquence à laquelle un site web est utilisé comme référence pour appuyer des affirmations dans le résumé généré par l’IA.

Remarque : Dans le cadre du GEO, la clarté, la structure et la richesse sémantique priment sur la densité de mots-clés ou les backlinks. Toutefois, le SEO demeure le socle sur lequel doit reposer toute stratégie GEO.

De la requête à la réponse : comment fonctionne la recherche générative

Le processus de génération des Aperçus IA telles qu’elles apparaissent dans le moteur de recherche Google suit un schéma similaire à celui de la génération augmentée par récupération (RAG). Cependant les principes généraux, décrits ci-dessous, peuvent être étendus aux autres moteurs de recherche basés sur l’IA générative. La génération des aperçus s’exécute selon les étapes suivantes:

Décomposition de la requête (Query fan-out) : la requête soumise par l’utilisateur est décomposée en sous-requêtes plus petites.
Récupération : pour chaque sous-requête, l’index web traditionnel est parcouru afin d’identifier des contenus pertinents pour cette sous-requête.
Filtrage : les sources sont évaluées et filtrées en fonction de l’Expérience, de l’Expertise, de l’Autorité et de la Fiabilité (E-E-A-T).
Reclassement (Reranking) : les sources sont réordonnées selon leur pertinence finale.
Synthèse de la réponse : génération du résumé final.

Qu’est-ce qui déclenche les Aperçus IA ?

Les Aperçus IA ne se déclenchent pas pour chaque requête et dépendent de la nature de la question de l’utilisateur. Selon Google, les Aperçus IA se déclenchent quand les questions sont complexes, nécessiteraient plusieurs recherches distinctes et que le moteur de recherche a une grande confiance dans la qualité des réponses.

En règle générale, la réponse est générée pour les types de questions suivantes :

Les requêtes d’information générale : comment, quoi, pourquoi
Les comparaisons et les conseils

Question	Aperçu IA généré?
GEO tools (recherche produit)	No
What are the best tools for geo (“quoi”)	Yes
How does generative engine impact public health compared to traditional search engine (question complexe)	Yes
jupyter notebook (recherche produit)	No
jupyter notebook versus marimo (comparaison)	Yes
what is the capital of india (connaissance factuelle)	No

Exemples de requêtes déclenchant ou ne déclenchant pas l’aperçu IA

Stratégie d’optimisation des sites web pour l’IA générative

Les fournisseurs de moteurs génératifs ne donnent pas de règles d’optimisation claires, et leurs algorithmes sont opaques. Dans sa documentation consacrée aux AI Overviews, Google indique que les fonctionnalités d’IA reposent globalement sur les mêmes principes que la recherche Google classique. Les pages doivent donc respecter les exigences techniques du moteur de recherche, se conformer aux politiques de recherche en application et privilégier les pratiques essentielles du SEO, en particulier pour la production de contenus utiles, fiables et conçus avant tout pour les utilisateurs.

Toutefois, en puisant dans diverses sources spécialisées, nous pouvons dégager les bonnes pratiques suivantes.

Contenu et forme

Les recommandations ci-dessous ne sont pas exhaustives, mais elles couvrent les pratiques les plus efficaces pour améliorer la visibilité d’un contenu. L’objectif étant de rendre les pages plus faciles à découvrir, à comprendre et à exploiter par les systèmes d’IA.

Renforcer les signaux E-E-A-T : mettre en avant l’expérience, l’expertise, l’autorité et la fiabilité du contenu.
- Citer des sources externes fiables et, lorsque c’est pertinent, faire référence à des entités reconnues dans le domaine.
- Mettre régulièrement les pages à jour.
- Apporter sur des éléments factuels, par exemple des statistiques, des données quantitatives ou des exemples concrets.
Proposer un contenu utile et distinctif : publier des informations à forte valeur ajoutée.
Renforcer la crédibilité externe : obtenir des liens entrants provenant de sites reconnus dans le domaine.
Enrichir le contenu sur le plan sémantique : utiliser un vocabulaire précis, éviter les formulations ambiguës et organiser l’information autour des questions que pourraient se poser les utilisateurs (mode FAQ).

Exemple de page web structurée en mode FAQ

Structure

Pour que les robots d’exploration (web crawlers) puissent facilement accéder au contenu, celui-ci doit être conçu pour être lisible par les machines (machine-readable) :

Structurer le contenu en paragraphes courts : le contenu doit être organisé en unités discrètes et sémantiquement indépendantes. Il doit être structuré de manière à répondre directement aux questions de type « comment faire », « pourquoi » ou « quels sont » …
Adopter le balisage sémantique Schema Markup (schema.org) : le balisage sémantique fournit un contexte explicite à l’IA pour une meilleure compréhension et récupération de l’information.
Utiliser un format HTML très structuré : tirer parti d’une hiérarchie stricte de balises (H1, H2, H3, listes, etc.) pour définir les relations entre les entités.

Bon à savoir

Les institutions gouvernementales sont considérées par les moteurs de recherche comme des sources de confiance ayant autorité.

Les moteurs de recherche basés sur l’IA générative ne sont pas un bloc monolithique. Certains moteurs génératifs privilégieront les citations, tandis que d’autres privilégieront la qualité de la source. De plus, les mises à jour des LLM sous-jacents peuvent invalider des stratégies de visibilité.

Les réseaux sociaux, Youtube et Reddit sont des sources importantes pour les IA, il est important pour les institutions publiques de diversifier leurs canaux d’information aux citoyens.

Pour plus d’informations sur les pratiques concrètes d’optimisation de site web vous pouvez consulter le site https://elasticms.fgov.be/fr/news.

Faut-il privilégier une stratégie GEO ou un chatbot pour les sites institutionnels? Des professionnels répondent à cette question lors d’une table ronde organisée par le centre de compétence IA de Smals. Vous pouvez retrouver l’enregistrement ici.

Comment mesurer l’efficacité d’une stratégie GEO

En quelques mois, de nombreux outils sont apparus sur le marché pour aider les organisations à optimiser la manière dont elles sont citées ou représentées dans les réponses générées par l’IA. Plusieurs plateformes SEO intègrent désormais, elles aussi, ce type de fonctionnalités dans leurs suites.

Ces solutions s’adressent toutefois principalement aux équipes marketing chargées de promouvoir une marque et d’en mesurer la visibilité. Leurs indicateurs et leurs usages ne sont donc pas toujours directement transposables au contexte du secteur public, où l’objectif est moins la promotion d’une marque que la diffusion d’une information fiable, officielle et facilement accessible pour le citoyen.

Concrètement, les outils de GEO évaluent la visibilité d’une organisation en soumettant un grand nombre de requêtes types à des plateformes comme ChatGPT, Google Search, ou Perplexity. Ils analysent ensuite les réponses générées afin de déterminer si l’organisation est citée, dans quel contexte elle apparaît et quelle place elle occupe par rapport à d’autres sources. Ces analyses permettent de suivre plusieurs indicateurs utiles pour évaluer et améliorer la visibilité dans les réponses générées par l’IA :

Le taux de citation, c’est-à-dire la fréquence à laquelle le site ou l’organisation est utilisé comme source ;
Share of voice, qui mesure la présence de l’organisation par rapport à d’autres sources citées ;
La position dans la réponse, par exemple lorsque le site est présenté comme première source ou comme référence secondaire ;
La tonalité de la réponse, afin d’identifier si la formulation de la réponse est positive ou négative.

Ci-dessous une liste de quelques plateformes d’optimisation de la visibilité :

Conclusions et recommandations

L’optimisation pour les moteurs génératifs devient essentielle, mais elle ne remplace pas le fondamentaux du SEO (Search Engine Optimization). Pour les institutions publiques, la priorité est de garantir que l’information officielle est non seulement visible et fiable, mais qu’elle soit structurée de manière à être facilement lisible par les machines, en particulier pour des plateformes telles que Google Search et ChatGPT largement utilisés pour les recherches.

Cependant, étant donné que le fonctionnement des moteurs de recherche bases sur l’IA reste une « boîte noire », les administrations ne peuvent pas garantir que leurs sites officiels seront systématiquement considérés comme la source de référence, ni que les informations synthétisées par l’IA seront totalement exactes. La réponse concrète consiste donc à renforcer les signaux E‑E‑A‑T, à maintenir les contenus à jour, à structurer l’information autour de questions claires des citoyens, et à suivre la manière dont ces contenus sont repris par les plateformes d’IA.

Anomaliedetectie: wanneer machine learning het ongewone opspoort

Pierre Leleux — Wed, 17 Jun 2026 06:00:00 +0000

Version en Français

Inleiding

Detectie van anomalieën (ook wel ‘outliers’ of ‘afwijkende waarden’ genoemd) is een veelvoorkomend probleem binnen data science en machine learning. Dit opsporen wordt vaak gezien als een eenvoudige voorbereidende taak, maar kan ook prima het einddoel van de toepassing zijn:

Als voorbereidende taak vindt de detectie plaats tijdens de verkennende analyse, om problemen met ‘garbage in, garbage out’ te beperken. Het doel is hier dus om deze anomalieën te corrigeren of te verwijderen om te voorkomen dat ze worden gebruikt tijdens de trainingsfase van het voorspellende model, omdat dit de prestaties ervan negatief zou kunnen beïnvloeden.
Als hoofdtaak kan het opsporen van waarnemingen met afwijkende profielen bijvoorbeeld dienen om frauduleuze activiteiten, fouten of zelfs inbraken op te sporen (IDS: Intrusion Detection System) [1].

Het opsporen van anomalieën is dus een zeer belangrijke taak die in tal van domeinen veel toepassingen kent [1], en tot doel heeft waarnemingen te vinden die niet in overeenstemming zijn met de rest van de gegevens [2].

Deze blogpost gaat in op het probleem van het opsporen van anomalieën in gegevens en heeft tot doel oplossingen te presenteren die gebaseerd zijn op een machine learning-benadering.

Opmerkelijk is ook dat, hoewel deze twee gebieden met elkaar verband houden, anomaliedetectie verschilt van tools voor datakwaliteit (data quality) zoals Trillium en Open Refine. Bij data quality ligt de nadruk op het opsporen van problemen met incomplete/ongeldige gegevens aan de hand van regels, terwijl anomaliedetectie erop gericht is zeldzame/ongebruikelijke patterns te identificeren (die afwijken van de ‘norm’), maar die vanuit het oogpunt van data quality niet per se ongeldig zijn.

Verschillende soorten anomalieën

Voordat we ingaan op de tools voor het opsporen van anomalieën, zullen we eerst de verschillende soorten anomalieën definiëren die kunnen worden gedetecteerd. In de literatuur wordt vaak uitgegaan van drie soorten anomalieën [3] :

De incidentele anomalie

Dit is de eenvoudigste vorm van anomalieën: een individueel geval dat als afwijkend wordt beschouwd ten opzichte van de rest van de gegevens.

Deze anomalieën worden soms nog onderverdeeld in twee subcategorieën: globale (die significant verschillen van de rest van de gegevens) en lokale anomalieën (die verschillen van de directe omgeving). Illustratief voorbeeld:

Figuur 1: Voorbeeld van lokale en globale anomalieën (afbeelding uit [4])

In figuur 1 zijn twee anomalieën te zien: o₁, een globale anomalie die sterk verschilt van de andere waarnemingen, en o₂, een lokale anomalie ten opzichte van de omgeving (de C2-groep).

De contextuele anomalie

Een anomalie wordt als ‘contextueel’ beschouwd als deze in een andere context als normaal kan worden beschouwd. Neem bijvoorbeeld neerslag: een bepaald neerslagniveau dat op een bepaalde plek abnormaal is, kan op een andere plek heel goed als normaal worden beschouwd. We hebben hier dus twee soorten kenmerken: contextuele kenmerken die de context bepalen (vaak temporele of ruimtelijke kenmerken) en gedragsmatige kenmerken waarin we naar anomalieën zoeken (in ons voorbeeld: de neerslag).

Collectieve anomalie/groepsanomalie

In deze laatste categorie gaat het niet langer om een individuele anomalie, maar om een reeks anomalieën die een groep vormen met ongebruikelijke kenmerken.

Detectiemethodes

Vaak (en vooral wanneer het gaat om een eenvoudige voorbereidende taak als data cleansing) gebeurt het opsporen van anomalieën in de gegevens eenvoudigweg met behulp van statistische tools (bijvoorbeeld door gebruik te maken van standaardanomalieën, kwantielen of statistische toetsen). In dit artikel gaan we niet in op deze statistische benaderingen, maar richten we ons op machine learning-benaderingen voor het opsporen van anomalieën.

Welk soort learning?

Er zijn hoofdzakelijk twee benaderingen om anomalieën op te sporen: methoden op basis van supervised learning (begeleid leren) en methoden op basis van unsupervised learning (onbegeleid leren). Ter herinnering: bij supervised learning wordt gebruikgemaakt van gelabelde data. Dit vereist dat er, naast de data, ook voorbeelden zijn van eerder geïdentificeerde anomalieën, zodat het detectiemodel kan leren deze te onderscheiden van normale data. Omgekeerd is unsupervised learning volledig gebaseerd op de data en vereist het geen set van vooraf geïdentificeerde anomalieën.

In het kader van dit artikel gaan we de unsupervised benaderingen verkennen. Deze hebben namelijk een interessant kenmerk ten opzichte van de supervised modellen (naast het feit dat ze geen gelabelde gegevens vereisen): het ontdekken van nieuwe vormen van anomalieën.

Een supervised model zal namelijk de neiging hebben om anomalieën te identificeren die kenmerken vertonen die vergelijkbaar zijn met die van de gelabelde anomalieën. Daarom is het, zelfs wanneer er gelabelde gegevens beschikbaar zijn, vaak interessant om een supervised model – getraind om bepaalde vooraf gedefinieerde anomalieprofielen nauwkeuriger te detecteren – te koppelen aan een unsupervised model, dat mogelijk anomalieën met totaal andere profielen kan opsporen.

Enkele klassieke algoritmes voor het opsporen van anomalieën

Voordat we beginnen, zullen we algoritmen voor het opsporen van anomalieën in twee categorieën indelen: detectoren en detectiemodellen. Een detectiemodel bouwt, zoals de naam al aangeeft, een model op dat op zichzelf kan worden gebruikt: als we bijvoorbeeld een nieuwe waarneming hebben, kunnen we die gewoon in het model invoeren om te beoordelen of het om een anomalie gaat. Een detector daarentegen heeft geen getraind model dat later kan worden gebruikt: als er een nieuwe waarneming binnenkomt, moet deze opnieuw in de context worden geplaatst door deze tussen de andere gegevens te plaatsen, of zelfs het detectieproces van anomalieën volledig opnieuw starten.

Detectoren zonder modellen

Een eerste intuïtieve benadering om te bepalen of een waarneming een anomalie is of niet, is gebaseerd op het idee dat een anomalie de neiging heeft om ver van zijn buren te liggen. Door dus de gemiddelde afstand (bijvoorbeeld de Euclidische afstand) te meten tussen een waarneming en zijn k dichtstbijzijnde buren (k-NN), of simpelweg de afstand tussen een waarneming en zijn k-de dichtstbijzijnde buur (kth-NN) [5], kan men het risico inschatten dat een waarneming een anomalie is: als de waarneming ver van de andere ligt, kan men aannemen dat het om een anomalie gaat.

Deze op afstand gebaseerde benadering heeft het voordeel dat ze intuïtief, eenvoudig te implementeren en te interpreteren is, maar ze stuit al snel op haar grenzen. Als we het voorbeeld uit Figuur 1, nog eens bekijken, zien we dat alle waarnemingen van cluster C1 verder van elkaar verwijderd zijn dan o₂ van de waarnemingen van C2. Resultaat: een op afstand gebaseerd algoritme zal anomalie o₁ gemakkelijk vinden, maar o₂ niet. Een zeer bekende alternatieve benadering, de Local Outlier Factor (LOF) [4] is gebaseerd op dichtheid in plaats van op afstand. Hiermee kunnen gevallen worden behandeld waarin de gegevens clusters bevatten (C1 en C2 in Figuur 1) die niet dezelfde dichtheid hebben.

Het idee is als volgt: kijken of de dichtheid rond een waarneming consistent is met de dichtheid van de k dichtstbijzijnde buren. Als we dus een waarneming nemen die deel uitmaakt van groep C1, is de dichtheid rond deze waarneming consistent met de dichtheid rond haar naaste buren, terwijl voor waarneming o2 de dichtheid rond o2 verschilt van de dichtheid rond haar naaste buren binnen C2. Het LOF-algoritme bestaat er dus in anomalieën te detecteren door na te gaan of hun dichtheid consistent is met de dichtheid van hun lokale omgeving.

Een laatste type detector dat we zullen bekijken, is gebaseerd op het clusteren van gegevens (clustering). Het bekende doel van clustering is het opsporen van groepen waarnemingen met vergelijkbare kenmerken. Dit maakt het met name mogelijk om:

Te zoeken naar een waarneming die ver van het zwaartepunt van haar cluster ligt, of die zich in een microcluster bevindt die slechts één waarneming bevat (een incidentele anomalie).
Zoeken naar abnormale clusters (collectieve anomalieën).

Jiang et al. [6] stellen bijvoorbeeld voor om de gegevens op te splitsen en vervolgens de ‘outlier factor’ van elke cluster te berekenen (gebaseerd op de afstand tussen die cluster en de andere), om zo clusters van anomalieën te vinden. He et al. [7] stellen het FindCBLOF-algoritme (CBLOF: cluster-based local outlier factor) voor, dat de gegevens opdeelt en vervolgens naar anomalieën zoekt door zowel de grootte van de clusters (te kleine clusters kunnen collectieve anomalieën vertegenwoordigen) als de afstanden tussen de waarnemingen en de zwaartepunten van de clusters te gebruiken.

Detectiemodellen

Nu we modelvrije benaderingen hebben bekeken, gaan we kort verder met modelgebaseerde benaderingen voor het opsporen van anomalieën. Dit hoofdstuk zal vrij kort zijn en slechts twee van de bekendste modellen behandelen: de ‘isolation forest’ en de ‘one-class SVM’.

Isolation forest [8] is gebaseerd op het principe dat een anomalie, omdat deze ongebruikelijke kenmerken vertoont, gemakkelijker te isoleren zou moeten zijn dan een normale waarneming.

Het idee is simpel: we kiezen willekeurig een variabele en een waarde (bijvoorbeeld: leeftijd (variabele) en 21.3 (waarde)), en gebruiken die om de gegevens in twee subgroepen (takken) te verdelen. Elk van deze groepen wordt vervolgens op willekeurige wijze onderverdeeld in subgroepen, die op hun beurt weer worden onderverdeeld, enzovoort, op recursieve wijze, waardoor een willekeurig opgebouwde beslissingsboom (decision tree) ontstaat, die een isolation tree wordt genoemd.

Figuur 2: Illustratief voorbeeld van een isolation tree

Tijdens de ontwikkeling van de boom wordt een groep niet meer in subgroepen opgesplitst zodra deze nog maar één waarneming bevat. Een Isolation Forest bestaat dus uit een groot aantal van deze willekeurige bomen, met het idee dat een normale waarneming moeilijker te isoleren zou moeten zijn (en dus gemiddeld meer willekeurige verdelingen van de ruimte zou vereisen) dan een anomalie (zie Figuur 3).

Figuur 3: Voorbeeld van het isoleren van een normale waarneming (x_i) en een afwijkende waarneming (x_j) (afbeelding uit [9])

Om te bepalen of een waarneming een mogelijke anomalie is, volstaat het om te kijken op welke diepte deze in de verschillende bomen geïsoleerd is. Anomalieën zouden gemiddeld genomen vrij dicht bij de top van de bomen moeten staan, omdat ze makkelijker te isoleren zijn.

De One-Class Support Vector Machine (OCSVM) [10] is het tweede detectiemodel waar we in dit artikel naar gaan kijken. Merk op dat het algoritme dat aan de basis ligt van de OCSVM aanzienlijk minder intuïtief en gemakkelijker uit te leggen is dan isolation forest. We zullen dus niet uitgebreid ingaan op de werking ervan. We zullen het echter toch kort toelichten, omdat het een bekend klassiek model is voor detectie van anomalieën.

OCSVM probeert het gebied te vinden waar de gegevens dicht bij elkaar liggen, en de punten buiten dit gebied als afwijkend te beschouwen. Het doel van OCSVM is om de vorm van de ‘normaliteit’ te leren, om zo een grens te bepalen die de normale waarnemingen van de anomalieën scheidt. Het bijzondere aan het OCSVM-algoritme is dat het, in plaats van direct de kenmerken (features) van de waarnemingen te gebruiken om de grens tussen normale en abnormale waarnemingen te bepalen, de waarnemingen projecteert in een getransformeerde ruimte, waardoor complexe grenzen tussen normale en abnormale gegevens kunnen worden getrokken.

Illustratief voorbeeld

Om de opsporing van anomalieën te illustreren, hebben we artificiële gegevens in twee dimensies gegenereerd, bestaande uit:

‘Normale’ gegevens: gegenereerd volgens een normale verdeling.
Anomalieën: willekeurig gegenereerd volgens een uniforme verdeling.

De normale gegevens en de anomalieën zijn door elkaar gemengd en we hebben daarop drie algoritmen voor het opsporen van anomalieën toegepast (OCSVM, Isolation Forest en LOF). De resultaten zijn te zien in de figuren 4 – 6:

Figuur 4: Een enkele groep van normale waarnemingen;
Figuur 5: Twee groepen normale waarnemingen die licht uit elkaar liggen
Figuur 6: Twee groepen normale waarnemingen die ver uit elkaar liggen

In elk van deze grafieken worden normale waarnemingen in het wit weergegeven en anomalieën in het zwart, zodat ze visueel gemakkelijk van elkaar te onderscheiden zijn. Deze labels (normaal versus anomalie) zijn uiteraard niet aan de algoritmen meegedeeld, aangezien deze unsupervised draaien.

Voor elk van deze drie algoritmen hebben we de grens die het algoritme gebruikt om normale gegevens van anomalieën te onderscheiden, in het rood gemarkeerd. De waarnemingen in de oranje zone (binnen de grens) worden door het algoritme als normaal beschouwd, en de waarnemingen in de blauwe zone worden als anomalieën beschouwd (lichtblauw: licht afwijkend; donkerblauw: sterk afwijkend).

Originele gegevens

OCSVM

Isolation Forest

LOF

Figuur 4: Detectie van anomalieën met een groep normale gegevens

Originele gegevens

OCSVM

Isolation Forest

LOF

Figuur 5: Detectie van anomalieën met twee licht van elkaar gescheiden groepen normale gegevens

Originele gegevens

OCSVM

Isolation Forest

LOF

Figuur 6: Detectie van anomalieën met twee duidelijk gescheiden groepen normale gegevens

Detectie evalueren

Het is geen eenvoudige opgave om de kwaliteit van de opsporing van anomalieën te kwantificeren. Laten we beginnen met het eenvoudigste geval: als we beschikken over vooraf geïdentificeerde anomalieën (labels). In deze gevallen kan een algoritme voor het opsporen van anomalieën worden gevalideerd door te controleren of het erin slaagt de reeds bekende anomalieën terug te vinden, met behulp van klassieke maatstaven (recall, precision, F1-measure, enz.).

Zonder labels wordt het ingewikkelder. In dat geval moeten de door het algoritme geïdentificeerde waarnemingen handmatig worden gecontroleerd om te bevestigen of ze daadwerkelijk afwijkend zijn. Dit vereist niet alleen een goede kennis van het domein waaruit de gegevens afkomstig zijn, maar ook inzicht in waarom de waarneming door het algoritme als anomalie is geïdentificeerd. Aangezien er vaak een groot aantal variabelen in de gegevens zit en de grens (tussen normale en afwijkende gegevens) die door het algoritme wordt gebruikt doorgaans complex is, is het soms moeilijk te begrijpen waarom bepaalde waarnemingen door een algoritme als anomalieën zijn geïdentificeerd. Het kan dan nuttig zijn om verklaarbaarheidstools (bijvoorbeeld: SHAP, LIME) te gebruiken om de beslissingen van het algoritme te begrijpen.

Conclusie

In deze blogpost hebben we ervoor gekozen om een selectie van (unsupervised) algoritmen te presenteren die gebaseerd zijn op verschillende aanpakken (afstand, dichtheid, isolatie, enz.) om zo de grote verscheidenheid aan bestaande algoritmen te illustreren. We willen er echter op wijzen dat we geen aandacht hebben besteed aan de supervised methoden (die vaak nauwkeuriger zijn omdat ze gespecialiseerd zijn in de opsporing van vooraf gedefinieerde patronen) en de statistische benaderingen. Opsporing van anomalieën is dus een uitgebreid domein met talrijke tools. Unsupervised algoritmen bieden een grote flexibiliteit omdat ze geen labels vereisen en nieuwe vormen van anomalieën kunnen opsporen. In de praktijk is het soms handig – aangezien elk detectiealgoritme anders is – om meerdere algoritmen te combineren voor het opsporen van anomalieën om een grotere verscheidenheid aan opgespoorde anomalieën te verkrijgen.

[1] : Chandola, V., Banerjee, A., & Kumar, V. (2009). Anomaly detection: A survey. ACM computing surveys (CSUR), 41(3), 1-58.

[2] : Samariya, D., & Thakkar, A. (2023). A comprehensive survey of anomaly detection algorithms. Annals of Data Science, 10(3), 829-850.

[3] : Nassif, A. B., Talib, M. A., Nasir, Q., & Dakalbab, F. M. (2021). Machine learning for anomaly detection: A systematic review. Ieee Access, 9, 78658-78700.

[4]: Breunig, M. M., Kriegel, H. P., Ng, R. T., & Sander, J. (2000). LOF: identifying density-based local outliers. In Proceedings of the 2000 ACM SIGMOD international conference on Management of data (pp. 93-104).

[5] : Ramaswamy, S., Rastogi, R., & Shim, K. (2000). Efficient algorithms for mining outliers from large data sets. In Proceedings of the 2000 ACM SIGMOD international conference on Management of data (pp. 427-438).

[6] : Jiang, S. Y., & An, Q. B. (2008). Clustering-based outlier detection method. In 2008 Fifth international conference on fuzzy systems and knowledge discovery (Vol. 2, pp. 429-433). IEEE.

[7] : He, Z., Xu, X., & Deng, S. (2003). Discovering cluster-based local outliers. Pattern recognition letters, 24(9-10), 1641-1650.

[8] : Liu, F. T., Ting, K. M., & Zhou, Z. H. (2008). Isolation forest. In 2008 eighth ieee international conference on data mining (pp. 413-422). IEEE.

[9] : Isolation forest – Wikipedia

[10] : Schölkopf, B., Platt, J. C., Shawe-Taylor, J., Smola, A. J., & Williamson, R. C. (2001). Estimating the support of a high-dimensional distribution. Neural computation, 13(7), 1443-1471.

AI en codeveiligheid – Een update

Fabien A. P. Petitcolas — Tue, 09 Jun 2026 06:00:00 +0000

Cet article est aussi disponible en français.

Bijna een jaar geleden publiceerden we twee artikels over generatieve AI (GenAI) en codeveiligheid [1], [2] en sloten we af met de bemerking dat de meeste studies die we hadden bekeken inconsistente performantie aantoonden en een algemene tendens tot hoge percentages vals positieven lieten zien bij de opsporing van veiligheidslekken. De tools in dit domein evolueren echter snel. AI-agenten die een taalmodel combineren met tools voor statische analyse, een geheugen en een vorm van gestructureerd “redeneren”, zijn kwetsbaarheden gaan ontdekken in software die decennia van geautomatiseerde tests en menselijke beoordelingen niet hadden opgemerkt.

Een extreem snelle evolutie

Vanaf november 2024 [3], en vervolgens opnieuw in juli 2025 [4] heeft het “Big Sleep”-systeem van Google twee belangrijke kwetsbaarheden ontdekt in de SQLite-software, die nochtans grondig getest en op grote schaal gebruikt wordt. Begin 2026 ging de start-up AISLE nog een stap verder: door gebruik te maken van GenAI-modellen in combinatie met zijn eigen analyse-infrastructuur, ontdekte het 12 “zero-day”-kwetsbaarheden – waaronder een kritieke kwetsbaarheid [5], evenals bugs die teruggaan tot code uit de jaren 1990 – in de OpenSSL-library, die nochtans uitgebreid was gecontroleerd [6]. AISLE heeft ook een groot aantal kwetsbaarheden gemeld in meer dan tien gevestigde projecten, waaronder Apache, Chromium, Firefox, de Linux-kernel, OpenVPN en Samba. In maart 2025 ontdekte de tool “Security Copilot” van Microsoft kwetsbaarheden in GRUB2 en U-Boot (bootloaders die door de meeste Linux-systemen worden gebruikt). , georganiseerd door het Amerikaanse agentschap voor geavanceerde defensieonderzoeksprojecten (DARPA), hebben zeven AI-systemen autonoom 54 miljoen regels code doorgenomen, het merendeel van de ingebouwde synthetische kwetsbaarheden opgespoord en 18 tot dan toe onbekende bugs aan het licht gebracht [7], [8].

Deze demonstraties, hoe indrukwekkend ook, hebben meer te maken met de infrastructuur die rond de GenAI is opgezet (integratie van tools, koppelingen met bestaande software voor statische analyse, iteratieve planningscycli) dan met de ruwe performances van de modellen [2]: wat hier dus doorslaggevend is, is het ontwerp van het systeem, in plaats van de capaciteit van het model op zich.

Op de conferentie “CyberSec Europe 2026”, kwam, naast het woord “soevereiniteit” dat al sinds de vorige conferentie steeds weer werd herhaald, ook het woord “Mythos” voor na de meesterlijke marketingzet van het bedrijf Anthropic [9], [10], dat overigens niet aan zijn proefstuk toe is [11]. Op 7 april 2026 verklaarde het bedrijf Anthropic namelijk in zijn aankondiging van de terbeschikkingstelling van “Claude Mythos Preview” – voorbehouden aan een beperkt aantal bedrijven – dat Mythos zelfstandig duizenden “zero-day”-kwetsbaarheden in kritieke software-infrastructuren had geïdentificeerd, een oude OpenBSD-bug had ontdekt en in staat was geweest vier kwetsbaarheden aan elkaar te koppelen om een werkende browser exploit te creëren. Onafhankelijke onderzoeken zijn op dit moment vrijwel onbestaande en alleen het Britse Instituut voor AI-beveiliging (AISI) – een overheidsinstantie die AI-systemen voor en na de implementatie ervan beoordeelt – heeft Mythos Preview kunnen evalueren en bevestigd dat het in 3 van de 10 gevallen een meerstapsaanvalssimulatie op een bedrijfsnetwerk tot een goed einde kon brengen – een scenario dat voor een gekwalificeerde menselijke professional naar schatting 20 uur werk zou vergen [12], [13].

Maar deze bevindingen zijn niet uniek voor Mythos. De door Mythos ontdekte kwetsbaarheden konden ook worden gevonden door het bedrijf AISLE met behulp van goedkopere en kleinere modellen, waarvan de gewichten openbaar zijn en die op consumentenhardware kunnen worden uitgevoerd [10], [14]. . Los daarvan heeft het AISI vastgesteld dat ook het GPT-5.5-model in staat was om een simulatie van een aanval op een bedrijfsnetwerk uit te voeren [15]. Tijdens haar evaluatie heeft de AISI ook een “universele” techniek geïdentificeerd om de veiligheidsbeperkingen van het model te omzeilen, waarbij zij erop wees dat veiligheidsmaatregelen die het gedrag van het model [16] voorschrijven, waarschijnlijk niet zo effectief zijn als architecturale beperkingen.

Bijbenen

Gezien de steeds snellere ontdekking van nieuwe kwetsbaarheden wordt het absoluut noodzakelijk om de pijplijnen voor software-oplossingen te versnellen, met name bij componenten met kritieke externe afhankelijkheden [17]. Het voorbeeld van OpenSSL in januari 2026 laat zien dat geautomatiseerde audits inmiddels een tweesnijdend zwaard zijn dat zowel voor onderzoekers als voor criminelen en overheidsactoren toegankelijk is [18].

Terwijl het aantal CVE’s explosief toeneemt – met een stijging van 263 % tussen 2020 en 2025 – dreigt dit de traditionele correctiecapaciteiten in de meeste organisaties te overbelasten [19], [20]. In zijn aankondiging gaf Anthropic toe dat minder dan 1 % van de door Mythos gevonden kwetsbaarheden gecorrigeerd werd. Het op grote schaal opsporen van kwetsbaarheden zonder deze op dezelfde schaal te corrigeren, leidt alleen maar tot een langere lijst van blootstellingen, maar geen hogere veiligheid. In deze context zullen alleen organisaties die vooraf een autonome en flexibele infrastructuur voor het corrigeren van kwetsbaarheden hebben opgezet, erin slagen hun blootstellingsperiode te verkorten, daar waar handmatige methoden het tempo dat door AI wordt opgelegd niet meer kunnen bijbenen [20], [21].

Terwijl AI-tools, ondanks hun “hallucinaties” [22], tal van nieuwe mogelijkheden bieden voor aanvallers, is de indruk die naar voren komt uit conferenties als CyberSec Europe 2026 of Black Hat Europe 2025 gelukkig dat de verdediging voorlopig nog de overhand lijkt te hebben [23], [24]. De markt voor veiligheidstools voor bedrijven groeit snel en deze tools proberen het werk van analisten te vergemakkelijken. Zo omvat de tool “Security Copilot” van Microsoft de triage van waarschuwingen, het optimaliseren van toegangspolicy’s en het onderzoeken van gegevensbeveiliging, en zou deze het aantal waarschuwingen per incident aanzienlijk kunnen verminderen en conflicten met betrekking tot veiligheidspolicy’s sneller kunnen oplossen. De geautomatiseerde triage van waarschuwingen afkomstig uit het beheer van gebeurtenissen en veiligheidsinformatie (SIEM) via agentgebaseerde orchestration-tools, automatisering en respons voor beveiliging (SOAR) zou toelaten om de benodigde behandelingstijd per incident significant te verlagen [25]. Meer in het algemeen wijzen onderzoeken op een aanzienlijke vermindering van het aantal valse positieven bij waarschuwingen wanneer GenAI wordt ingezet als contextuele triagelaag bovenop traditionele statische analysetools [26].

Het opsporen en corrigeren van kwetsbaarheden is niet de enige invloed van AI op de veiligheid. Door de automatisering van cyberaanvallen via AI kunnen aanvallers met een ongekende snelheid opereren — tot wel 3.600 keer sneller dan mensen — terwijl ze tegelijkertijd een veel groter aantal activa aanvallen [20]. Gezien een ‘operationeel tempo’ waarbij de mediane tijd tussen publicatie en exploitatie is gedaald tot slechts 5 dagen [27], zijn handmatige of lineaire responsmodellen inmiddels achterhaald en niet meer in staat om deze hoogfrequente aanvallen in te perken [20]. Deze ontwikkeling vereist een herziening van de incidentresponshandleidingen (“playbooks”).

Ten slotte brengt ook het gebruik van AI voor (min of meer) productieve doeleinden een reeks veiligheidsproblemen met zich mee binnen bedrijven. Het is belangrijk om precies vast te stellen waar AI binnen een infrastructuur wordt ingezet om de gegevensbeveiliging te waarborgen. Het fenomeen van “shadow AI” — dat gedefinieerd wordt als het gebruik van AI-tools zonder goedkeuring of toezicht van de IT-afdeling – vormt een aanzienlijk risico. Hieronder vallen modellen die via persoonlijke accounts toegankelijk zijn, AI-functionaliteiten die zonder expliciete aankoop zijn geïntegreerd in Software-as-a-Service (SaaS) van derden, of “open-source”-modellen die door programmeurs worden gebruikt buiten elk governanceproces [28] om. Een organisatie kan geen perimeter verdedigen die zij niet heeft gedefinieerd, en het huidige gebrek aan overzicht leidt tot kritieke kwetsbaarheden: naar schatting 91 % van de AI-tools binnen bedrijven zou buiten de controle van het IT-management om functioneren [29]. Zonder een gecentraliseerde inventarisatie en continu toezichtbeleid lopen bedrijven echter het risico op aanzienlijk hogere kosten als gevolg van datalekken [30].

Conclusion

Beveiligingstools op basis van AI zijn in zeer korte tijd van de onderzoeksfase naar operationele toepasbaarheid geëvolueerd, aan beide kanten van het spectrum: terwijl de offensieve capaciteiten van AI de drempel voor middelgrote criminele actoren hebben verlaagd en schaalbaardere inbraakcampagnes mogelijk hebben gemaakt, bevatten de defensieve toepassingen – filteren van waarschuwingen, opsporen van kwetsbaarheden, filteren van valse positieven, autonome penetratietests – AI-functionaliteiten en bieden ze verbeteringen ten opzichte van eerdere generaties. De implementatie van door AI versterkte defensieve workflows markeert een belangrijke overgang in safety engineering.

De uitdaging is niet langer de opsporing, maar de correctie.

Références

[1] F. A. P. Petitcolas, “AI om de veiligheid van de code te verbeteren? (Deel 1: veiligheid van de gegenereerde code)”, Smals Research, 30 juli 2025. Beschikbaar op: https://www.smalsresearch.be/ai-om-de-veiligheid-van-de-code-te-verbeteren-deel-1-veiligheid-van-de-gegenereerde-code/

[2] F. A. P. Petitcolas, “AI om de veiligheid van code te verbeteren? (Deel 2: opsporing van kwetsbaarheden)”, Smals Research, 26 aug. 2025. Beschikbaar op: https://www.smalsresearch.be/ai-om-de-veiligheid-van-code-te-verbeteren-deel-2-opsporing-van-kwetsbaarheden/

[3] R. Lakshmanan, « Google’s AI Tool Big Sleep Finds Zero-Day Vulnerability in SQLite Database Engine », The Hacker News, 11 nov. 2024. Beschikbaar op: https://thehackernews.com/2024/11/googles-ai-tool-big-sleep-finds-zero.html

[4] “NVD – CVE-2025-6965”, NIST – National Institute of Standards and Technology, juli 2025. Beschikbaar op: https://nvd.nist.gov/vuln/detail/CVE-2025-6965

[5] “NVD – CVE-2025-15467”, CVE-2025-15467, jan. 2026. Beschikbaar op: https://nvd.nist.gov/vuln/detail/CVE-2025-15467

[6] A. Muanza, « Douze failles de sécurité découvertes dans OpenSSL par une analyse basée sur l’IA », 29 jan. 2026. Beschikbaar op: https://www.ictjournal.ch/news/2026-01-29/douze-failles-de-securite-decouvertes-dans-openssl-par-une-analyse-basee-sur-lia

[7] D. DiMolfetta, “DARPA unveils winners of AI challenge to boost critical infrastructure cybersecurity”, Nextgov.com, 8 aug. 2025. Beschikbaar op: https://www.nextgov.com/cybersecurity/2025/08/darpa-unveils-winners-ai-challenge-boost-critical-infrastructure-cybersecurity/407337/

[8] J. Greig, “DARPA announces $4 million winner of AI code review competition at DEF CON”, The Record, 9 aug. 2025. Beschikbaar op: https://therecord.media/darpa-ai-code-competition-winner-def-con

[9] B. Vigliarolo, “Anthropic’s bug-hunting Mythos was greatest marketing stunt ever, says cURL creator”, The Register, 11 mai 2026. Beschikbaar op: https://www.theregister.com/security/2026/05/11/anthropics-bug-hunting-mythos-was-greatest-marketing-stunt-ever-says-curl-creator/5238111

[10] B. Schneier, “Claude Mythos is mostly “marketing hype””, Schneier on Security, 26 apr. 2026. Beschikbaar op: https://www.schneier.com/news/archives/2026/04/claude-mythos-is-mostly-marketing-hype.html

[11] F. Tréguer, “Anthropic, Silicon Valley’s conscience?”, Le Monde diplomatique, 1 mei 2026. Beschikbaar op: https://mondediplo.com/2026/05/12anthropic

[12] “Our evaluation of Claude Mythos Preview’s cyber capabilities | AISI Work”, AI Securty Institute (AISI), apr. 2026. Beschikbaar op: https://www.aisi.gov.uk/blog/our-evaluation-of-claude-mythos-previews-cyber-capabilities

[13] L. Folkerts et al., “Measuring AI agents’ progress on multi-step cyber-attack scenarios”, 17 mar. 2026, arXiv: arXiv:2603.11214. doi: 10.48550/arXiv.2603.11214.

[14] “Smaller and cheaper models also managed to discover the same security bugs as Claude Mythos, says AISLE analysis”, OfficeChai, 9 apr. 2026. Beschikbaar op: https://officechai.com/ai/smaller-and-cheaper-models-also-managed-to-discover-the-same-security-bugs-as-claude-mythos-says-aisle-analysis/

[15] « Our evaluation of OpenAI’s GPT-5.5 cyber capabilities », AI Security Institute, 30 avr 2026. Beschikbaar op: https://www.aisi.gov.uk/blog/our-evaluation-of-openais-gpt-5-5-cyber-capabilities

[16] B. Vanhalst, “Guardrails: hou je AI binnen de lijntjes”, Smals Research, 27 nov. 2025. Beschikbaar op: https://www.smalsresearch.be/guardrails-hou-je-ai-binnen-de-lijntjes/

[17] « 4th annual software supply chain security report 2026 – How sophisticated malware, AI, and broken trust are reshaping software security », Reversing Labs, 2026.

[18] B. Schneier, “AI found twelve new vulnerabilities in OpenSSL”, Schneier on Security, 18 feb. 2026. Beschikbaar op: https://www.schneier.com/blog/archives/2026/02/ai-found-twelve-new-vulnerabilities-in-openssl.html

[19] “NIST updates NVD operations to address record CVE Growth”, NIST, 15 apr. 2026. Beschikbaar op: https://www.nist.gov/news-events/news/2026/04/nist-updates-nvd-operations-address-record-cve-growth

[20] “The NVD infrastructure crisis: AI discovery overwhelms tracking”, CSAI Foundation | Cloud Security Alliance, mei 2026. Beschikbaar op: https://labs.cloudsecurityalliance.org/wp-content/uploads/2026/05/CSA_whitepaper_NVD_infrastructure_crisis_AI_vulnerability_discovery_20260504-csa-styled.pdf

[21] “Reddit taps Fleet’s autonomous patching to slash vulnerability exposure”, MarketChameleon.com. Consulté le: 27 mei 2026. Beschikbaar op: https://marketchameleon.com/articles/b/2026/5/15/reddit-autonomous-patch-fleet-ai-cybersecurity

[22] « Disrupting the first reported AI-orchestrated cyber espionage campaign », Anthropic, nov. 2025. Beschikbaar op: https://www-cdn.anthropic.com/d7dd50dd1185f59be051b307150d877f2b82bd2c.pdf

[23] D. O’Brien et P. Miller, « Black Hat Europe 2025: Inside the defender’s AI advantage », Security.com, 15 jan. 2026. Beschikbaar op: https://www.security.com/expert-perspectives/inside-defenders-ai-advantage

[24] Discussions privées à CyberSec Europe 2026, mei 2026.

[25] TrendAI, “Experience the AI security revolution”, 22 mei 2026.

[26] X. Du et al., “Reducing False Positives in Static Bug Detection with LLMs: An Empirical Study in Industry”, 26 jan. 2026, arXiv: arXiv:2601.18844. doi: 10.48550/arXiv.2601.18844.

[27] Rapid7, “Rapid7 2026 global threat landscape rReport shows exploited high and critical-severity vulnerabilities surged 105% as attack timelines collapsed”, Rapid7, 18 mar. 2026. Beschikbaar op: https://www.rapid7.com/about/press-releases/rapid7-2026-global-threat-landscape-report-shows-exploited-high-and-critical-severity-vulnerabilities-surged-105-as-attack-timelines-collapsed/

[28] J. Kisielius, « Shadow AI in IBM’s 2025 cost of a data breach report », 8 oct. 2025. Beschikbaar op: https://www.nudgesecurity.com/post/shadow-ai-the-emerging-security-threat-in-ibms-2025-cost-of-a-data-breach-report

[29] “The invisible enterprise: shadow AI and the ungoverned frontier”, Lab Space, 2 apr. 2026. Beschikbaar op: https://labs.cloudsecurityalliance.org/research/csa-whitepaper-shadow-ai-asset-blindness-systemic-risk-20260/

[30] L. Kornutick, S. Agarwal, A. Litan, S. Sicular, P. Sundararaman, et S. Palit, « Market guide for AI governance platforms », Gartner, G00837249, nov. 2025. Beschikbaar op: https://www.gartner.com/document-reader/document/7145930

IA et sécurité du code – Une mise à jour

Fabien A. P. Petitcolas — Tue, 09 Jun 2026 06:00:00 +0000

Dit artikel is ook beschikbaar in het Nederlands.

Il y a presque un an nous avons publié deux articles sur l’IA générative (IAGén) et la sécurité du code [1], [2] et nous avions conclu en soulignant que la plupart des études que nous avions rencontrées montraient des performances incohérentes et une tendance générale à des taux élevés de faux-positifs, dans la détection des failles de sécurité. Mais l’évolution des outils est rapide dans ce domaine. Les agents d’IA combinant un modèle de langage avec des outils d’analyse statique, une mémoire, et une forme de « raisonnement » structuré, ont commencé à découvrir des vulnérabilités dans des logiciels que des décennies de tests automatisés et de revues humaines n’avaient pas détectées.

Une évolution extrêmement rapide

Dès novembre 2024 [3], puis à nouveau en juillet 2025 [4] le système « Big Sleep » de Google a découvert deux vulnérabilités importantes dans le logiciel SQLite, pourtant très testé et utilisé. En début d’année 2026, la jeune pousse AISLE est allée plus loin : en utilisant des modèles d’IAGén avec sa propre infrastructure d’analyse, elle a trouvé 12 vulnérabilités zero-day – dont une faille critique [5], ainsi que des bogues remontant à des codes des années 1990 – dans la librairie OpenSSL pourtant largement auditée [6]. AISLE a signalé aussi un grand nombre de vulnérabilités dans plus d’une dizaine de projets établis, notamment Apache, Chromium, Firefox, le noyau Linux, OpenVPN, et Samba. En mars 2025, l’outil « Security Copilot » de Microsoft a découvert des vulnérabilités dans GRUB2 et U-Boot (des chargeurs d’amorçage utilisés par la plupart des systèmes Linux). En août 2025, lors de la compétition AI Cyber Challenge organisée par l’agence étatsunienne pour les projets de recherche avancée de défense (DARPA), sept systèmes d’IA y ont travaillé de manière autonome sur 54 millions de lignes de code, ont trouvé la majorité des vulnérabilités synthétiques insérées, et ont révélé 18 bogues jusqu’alors inconnus [7], [8].

Ces démonstrations, certes impressionnantes, tiennes plus à l’infrastructure mise en place autour de l’IAGén (les intégrations d’outils, les connexions aux logiciels d’analyse statique existants, les boucles de planification itératives) qu’aux performances brutes des modèles [2] : ce qui est donc déterminant ici, est la conception du système, plutôt que la capacité du modèle en soi.

À la conférence CyberSec Europe 2026, en plus du mot « souveraineté » qui continuait d’être répété depuis la conférence précédente, le mot « Mythos » a fait son apparition après le coup de marketing magistral de la société Anthropic [9], [10], qui n’en est d’ailleurs pas à son premier [11]. En effet, en 7 avril 2026, dans son annonce de la mise à disposition de Claude Mythos Preview réservée à quelques entreprises triées sur le volet, la société Anthropic affirmait que Mythos avait identifié de manière autonome des milliers de vulnérabilités zero-day dans des infrastructures logicielles critiques, découvert un vieux bogue dans OpenBSD, et été capable d’enchainer quatre vulnérabilités pour créer une exploitation de navigateur fonctionnelle. Les études indépendantes sont pour le moment quasiment inexistantes et seul l’Institut britannique de sécurité de l’IA (AISI) – un organisme gouvernemental chargé d’évaluer les systèmes d’IA avant et après leur déploiement – a pu évaluer Mythos Preview et a confirmé qu’il pouvait, dans 3 cas sur 10, mener à bien une simulation d’attaque en plusieurs étapes sur un réseau d’entreprise – un scénario estimé à 20 heures de travail pour un professionnel humain qualifié [12], [13].

Mais ces découvertes ne sont pas uniques à Mythos. Les vulnérabilités découvertes par Mythos, ont pu aussi être trouvées par la société AISLE en utilisant des modèles moins couteux et de plus petite taille, dont les poids sont publics et pouvant être exécutés sur du matériel grand public [10], [14]. Indépendamment, l’AISI a constaté que le modèle GPT-5.5, était lui-aussi capable de mener à bien une simulation d’attaque sur un réseau d’entreprise [15]. Lors de son évaluation, l’AISI a également identifié une technique « universelle » pour contourner les restrictions de sécurité du modèle rappelant que des garde-fous imposant un comportement au modèle [16] ne sont probablement pas aussi efficaces que des contraintes architecturales.

Suivre la cadence

Face à l’accélération de la découverte de nouvelles vulnérabilités, il devient impératif d’accélérer les pipelines de remédiation logicielle, notamment dans les composants comportant des dépendances externes critiques [17]. L’exemple d’OpenSSL en janvier 2026, démontre que l’audit automatisé est désormais un outil à double usage, accessible simultanément tant aux chercheurs qu’aux opérateurs criminels et aux acteurs étatiques [18].

Alors que le volume de CVE explose – avec une augmentation de 263 % entre 2020 et 2025 – il risque de saturer les capacités de correction traditionnelles dans la plupart des organisations [19], [20]. Dans son annonce Anthropic admettait que moins de 1 % des vulnérabilités trouvées par Mythos avaient été corrigées. Découvrir des vulnérabilités à grande échelle sans les corriger à la même échelle ne fait qu’allonger la liste des expositions, sans améliorer la sécurité. Dans ce contexte, seules les organisations ayant prépositionné une infrastructure de correction autonome et agile parviendront à réduire leur fenêtre d’exposition, là où les méthodes manuelles ne peuvent plus suivre la cadence imposée par l’IA [20], [21].

Heureusement, même si les outils d’IA, malgré leurs « hallucinations » [22], offrent de nombreuses nouvelles possibilités à l’attaque, l’impression qui ressort de conférences comme CyberSec Europe 2026 ou Black Hat Europe 2025 est que la défense semble, pour le moment, conserver l’avantage [23], [24]. Le marché des outils de sécurité pour les entreprises murit rapidement et ces outils tentent de faciliter le travail des analystes. Par exemple, l’outil « Security Copilot » de Microsoft, couvre le triage des alertes, l’optimisation des politiques d’accès et les enquêtes sur la sécurité des données et permettrait de réduire de manière importante le nombre d’alertes par incident et de résoudre plus rapidement des conflits de politiques de sécurité. Le triage automatisé des alertes issues de la gestion des événements et des informations de sécurité (SIEM) via des outils agentiques d’orchestration, d’automatisation et de réponse pour la sécurité (SOAR) permettrait de réduire le temps d’effort par incident de manière significative [25]. Plus généralement, des études de recherche rapportent des réductions substantielles des faux positifs sur les alertes lorsque l’IAGén est utilisée comme couche de triage contextuel par-dessus les outils traditionnels d’analyse statique [26].

La détection et la correction de vulnérabilités, ne sont pas le seul impact de l’IA sur la sécurité. L’automatisation des cyberattaques par l’IA permet aux attaquants d’opérer avec une célérité sans précédent — jusqu’à 3 600 fois plus vite que les humains — tout en ciblant simultanément un volume bien plus important d’actifs [20]. Face à un « rythme opérationnel » où le délai médian d’après publication est tombé à seulement 5 jours [27], les modèles de réponse manuels ou linéaires sont désormais obsolètes et incapables de contenir ces incursions à haute fréquence [20]. Cette évolution impose une refonte des livrets de réponse aux incidents (playbooks).

Enfin, l’utilisation de l’IA à des fins (plus ou moins) productives apporte elle aussi son lot de problèmes de sécurité dans les entreprises. Il est important d’identifier précisément où l’IA opère au sein d’une infrastructure afin de garantir la sécurité des données. Le phénomène de d’IA fantôme (shadow AI) — défini comme l’utilisation d’outils d’IA par des employées d’une organisation sans l’approbation ou la supervision du service informatique de celle-ci – représente un risque important. Cette exposition inclut des modèles accessibles via des comptes personnels, des fonctionnalités d’IA intégrées dans des logiciels tiers en tant que service (SaaS) sans achat explicite, ou encore des modèles open-source utilisés par des programmeurs en dehors de tout processus de gouvernance [28]. Une organisation ne peut pas défendre un périmètre qu’elle n’a pas défini, et l’absence de visibilité actuelle crée des vulnérabilités critiques : environ 91 % des outils d’IAGén en entreprise, fonctionneraient en dehors du contrôle de la direction du service informatique [29]. Or, sans un inventaire centralisé et une politique de surveillance continue, les entreprises s’exposent à des coûts de violation de données nettement plus élevés [30].

Conclusion

Très rapidement les outils de sécurité par IA sont passés de la phase de démonstration de recherche à la pertinence opérationnelle, des deux côtés de la barrière : tandis que les capacités offensives de l’IA ont abaissé la barre pour les acteurs criminels de niveau intermédiaire et permis des campagnes d’intrusion plus évolutives, les applications défensives – triage des alertes, découverte de vulnérabilités, filtrage des faux positifs, tests d’intrusions autonomes – intègrent des fonctionnalités d’IA et apportent des améliorations par rapport aux générations précédentes. La mise en œuvre de flux de travail défensifs augmentés par l’IA marque une transition importante dans l’ingénierie de sécurité.

Le défi n’est plus la détection, mais la correction.

Références

[1] F. A. P. Petitcolas, « L’IA pour améliorer la sécurité du code ? (Partie 1 : sécurité du code généré) », Smals Research, 30 juill. 2025. Disponible sur: https://www.smalsresearch.be/ia-pour-ameliorer-securite-du-code-1/

[2] F. A. P. Petitcolas, « L’IA pour améliorer la sécurité du code ? (Partie 2 : détection de vulnérabilités) », Smals Research, 26 août 2025. Disponible sur: https://www.smalsresearch.be/ia-pour-ameliorer-securite-du-code-2/

[3] R. Lakshmanan, « Google’s AI Tool Big Sleep Finds Zero-Day Vulnerability in SQLite Database Engine », The Hacker News, 11 nov. 2024. Disponible sur: https://thehackernews.com/2024/11/googles-ai-tool-big-sleep-finds-zero.html

[4] « NVD – CVE-2025-6965 », NIST – National Institute of Standards and Technology, juill. 2025. Disponible sur: https://nvd.nist.gov/vuln/detail/CVE-2025-6965

[5] « NVD – CVE-2025-15467 », CVE-2025-15467, janv. 2026. Disponible sur: https://nvd.nist.gov/vuln/detail/CVE-2025-15467

[6] A. Muanza, « Douze failles de sécurité découvertes dans OpenSSL par une analyse basée sur l’IA », 29 jan. 2026. Disponible sur: https://www.ictjournal.ch/news/2026-01-29/douze-failles-de-securite-decouvertes-dans-openssl-par-une-analyse-basee-sur-lia

[7] D. DiMolfetta, « DARPA unveils winners of AI challenge to boost critical infrastructure cybersecurity », Nextgov.com, 8 août 2025. Disponible sur: https://www.nextgov.com/cybersecurity/2025/08/darpa-unveils-winners-ai-challenge-boost-critical-infrastructure-cybersecurity/407337/

[8] J. Greig, « DARPA announces $4 million winner of AI code review competition at DEF CON », The Record, 9 août 2025. Disponible sur: https://therecord.media/darpa-ai-code-competition-winner-def-con

[9] B. Vigliarolo, « Anthropic’s bug-hunting Mythos was greatest marketing stunt ever, says cURL creator », The Register, 11 mai 2026. Disponible sur: https://www.theregister.com/security/2026/05/11/anthropics-bug-hunting-mythos-was-greatest-marketing-stunt-ever-says-curl-creator/5238111

[10] B. Schneier, « Claude Mythos is mostly “marketing hype” », Schneier on Security, 26 avr. 2026. Disponible sur: https://www.schneier.com/news/archives/2026/04/claude-mythos-is-mostly-marketing-hype.html

[11] F. Tréguer, « La bonne conscience de la Silicon Valley », Le Monde diplomatique, 1 mai 2026. Disponible sur: https://www.monde-diplomatique.fr/2026/05/TREGUER/69543

[12] « Our evaluation of Claude Mythos Preview’s cyber capabilities | AISI Work », AI Securty Institute (AISI), avr. 2026. Disponible sur: https://www.aisi.gov.uk/blog/our-evaluation-of-claude-mythos-previews-cyber-capabilities

[13] L. Folkerts et al., « Measuring AI agents’ progress on multi-step cyber-attack scenarios », 17 mars 2026, arXiv: arXiv:2603.11214. doi: 10.48550/arXiv.2603.11214.

[14] « Smaller and cheaper models also managed to discover the same security bugs as Claude Mythos, says AISLE analysis », OfficeChai, 9 avr. 2026. Disponible sur: https://officechai.com/ai/smaller-and-cheaper-models-also-managed-to-discover-the-same-security-bugs-as-claude-mythos-says-aisle-analysis/

[15] « Our evaluation of OpenAI’s GPT-5.5 cyber capabilities », AI Security Institute, 30 avr 2026. Disponible sur: https://www.aisi.gov.uk/blog/our-evaluation-of-openais-gpt-5-5-cyber-capabilities

[16] B. Vanhalst, « Garde-fous : délimitez votre IA », Smals Research, 27 nov. 2025. Disponible sur: https://www.smalsresearch.be/garde-fous-delimitez-votre-ai/

[17] « 4th annual software supply chain security report 2026 – How sophisticated malware, AI, and broken trust are reshaping software security », Reversing Labs, 2026.

[18] B. Schneier, « AI found twelve new vulnerabilities in OpenSSL », Schneier on Security, 18 fév. 2026. Disponible sur: https://www.schneier.com/blog/archives/2026/02/ai-found-twelve-new-vulnerabilities-in-openssl.html

[19] « NIST updates NVD operations to address record CVE Growth », NIST, 15 avr. 2026. Disponible sur: https://www.nist.gov/news-events/news/2026/04/nist-updates-nvd-operations-address-record-cve-growth

[20] « The NVD infrastructure crisis: AI discovery overwhelms tracking », CSAI Foundation | Cloud Security Alliance, mai 2026. Disponible sur: https://labs.cloudsecurityalliance.org/wp-content/uploads/2026/05/CSA_whitepaper_NVD_infrastructure_crisis_AI_vulnerability_discovery_20260504-csa-styled.pdf

[21] « Reddit taps Fleet’s autonomous patching to slash vulnerability exposure », MarketChameleon.com. Consulté le: 27 mai 2026. Disponible sur: https://marketchameleon.com/articles/b/2026/5/15/reddit-autonomous-patch-fleet-ai-cybersecurity

[22] « Disrupting the first reported AI-orchestrated cyber espionage campaign », Anthropic, nov. 2025. Disponible sur: https://www-cdn.anthropic.com/d7dd50dd1185f59be051b307150d877f2b82bd2c.pdf

[23] D. O’Brien et P. Miller, « Black Hat Europe 2025: Inside the defender’s AI advantage », Security.com, 15 jan. 2026. Disponible sur: https://www.security.com/expert-perspectives/inside-defenders-ai-advantage

[24] Discussions privées à CyberSec Europe 2026, mai 2026.

[25] TrendAI, « Experience the AI security revolution », 22 mai 2026.

[26] X. Du et al., « Reducing False Positives in Static Bug Detection with LLMs: An Empirical Study in Industry », 26 janvier 2026, arXiv: arXiv:2601.18844. doi: 10.48550/arXiv.2601.18844.

[27] Rapid7, « Rapid7 2026 global threat landscape rReport shows exploited high and critical-severity vulnerabilities surged 105% as attack timelines collapsed », Rapid7, 18 mars 2026. Disponible sur: https://www.rapid7.com/about/press-releases/rapid7-2026-global-threat-landscape-report-shows-exploited-high-and-critical-severity-vulnerabilities-surged-105-as-attack-timelines-collapsed/

[28] J. Kisielius, « Shadow AI in IBM’s 2025 cost of a data breach report », 8 oct. 2025. Disponible sur: https://www.nudgesecurity.com/post/shadow-ai-the-emerging-security-threat-in-ibms-2025-cost-of-a-data-breach-report

[29] « The invisible enterprise: shadow AI and the ungoverned frontier », Lab Space, 2 avr. 2026. Disponible sur: https://labs.cloudsecurityalliance.org/research/csa-whitepaper-shadow-ai-asset-blindness-systemic-risk-20260/

[30] L. Kornutick, S. Agarwal, A. Litan, S. Sicular, P. Sundararaman, et S. Palit, « Market guide for AI governance platforms », Gartner, G00837249, nov. 2025. Disponible sur: https://www.gartner.com/document-reader/document/7145930

Smals Research Webinar – Modernizing legacy projects with AI

Smals Research — Mon, 08 Jun 2026 08:54:59 +0000

(Nederlandstalige tekst : zie onder)

Modernisez vos projets legacy grâce à l’IA

Free webinar Smals Research – 04/06/2026 at 10h30
(language: Dutch, Public sector & Smals only)

Aujourd’hui déjà, les grands modèles de langage (LLM) et les assistants IA permettent de réaliser des gains de productivité considérables lors de l’écriture de nouveaux logiciels. Mais qu’en est-il du code legacy ? Les applications plus anciennes, souvent critiques, basées sur des architectures obsolètes ou des technologies dépassées, constituent un tout autre défi. L’IA offre-t-elle également une aide suffisante pour comprendre et moderniser ces systèmes existants ?.

Au cours de ce webinaire, nous partagerons nos propres expériences pratiques. À l’aide d’exemples concrets, par exemple dans des projets COBOL ou des bases de code Java vieillissantes, nous montrerons ce qui fonctionne et quels sont les pièges lorsque l’on applique l’IA à des systèmes legacy. Nous aborderons des stratégies ciblées, à la fois pour la documentation et pour la réécriture progressive de code ancien, et partagerons des conseils pratiques autour du vibe coding dans le terminal. Vous pourrez ainsi mieux évaluer ce que vous pouvez attendre ou non de cette technologie aujourd’hui.

Que vous souhaitiez vous lancer dans la modernisation d’une ancienne application ou simplement mieux comprendre comment l’IA, en tant que boîte à outils intelligente, peut contribuer à la gestion des bases de code existantes, ce webinaire vous aidera à faire vos premiers pas en toute prudence et vous donnera un aperçu réaliste de ce que l’IA peut et ne peut pas encore résoudre pour vous aujourd’hui.

La session sera tenue en néerlandais, avec des slides en anglais. Ce webinaire est réservé aux collaborateurs du secteur public et de Smals. Pour bien suivre ce webinaire, il est recommandé d’avoir des connaissances de base en matière de développement logiciel.

Koen Vanderkimpen est chercheur chez Smals, spécialisé dans le software engineering.

Slides et enregistrement

Les slides et l’enregistrement du webinaire sont désormais disponibles :

Les webinaires de Smals Research sont gratuits et destinés aux collaborateurs de Smals et du secteur public. L’intention est de présenter les résultats du travail de Smals Research sur l’utilisation des nouvelles technologies dans le secteur public. Cette invitation peut donc être envoyée aux personnes intéressées du secteur public. Abonnez-vous à la liste de diffusion Smals Research Newsletter & Webinars via le site web website.smalsrech.be.

Modernisering van legacy-projecten met AI

Free webinar Smals Research – 04/06/2026 at 10h30
(language: Dutch, Public sector & Smals only)

Grote taalmodellen (LLM’s) en AI-assistenten leveren vandaag al aanzienlijke productiviteitswinst op bij het schrijven van nieuwe software. Maar hoe zit het met legacy-code? Oudere, vaak kritieke toepassingen met achterhaalde architecturen of verouderde technologieën vormen een heel andere uitdaging. Biedt AI ook voldoende hulp om deze bestaande systemen te doorgronden en te moderniseren?

Tijdens dit webinar delen we onze eigen onderzoekservaringen uit de praktijk. Aan de hand van concrete voorbeelden, bijvoorbeeld in COBOL-projecten of verouderde Java codebases, laten we zien wat helpt en waar de valkuilen liggen wanneer je AI loslaat op legacy-systemen. We bespreken gerichte strategieën voor zowel het documenteren als het stapsgewijs herschrijven van oude code, en delen praktische tips rond vibe coding in de terminal. Zo kan je beter inschatten wat je vandaag wel én niet van deze technologie mag verwachten.

Of je nu zelf aan de slag wil met het moderniseren van een oude toepassing of simpelweg beter wil begrijpen hoe AI als een slimme gereedschapskist kan bijdragen aan het beheer van bestaande codebases: dit webinar helpt je om een voorzichtige eerste start te maken en schept een realistisch beeld van wat AI vandaag wel én nog niet voor je kan oplossen.

De sessie wordt in het Nederlands gehouden, met Engelstalige slides. Dit webinar is voorbehouden voor medewerkers van de overheidssector en Smals. Om dit webinar goed te kunnen volgen is basiskennis van softwareontwikkeling aangewezen.

Koen Vanderkimpen is onderzoeker bij Smals en gespecialiseerd in software engineering.

Slides en recording

Slides en recording van de webinar zijn nu beschikbaar:

De webinars van Smals Research zijn gratis en bestemd voor medewerkers van de publieke sector en Smals. Bedoeling is de onderzoeksresultaten van Smals Research naar het gebruik van nieuwe en recente technologieën in de publieke sector kenbaar te maken. Deze uitnodiging mag dan ook doorgestuurd worden naar geïnteresseerden binnen de overheidssector. Inschrijven in de distributielijst Smals Research Nieuwsbrief & Webinars, kan via website.smalsrech.be.

.

« Modernizing legacy projects with AI » – Webinar by Smals Research

Webinar Smals, WebEx

Koen Vanderkimpen
Smals Research

04/06/2026 10h30 – 11h45

Language: Dutch / Slides in English

Webinar – Modernizing legacy projects with AI

Koen Vanderkimpen — Thu, 04 Jun 2026 14:11:39 +0000

Grote taalmodellen (LLM’s) en AI-assistenten leveren vandaag al aanzienlijke productiviteitswinst op bij het schrijven van nieuwe software. Maar hoe zit het met legacy-code? Oudere, vaak kritieke toepassingen met achterhaalde architecturen of verouderde technologieën vormen een heel andere uitdaging. Biedt AI ook voldoende hulp om deze bestaande systemen te doorgronden en te moderniseren?

De sessie wordt in het Nederlands gehouden, met Engelstalige slides.

Aujourd’hui déjà, les grands modèles de langage (LLM) et les assistants IA permettent de réaliser des gains de productivité considérables lors de l’écriture de nouveaux logiciels. Mais qu’en est-il du code legacy ? Les applications plus anciennes, souvent critiques, basées sur des architectures obsolètes ou des technologies dépassées, constituent un tout autre défi. L’IA offre-t-elle également une aide suffisante pour comprendre et moderniser ces systèmes existants

Au cours de ce webinaire, nous partagerons nos propres expériences pratiques. À l’aide d’exemples concrets, par exemple dans des projets COBOL ou des bases de code Java vieillissantes, nous montrerons ce qui fonctionne et quels sont les pièges lorsque l’on applique l’IA à des systèmes legacy. Nous aborderons des stratégies ciblées, à la fois pour la documentation et pour la réécriture progressive de code ancien, et partagerons des conseils pratiques autour du vibe coding dans le terminal. Vous pourrez ainsi mieux évaluer ce que vous pouvez attendre ou non de cette technologie aujourd’hui.

La session est tenue en néerlandais, avec des slides en anglais.

Recording

Presentation

webinar-modernisering-legacy-met-AI Download

Les jumeaux numériques dans un contexte administratif

Joachim Ganseman — Fri, 29 May 2026 07:12:26 +0000

Dit artikel is ook beschikbaar in het Nederlands.

La NASA affirme avoir été la première à appliquer le concept de jumeau numérique (“Digital Twin”). Afin de mieux prédire le comportement des objets qu’elle envoyait dans l’espace, elle avait besoin d’une copie sur Terre – non seulement physique, mais aussi numérique. Certains scénarios sont tout simplement difficiles à reproduire sur Terre, mais doivent pouvoir être simulés de manière aussi détaillée que possible. Cette approche s’est répandue dans d’autres secteurs, comme l’aéronautique, où des erreurs de conception pourraient avoir des conséquences catastrophiques, ou encore là où une méthode par essais et erreurs serait trop coûteuse ou pratiquement impossible.

Le jumeau numérique n’est toutefois apparu sur le radar de Gartner qu’à la fin de l’année 2016. La page Wikipédia consacrée à ce sujet est aussi relativement récente, puisqu’elle a été créée en 2015, bien plus tard que celles dédiées à la réalité virtuelle (2001) et à l’Internet des objets (2007). L’idée des jumeaux numériques a toutefois rapidement gagné en popularité, aidée en cela par le programme européen Horizon 2020 qui y a vu un potentiel et a financé divers projets sur ce thème à hauteur de plusieurs millions d’euros ([1], [2], [3], [4]). En Flandre, cette opportunité a été saisie avec empressement, avec l’IMEC dans un rôle central, soutenu par un Digitaal Vlaanderen enthousiaste, sans oublier VITO, qui est également convaincu.

D’un point de vue marketing, le jumeau numérique a donc déjà fait ses preuves. Mais peut-il apporter une valeur ajoutée concrète aux administrations publiques ? Dans ce domaine également, les flux opérationnels deviennent rapidement complexes, les modifications peuvent s’avérer coûteuses, et l’on souhaite peut-être pouvoir simuler certaines choses avant de les mettre en œuvre. Dans cet article, nous examinerons ce que le jumeau numérique peut apporter dans un contexte administratif.

Définitions

Il existe de nombreuses interprétations du jumeau numérique. L’essence même du concept n’est en tout cas pas nouvelle : un système est représenté numériquement afin de pouvoir être observé, testé et amélioré sans impact direct sur son fonctionnement réel. La principale caractéristique distinctive est la synchronisation continue (ou du moins régulière) entre le système réel (l’entité cible ou target entity) et son homologue numérique. Le Centre commun de recherche de l’UE adopte un modèle de maturité qui distingue différents niveaux d’intégration ; ce n’est que dans le cas d’un échange bidirectionnel de données entre l’entité cible et le jumeau que l’on parle véritablement de jumeau. À l’échelle internationale, des efforts sont entrepris pour standardiser la terminologie.

“Digital Twin Maturity Spectrum”. Source: IET & Atkins, “Digital Twins for the Built Environment”, 2019.

Pour être utile, un jumeau numérique doit être développé avec suffisamment de détails. Le niveau de granularité ou de résolution variera en fonction de l’application. Le jumeau doit pouvoir représenter fidèlement l’entité cible tout au long de son cycle de vie, mais cela ne signifie pas que chaque détail doive être simulé dans les moindres détails. Dans le secteur médical, on voit apparaître des jumeaux numériques au niveau de la cellule, de l’organe, d’un individu ou de la population. Rien n’empêche non plus qu’un jumeau numérique ne constitue qu’une partie d’un système plus vaste ; il peut, par exemple, n’être élaboré que pour un seul composant critique.

On distingue deux courants de jumeaux numériques :

Les jumeaux technologiques de haut niveau (aéronautique, industrie, infrastructure), où le jumeau est utilisé pour le diagnostic, la maintenance prédictive ou la conception itérative sur la base de données opérationnelles – à la NASA, pour la distribution d’électricité…
Les jumeaux de systèmes d’information ou sociotechniques (villes, organisations, services), dans lesquels l’entité cible n’est pas tant une machine qu’un système complexe impliquant plusieurs parties prenantes, composé de processus, de règles, de personnes et de flux de données. C’est dans ce deuxième courant que s’inscrit le secteur public, mais c’est aussi là que les définitions deviennent floues et que le “jumeau numérique” est parfois utilisé comme terme marketing pour désigner une structure “tableau de bord + modèle“.

Alors que le flou est peut-être inévitable sur le plan politique, nous souhaitons néanmoins une interprétation plus opérationnelle dans la pratique. Nous pourrions définir un jumeau numérique administratif comme une représentation numérique de la réalité de la prestation de services, continuellement actualisée et testable. Cela inclut les processus, les dossiers et leur état d’avancement, un système applicable des règles en vigueur, ainsi que l’ensemble des flux de données nécessaires au bon fonctionnement de l’ensemble. Cela doit permettre de suivre de près la situation actuelle et de simuler à l’avance les modifications éventuelles avant leur application.

Les jumeaux numériques (DT) conceptuellement : données du système cible + moteurs de calcul (= enabler) + applications (= usage). Source: Oakes, Parsai, Van Mierlo, Demeyer, Denil, De Meulenaere, Vangheluwe, “Improving digital twin experience reports”, DOI: 10.5220/0010236101790190

Pour un processus industriel piloté par des données de capteurs et les lois immuables de la physique, cela s’avère plus facile que pour le secteur public, où l’on traite souvent des données sensibles et où l’on dépend de règles changeant régulièrement qui laissent place à l’interprétation (voir également nos articles précédemment publiés sur les Rules As Code). Les préoccupations liées à la gouvernance des données (RGPD, etc.) peuvent compliquer la mise en place d’une synchronisation avec les données en temps réel. La logique décisionnelle est souvent étroitement liée au code des applications, ce qui complique les ajustements et les contrôles de conformité. C’est pourquoi, dans le contexte public, la mise en place d’un Digital Shadow, que l’on peut situer quelque part entre un “bête” modèle et un véritable jumeau synchronisé, constitue souvent déjà un exploit en soi.

Projets phares

En Europe, les projets de jumeaux numériques les plus marquants concernent principalement le climat et la science :

Destination Earth ou DestinE combine des données à grande échelle provenant de satellites (météorologiques) et de Copernicus dans un lac de données. Sur cette base, deux jumeaux numériques ont vu le jour : Climate Change Adaptation (long terme) et Weather-induced Extremes (court terme). Pour ce faire, ils ont développé leur propre Digital Twin Engine. Le projet se poursuit, l’objectif étant de faciliter davantage les “applications en aval” d’utilisateurs externes qui peuvent approfondir certains aspects ou des questions de recherche spécifiques. Tout cela doit être partagé via une plateforme unique coordonnée par l’ESA.
Le projet EDITO vise à atteindre des objectifs similaires, mais dans le domaine des océans.
À cette fin, les données d’EMODnet et de Copernicus sont mises en commun. L’accès passe par un Datalab qui propose également une série d’autres modules et services, et les applications qui y sont développées peuvent être hébergées sur la plateforme numérique de l’initiative.
Plusieurs use cases sont également répertoriés dans le cadre du projet de recherche interTwin, récemment achevé (et financé par l’Union européenne), qui visait à développer une architecture quelque peu standardisée avec des composants réutilisables pour les jumeaux numériques. Ils ont abordé le sujet plutôt sous l’angle du CERN, et indépendamment des deux initiatives mentionnées précédemment. Au fil du temps, ils ont toutefois pris conscience de l’existence les uns des autres et une interopérabilité potentielle avec le projet DestinE, lié à l’ESA, a déjà été étudiée.

Utilisation d’un jumeau numérique pour la surveillance. Source: Davila Delgada & Oyedele, “Digital Twins for the built environment: learning from conceptual and process models in manufacturing”, DOI: 10.1016/j.aei.2021.101332

Dans un contexte administratif, les données issues de satellites ou d’accélérateurs de particules nous sont moins utiles. En raison des exigences en matière de gouvernance, l’accent est plutôt mis sur une interopérabilité et un échange de données corrects, conformément à tous les cadres juridiques en vigueur. À cet égard, les initiatives européennes les plus utiles sont peut-être encore les Espaces européens des données – pour un “jumeau politique”, par exemple, l’Espace européen des données juridique. Il existe également des points communs avec le concept de bacs à sable réglementaires tel qu’il apparaît notamment dans le Règlement pour une Europe interopérable ou, plus récemment, dans la législation sur l’intelligence artificielle : un jumeau numérique administratif peut remplir le rôle d’un tel bac à sable s’il existe de bons mécanismes de développement et d’évaluation de scénarios.

Use Cases administratifs

Avant de nous lancer dans des secteurs complexes tels que les soins de santé et la sécurité sociale, nous devons tout de même nous demander si les jumeaux numériques peuvent apporter une réelle valeur ajoutée à ce qui existe déjà aujourd’hui – car l’engouement en soi n’apporte rien.

Use Case 1 : Simulation des politiques et de leur impact opérationnel

En matière de modélisation de politiques pour la sécurité sociale, il existe par exemple déjà une base solide avec le modèle de microsimulation EUROMOD, dont la variante belge s’appelle BELMOD. Il s’agit de microsimulations statiques dans lesquelles des données très détaillées sont combinées à des règles codifiées, permettant de simuler des réformes des paramètres de la sécurité sociale (cotisations, allocations…). Ces études sont généralement menées dans les universités. On peut se faire une idée de ce que cela implique via EUROMOD Online.

D’une certaine manière, ce type de modèle s’apparente déjà à un jumeau numérique pour la politique sociale, mais il lui manque encore deux éléments essentiels :

des liens en temps réel avec les données administratives : cela permettrait de simuler les effets budgétaires et distributifs sur la situation actuelle, plutôt que sur des données obsolètes datant de plusieurs années.
des informations sur les processus de prestation de services (délais de traitement des dossiers, capacité de traitement…) : cela permettrait également d’évaluer l’impact opérationnel des réformes sur les services exécutifs.

Il ne serait pas du tout simple d’ajouter cela : les données en question sont de nature très sensible. L’utilisation des données réelles comme source de données en temps réel pour les simulations nécessiterait certainement une anonymisation poussée (conformément au RGPD), en plus d’une série d’autres mesures de sécurité. Il s’agit là d’un exercice complexe en soi, qui pourrait également entraîner la perte d’informations utiles.

Le statut d’une personne au sein de la sécurité sociale est en outre déterminé par une succession d’événements susceptibles d’avoir des répercussions à long terme et d’interagir entre eux (emploi, licenciement, maladie, accident, pension, naissance d’un enfant…). Pour être vraiment utile, un jumeau devrait pouvoir modéliser l’ensemble du parcours d’un individu au sein du système. Non seulement le statut individuel, mais aussi celui des dossiers (les délais sont-ils respectés ?) et de l’administration (y a-t-il un retard dans le traitement ?) évoluent au fil du temps.

Si, aujourd’hui, une bonne ombre numérique (digital shadow) d’un service est déjà disponible, l’ajout de données évolutives relatives à la répartition de la charge de travail, aux capacités, à l’avancement des dossiers… permettrait de franchir une nouvelle étape, comme une simulation du flux de dossiers. De telles simulations sélectives peuvent servir à des analyses contrefactuelles (“et si”) qui permettent de mieux évaluer l’impact d’un changement (au niveau organisationnel ou réglementaire). À l’inverse, on peut également y voir un cadre pour des tests de régression : les calculs effectués sur des échantillons représentatifs peuvent être répétés chaque fois qu’un élément change, afin de localiser l’impact le plus important.

Use Case 2 : Planification organisationnelle dans les soins de santé

L’administration des soins de santé a d’autres priorités : le suivi des patients et des consultations est urgent, l’affectation du personnel et des ressources est un casse-tête de planification complexe, sans parler des divers remboursements et assurances… Pour évoluer vers le jumeau numérique, les espaces européens des données de santé pourraient jouer un rôle important, tout comme les nouvelles solutions que l’on s’efforce actuellement de mettre au point pour l’utilisation secondaire des données de santé.

Nous sommes encore loin du rêve des soins de santé optimisés individuellement sur la base d’un jumeau numérique personnel du patient, une idée qui s’accompagne d’ailleurs de nombreux risques non négligeables sur les plans de l’éthique et de la confidentialité. À plus court terme, les possibilités se situent plutôt au niveau de l’organisation. En ajoutant à une ombre numérique existante des données relatives aux admissions, aux listes d’attente, à l’affectation du personnel et à l’activité, il devient possible de mieux absorber les évolutions stratégiques et opérationnelles.

Les nombreux aspects d’un jumeau numérique, ici pour l’immunologie. Source: Niarakis et.al., “Immune digital twins for complex human pathologies: applications, limitations, and challenges”, DOI: 10.1038/s41540-024-00450-5

La mise en œuvre: une opération couteuse ?

Pour rester concentrées sur ce qui est possible aujourd’hui ou à court terme, les administrations peuvent s’inspirer des “piles de référence” de composants technologiques, développées dans le cadre de jumeaux numériques existants. Nous en avons déjà mentionné quelques-unes précédemment et ne les répéterons pas ici.

Un jumeau numérique doit pouvoir contenir une représentation de l’état actuel d’un système et traiter les événements qui ont un impact sur celui-ci. À cette fin, dans le cadre des initiatives européennes FIWARE (Future Internet), le groupe de travail Context Information Management au sein de l’ETSI (l’Institut européen des normes de télécommunications) a développé le standard et l’API NSGI-LD. Il semble toutefois que ce standard ne soit pas encore très répandu en dehors de son propre réseau composé principalement des initiatives Smart City et IoT.

Les systèmes administratifs ne se résument pas à de simples décisions. Les processus impliquent des interactions, des documents et, parfois, une certaine marge d’appréciation. Les standards ouverts issus du business process management s’avèrent ici utiles. DMN (decision modeling), BPMN (business processes) et CMMN (case management) sont complémentaires et permettent de modéliser ces aspects. Des extensions voient également le jour à partir de ces initiatives, comme Constraint DMN (cDMN), développé à la KULeuven, qui permet une logique plus complexe. Nous pouvons alors composer un jumeau numérique à partir d’un moteur de décision DMN qui calcule “ce que disent les règles” (c’est là que l’approche Rules As Code peut éventuellement trouver sa place), enrichi de couches qui prennent en charge les processus et le flux de dossiers (statut, délais, documents de support), et enfin d’une synchronisation régulière pour pouvoir mettre à jour l’état opérationnel (ou le contexte). Cette approche est compatible avec le modèle de maturité du CCR (model -> shadow -> twin).

Les jumeaux numériques ne sont pas coûteux parce qu’ils intègrent beaucoup de visualisation ou des capacités de reporting. Ils sont coûteux parce qu’ils constituent une réplique du système cible qui, tout comme l’original, doit continuer à fonctionner correctement au fil du temps. Pour aller au-delà de l’engouement, ils nécessitent un investissement constant en maintenance. Ces coûts récurrents comprennent au moins les éléments suivants :

surveillance et validation : un jumeau numérique doit suivre chaque modification apportée au système cible avec la plus grande précision possible, ce qui nécessite des mises à jour régulières ;
maintenance des règles et traçabilité : cela représente un coût important, surtout lorsque les règles changent fréquemment. C’est là que la gestion des versions, les suites de tests et la gestion des changements jouent un rôle ;
fonctionnement des pipelines de données et interopérabilité : cela englobe également la sémantique, le contrôle des accès, la qualité des données, la précision et la sécurité.
confidentialité et conformité : indispensables, certainement pour les systèmes qui traitent des données à caractère personnel (santé, revenus, famille).

Pour un cas d’utilisation administratif, la meilleure première étape consiste donc à mettre en place de manière systématique ce que l’on pourrait appeler une “ombre numérique respectueuse de la vie privée” : initialement limitée à des fonctionnalités de surveillance et de répétition, avec un contrôle d’accès strict et une minimisation des données. On peut ensuite envisager une extension à des simulations sur des jeux de données anonymisées ou synthétiques. Une éventuelle synchronisation en temps quasi réel avec les données du système cible réel, afin de créer un véritable jumeau numérique, ne peut intervenir qu’à la fin du processus et s’avère souvent assez complexe à mettre en œuvre.

Conclusion

Un jumeau numérique est-il la solution adéquate, ou existe-t-il une alternative plus simple ?
En résumé, les jumeaux numériques ne doivent être envisagés que si toutes les conditions suivantes sont remplies (sinon, une autre approche peut s’avérer plus efficace et mieux adaptée) :

Le système cible modélisé est dynamique : les résultats dépendent de situations en constante évolution (flux de dossiers, files d’attente, cycle de vie des événements), et pas uniquement de contrôles d’éligibilité ou de formulaires.
Il est possible d’identifier des sources de données de référence et de maintenir une synchronisation continue. Sans mises à jour régulières avec des données opérationnelles, on construit un modèle et non un jumeau.
Les simulations mènent à de vraies décisions. Si l’organisation ne dispose pas d’une liberté suffisante pour intervenir (modification des politiques, adaptation du flux de dossiers, priorisation, tâches du personnel…), une série de tableaux de bord suffira probablement.
Il existe un plan crédible d’audit et de contrôle qualité permanent. Cela ne doit pas être une considération a posteriori, mais un critère d’acceptation. Il est inutile de construire un jumeau qui se détériore plus vite que le système cible.
L’environnement juridique et de conformité est compatible. Si des données à caractère personnel sont impliquées, le RGPD et l’AI Act peuvent entraîner des obligations qui influencent fortement la faisabilité et le coût. Cela peut limiter un jumeau à un simple système de test amélioré au lieu d’apporter une véritable contribution à l’automatisation opérationnelle.

Un système non jumeau peut également s’avérer utile : avec des règles codifiées, un harnais de test et une surveillance, on dispose déjà d’une configuration transparente permettant d’obtenir toutes sortes d’informations, sans la complexité ni le coût d’une synchronisation complète ou d’une infrastructure de simulation. Dans un environnement administratif, un tel modèle de politique peut déjà répondre à de nombreux besoins sans jumeau numérique opérationnel, même si cela risque d’être décevant pour ceux qui aiment s’appuyer sur des mots à la mode.

Dark web: Threats and opportunities

Smals Research — Wed, 27 May 2026 12:14:41 +0000

(NL) Maak kennis met het dark web!
Het dark web roept vaak beelden op van illegaliteit, maar wat schuilt er werkelijk achter de anonimiteit? Roald Santens (Smals Academy) en Vandy Berten (Smals Research) nemen je mee op een verkenningstocht door de krochten van het internet. Je leert hoe de techniek achter anonieme netwerken werkt, wat de gevaren zijn voor organisaties, en waarom het dark web ook waardevolle kansen biedt. Kijk en luister hier waarom (Frans gesproken, NL ondertitels zijn beschikbaar).

(FR) À la découverte du dark web !
Le dark web évoque souvent des images d’illégalité, mais que se cache-t-il réellement derrière cet anonymat ? Roald Santens (Smals Academy) et Vandy Berten (Smals Research) vous emmènent explorer les profondeurs de l’internet. Vous découvrirez le fonctionnement technique des réseaux anonymes, les dangers pour les organisations, ainsi que les opportunités précieuses que le dark web peut offrir. Regardez et écoutez ici pour découvrir pourquoi.

(EN) Discover the Dark Web!
The dark web often evokes images of illegal activity, but what truly lies behind that anonymity? Roald Santens (Smals Academy) and Vandy Berten (Smals Research) take you on an exploration through the depths of the internet. You will learn how the technology behind anonymous networks works, the risks organizations face, and why the dark web also offers valuable opportunities. Watch and listen here to find out (French speaking, EN subtitles available).

Smals Research

GEO: Zichtbaarheid van websites in het tijdperk van AI

Basisbegrippen

Wat is GEO?

De impact van generatieve AI op het zoeken op internet

Belangrijkste verschillen tussen SEO en GEO

Van zoekopdracht tot antwoord: hoe werkt generatief zoeken?

Strategie voor het optimaliseren van websites voor generatieve AI

Hoe de efficiëntie van een GEO-strategie meten?

Conclusie en aanbevelingen

Sovereignty and AI

GEO: Visibilité des sites web à l’ère de l’IA

Concepts de base

Qu’est-ce que le GEO ?

Impact de l’IA générative sur la recherche web

Principales différences entre SEO et GEO

De la requête à la réponse : comment fonctionne la recherche générative

Stratégie d’optimisation des sites web pour l’IA générative

Comment mesurer l’efficacité d’une stratégie GEO

Conclusions et recommandations

Anomaliedetectie: wanneer machine learning het ongewone opspoort

Inleiding

Verschillende soorten anomalieën

Detectiemethodes

Welk soort learning?

Enkele klassieke algoritmes voor het opsporen van anomalieën

Detectoren zonder modellen

Detectiemodellen

Illustratief voorbeeld

Detectie evalueren

Conclusie

AI en codeveiligheid – Een update

Een extreem snelle evolutie

Bijbenen

Conclusion

Références

IA et sécurité du code – Une mise à jour

Une évolution extrêmement rapide

Suivre la cadence

Conclusion

Références

Smals Research Webinar – Modernizing legacy projects with AI

Modernisez vos projets legacy grâce à l’IA

Free webinar Smals Research – 04/06/2026 at 10h30(language: Dutch, Public sector & Smals only)

Slides et enregistrement

Modernisering van legacy-projecten met AI

Free webinar Smals Research – 04/06/2026 at 10h30(language: Dutch, Public sector & Smals only)

Slides en recording

.

« Modernizing legacy projects with AI » – Webinar by Smals Research

Webinar – Modernizing legacy projects with AI

Recording

Presentation

Les jumeaux numériques dans un contexte administratif

Définitions

Projets phares

Use Cases administratifs

Use Case 1 : Simulation des politiques et de leur impact opérationnel

Use Case 2 : Planification organisationnelle dans les soins de santé

La mise en œuvre: une opération couteuse ?

Conclusion

Dark web: Threats and opportunities

Free webinar Smals Research – 04/06/2026 at 10h30
(language: Dutch, Public sector & Smals only)

Free webinar Smals Research – 04/06/2026 at 10h30
(language: Dutch, Public sector & Smals only)