Les grands modèles de langage (LLM) transforment progressivement notre manière de chercher de l’information en ligne. Google reste aujourd’hui le moteur de recherche dominant, mais de plus en plus d’utilisateurs se tournent vers des outils d’IA générative pour obtenir des réponses synthétisées à leurs requêtes. Cette évolution change la manière dont les marques, les organisations et les administrations publiques doivent rendre leurs contenus visibles sur le web. C’est dans ce contexte qu’un nouveau concept d’optimisation de la visibilité d’un site apparaît : le Generative Engine Optimization, ou GEO. Dans cet article, nous introduisons dans les grandes lignes le GEO.

Concepts de base

Qu’est-ce que le GEO ?

Exemple d’aperçu IA dans le moteur de recherche Google

L’optimisation pour les moteurs de recherche (SEO ou Search Engine Optimisation) a longtemps été la méthode utilisée pour améliorer la visibilité d’un site web dans les résultats de recherche. Cependant, avec l’essord de l’IA générative le GEO est apparu comme un nouveau paradigme d’optimisation. Il s’agit d’un ensemble de pratiques visant à optimiser le contenu d’un site web afin qu’il puisse être cité dans les réponses générées par les systèmes IA tels que l’aperçu IA de Google (Google AI Overview), le chatbot Copilot Search de Bing et ChatGPT. Alors que les moteurs de recherche traditionnels fournissent une liste d’URL classées en fonction de leur pertinence, les moteurs génératifs fournissent une réponse synthétisée générée par un grand modèle de langage à partir de multiples sources web.

L’évolution de l’IA générative a profondément transformé le paysage des moteurs de recherche, en introduisant de nouveaux outils de recherche. Ces outils peuvent être classés en deux groupes :

Les moteurs de recherches traditionnels augmentés par l’IA (AI Overviews) : Les AI Overviews ou aperçus IA sont des fonctionnalités intégrées aux moteurs de recherche qui propose une réponse synthétisée à la requête de l’utilisateur. Dans Google Search, ces aperçus apparaissent en haut de la page de résultats et génèrent un résumé incluant des citations issues de différentes sources.
Les plateformes de recherche conçues from scratch avec l’IA : Ces chatbots permettent aux utilisateurs d’effectuer des recherches itératives en posant des questions complémentaires. Les liens vers les sources sont directement intégrés dans les réponses générées. Des exemples notables sont Perplexity AI, Gemini, Microsoft Copilot et ChatGPT.

Impact de l’IA générative sur la recherche web

Les moteurs de recherche basé sur l’IA générative introduisent des changements cruciaux dans le comportement des utilisateurs et dans la logique de recherche.

Préférence pour les résumés plutôt que les clics

Un changement majeur est la préférence croissante des utilisateurs pour les réponses résumées plutôt que pour les liens. Les utilisateurs s’attendent de plus en plus à des réponses précises et contextualisées, délivrées directement par l’IA ; la recherche est en train de devenir une conversation plus qu’un cycle requête-résultats-clics.

Perte du suivi de l’utilisateur

Les moteurs génératifs posent un défi important en matière de suivi des utilisateurs. Contrairement aux outils classiques d’analyse web, ces plateformes ne donnent généralement pas accès à certaines informations techniques, comme l’adresse IP et leur comportement de navigation. Il devient donc plus difficile de comprendre précisément le parcours des utilisateurs, de mesurer leur engagement et de personnaliser l’expérience proposée.

L’anonymisation de l’utilisateur est d’avantage un problème pour les entreprises commerciales que pour les institutions publiques. Cependant, des informations précieuses telles que le type de questions posées par les citoyens et l’utilisation (anonyme) du site web, sont perdues.

Perte de contrôle sur l’information fournie aux citoyens et aux entreprises

Les informations mises à disposition des entreprises et des citoyens sur les sites des institutions publiques peuvent être subtiles et complexes notamment celles qui sont de nature juridique. Ceci peut rendre leur compréhension difficile pour les modèles d’IA qui généreraient des réponses incorrectes.

Principales différences entre SEO et GEO

Alors que le SEO repose sur les mots-clés pour améliorer le classement et diriger le trafic vers un site web, le GEO est centré sur le contenu. Son objectif est d’optimiser une visibilité accrue dans les résumés générés par l’IA (visibilité basée sur la citation), plutôt que de se concentrer uniquement sur le classement (ranking). Par conséquent, le contenu doit être de haute qualité et structuré de manière à être facilement interprétable par un LLM.

Paradigme SEO	Paradigme GEO
Objectif : Générer du trafic vers des URL spécifiques grâce au positionnement dans les pages de résultats des moteurs de recherche. Créer du contenu « optimisé pour le clic ».	Objectif : Obtenir des citations dans un résumé généré par l’IA.
Correspondance requête – site web : Mots-clés, autorité des liens entrants.	Correspondance requête – site web : Similarité sémantique entre la requête et le contenu du site.
Résultat : Liste de liens cliquables.	Résultat : Résumé cohérent incluant des citations et basé sur plusieurs sources.
Engagement des utilisateurs : Les utilisateurs cliquent et consultent plusieurs sites web.	Engagement des utilisateurs : Les utilisateurs reçoivent une réponse synthétisée et cliquent sur les sources citées ou s’engage dans une conversation avec l’IA.
Mesure des performances : Position dans le classement et taux de clics.	Mesure des performances : Fréquence de citation, c’est-à-dire la fréquence à laquelle un site web est utilisé comme référence pour appuyer des affirmations dans le résumé généré par l’IA.

Remarque : Dans le cadre du GEO, la clarté, la structure et la richesse sémantique priment sur la densité de mots-clés ou les backlinks. Toutefois, le SEO demeure le socle sur lequel doit reposer toute stratégie GEO.

De la requête à la réponse : comment fonctionne la recherche générative

Le cas spécifique des Aperçus IA (AI Overviews) dans la recherche Google

Le processus de génération des Aperçus IA suit un schéma similaire à celui de la génération augmentée par récupération (RAG) qui inclut les étapes suivantes :

Décomposition de la requête (Query fan-out) : La requête soumise par l’utilisateur est décomposée en sous-requêtes plus petites.
Récupération : Pour chaque sous-requête, l’index web traditionnel est parcouru afin d’identifier des contenus pertinents pour cette sous-requête.
Filtrage : Les sources sont évaluées et filtrées en fonction de l’Expérience, de l’Expertise, de l’Autorité et de la Fiabilité (E-E-A-T).
Reclassement (Reranking) : Les sources sont réordonnées selon leur pertinence finale.
Synthèse de la réponse : Génération du résumé final.

Qu’est-ce qui déclenche les Aperçus IA ?

Les Aperçus IA ne se déclenchent pas pour chaque requête et dépendent de la nature de la question de l’utilisateur. Selon Google, les Aperçus IA se déclenchent quand les questions sont complexes, nécessiteraient plusieurs recherches distinctes et que le moteur de recherche a une grande confiance dans la qualité des réponses.

En règle générale, la réponse est générée pour les types de questions suivantes :

Les requêtes d’information générale : Comment, Quoi, Pourquoi
Les comparaisons et les conseils

Question	Aperçu IA généré ?
GEO tools (recherche produit)	No
What are the best tools for geo (“Quoi”)	Yes
How does generative engine impact public health compared to traditional search engine (question complexe)	Yes
jupyter notebook (recherche produit)	No
jupyter notebook versus marimo (comparaison)	Yes
what is the capital of india (connaissance factuelle)	No

Exemples de requêtes déclenchant l’aperçu IA

Stratégie d’optimisation des sites web pour l’IA générative

Les fournisseurs de moteurs génératifs ne donnent pas de règles d’optimisation claires, et leurs algorithmes sont opaques. Dans sa documentation consacrée aux AI Overviews, Google indique que les fonctionnalités d’IA reposent globalement sur les mêmes principes que la recherche Google classique. Les pages doivent donc respecter les exigences techniques du moteur de recherche, se conformer aux politiques de recherche en application et privilégier les pratiques essentielles du SEO, en particulier pour la production de contenus utiles, fiables et conçus avant tout pour les utilisateurs.

Toutefois, en puisant dans diverses sources spécialisées, nous pouvons dégager les bonnes pratiques suivantes.

Contenu et forme

Les recommandations ci-dessous ne sont pas exhaustives, mais elles couvrent les pratiques les plus efficaces pour améliorer la visibilité d’un contenu. L’objectif étant de rendre les pages plus faciles à découvrir, à comprendre et à exploiter par les systèmes d’IA.

Renforcer les signaux E-E-A-T : mettre en avant l’expérience, l’expertise, l’autorité et la fiabilité du contenu.
- Citer des sources externes fiables et, lorsque c’est pertinent, faire référence à des entités reconnues dans le domaine.
- Mettre régulièrement les pages à jour.
- Apporter sur des éléments factuels, par exemple des statistiques, des données quantitatives ou des exemples concrets.
Proposer un contenu utile et distinctif : publier des informations à forte valeur ajoutée.
Renforcer la crédibilité externe : obtenir des liens entrants provenant de sites reconnus dans le domaine.
Enrichir le contenu sur le plan sémantique : utiliser un vocabulaire précis, éviter les formulations ambiguës et organiser l’information autour des questions que pourraient se poser les utilisateurs (mode FAQ).

Exemple de page web structurée en mode FAQ

Structure

Pour que les robots d’exploration (web crawlers) puissent facilement accéder au contenu, celui-ci doit être conçu pour être lisible par les machines (machine-readable) :

Structurer le contenu en paragraphes courts : Le contenu doit être organisé en unités discrètes et sémantiquement indépendantes. Il doit être structuré de manière à répondre directement aux questions de type « comment faire », « pourquoi » ou « quels sont » …
Adopter le balisage sémantique Schema Markup (schema.org) : Le balisage sémantique fournit un contexte explicite à l’IA pour une meilleure compréhension et récupération de l’information.
Utiliser un format HTML très structuré : Tirer parti d’une hiérarchie stricte de balises (H1, H2, H3, listes, etc.) pour définir les relations entre les entités.

Bon à savoir

Les institutions gouvernementales sont considérées par les moteurs de recherche comme des sources de confiance ayant autorité.

Les moteurs de recherche basés sur l’IA générative ne sont pas un bloc monolithique. Certains moteurs génératifs privilégieront les citations, tandis que d’autres privilégieront la qualité de la source. De plus, les mises à jour des LLM sous-jacents peuvent invalider des stratégies de visibilité.

Les réseaux sociaux, Youtube et Reddit sont des sources importantes pour les IA, il est important pour les institutions publiques de diversifier leurs canaux d’information aux citoyens.

Pour plus d’informations sur les pratiques concrètes d’optimisation de site web vous pouvez consulter le site https://elasticms.fgov.be/fr/news.

Comment mesurer l’efficacité d’une stratégie GEO

En quelques mois, de nombreux outils sont apparus sur le marché pour aider les organisations à optimiser la manière dont elles sont citées ou représentées dans les réponses générées par l’IA. Plusieurs plateformes SEO intègrent désormais, elles aussi, ce type de fonctionnalités dans leurs suites.

Ces solutions s’adressent toutefois principalement aux équipes marketing chargées de promouvoir une marque et d’en mesurer la visibilité. Leurs indicateurs et leurs usages ne sont donc pas toujours directement transposables au contexte du secteur public, où l’objectif est moins la promotion d’une marque que la diffusion d’une information fiable, officielle et facilement accessible pour le citoyen.

Concrètement, les outils de GEO évaluent la visibilité d’une organisation en soumettant un grand nombre de requêtes types à des plateformes comme ChatGPT, Google Search, ou Perplexity. Ils analysent ensuite les réponses générées afin de déterminer si l’organisation est citée, dans quel contexte elle apparaît et quelle place elle occupe par rapport à d’autres sources. Ces analyses permettent de suivre plusieurs indicateurs utiles pour évaluer et améliorer la visibilité dans les réponses générées par l’IA :

Le taux de citation, c’est-à-dire la fréquence à laquelle le site ou l’organisation est utilisé comme source ;
Share of voice, qui mesure la présence de l’organisation par rapport à d’autres sources citées ;
La position dans la réponse, par exemple lorsque le site est présenté comme première source ou comme référence secondaire ;
La tonalité de la réponse, afin d’identifier si la formulation de la réponse est positive ou négative.

Ci-dessous une liste de quelques plateformes d’optimisation de la visibilité :

Conclusions et recommandations

L’optimisation pour les moteurs génératifs devient essentielle, mais elle ne remplace pas le fondamentaux du SEO (Search Engine Optimization). Pour les institutions publiques, la priorité est de garantir que l’information officielle est non seulement visible et fiable, mais qu’elle soit structurée de manière à être facilement lisible par les machines, en particulier pour des plateformes telles que Google Search et ChatGPT largement utilisés pour les recherches.

Cependant, étant donné que le fonctionnement des moteurs de recherche bases sur l’IA reste une « boîte noire », les administrations ne peuvent pas garantir que leurs sites officiels seront systématiquement considérés comme la source de référence, ni que les informations synthétisées par l’IA seront totalement exactes. La réponse concrète consiste donc à renforcer les signaux E‑E‑A‑T, à maintenir les contenus à jour, à structurer l’information autour de questions claires des citoyens, et à suivre la manière dont ces contenus sont repris par les plateformes d’IA.

_________________________

Ce post est une contribution individuelle de Katy Fokou, spécialisée en intelligence artificielle chez Smals Research. Cet article est écrit en son nom propre et n’impacte en rien le point de vue de Smals.

GEO: Visibilité des sites web à l’ère de l’IA

Anomaliedetectie: wanneer machine learning het ongewone opspoort

IA et sécurité du code – Une mise à jour

Smals Research Webinar – Modernizing legacy projects with AI

GEO: Visibilité des sites web à l’ère de l’IA

Concepts de base

Qu’est-ce que le GEO ?

Impact de l’IA générative sur la recherche web

Principales différences entre SEO et GEO

De la requête à la réponse : comment fonctionne la recherche générative

Le cas spécifique des Aperçus IA (AI Overviews) dans la recherche Google

Stratégie d’optimisation des sites web pour l’IA générative

Comment mesurer l’efficacité d’une stratégie GEO

Conclusions et recommandations

More posts

GEO: Visibilité des sites web à l’ère de l’IA

Anomaliedetectie: wanneer machine learning het ongewone opspoort

IA et sécurité du code – Une mise à jour

Smals Research Webinar – Modernizing legacy projects with AI