Pourquoi ChatGPT cite cette page-là plutôt que la mienne ? Une étude récente d’Ahrefs apporte des réponses chiffrées et parfois contre-intuitives sur la mécanique de citation des LLMs. Chez NEWP, nous l’avons confrontée à nos observations terrain : plusieurs croyances installées se révèlent fausses, et certains leviers ignorés sont décisifs. Voici les cinq enseignements majeurs, traduits en actions concrètes.

Les citations ChatGPT en 3 chiffres · étude Ahrefs
1. Le paradoxe Reddit : très lu, presque jamais cité
Premier choc de l’étude : 67,8 % des URL non citées par ChatGPT proviennent de Reddit. Deux tiers des sources que le modèle consulte sans jamais les citer sont issues de la plateforme communautaire. Une donnée qui contredit le discours dominant : « il faut être présent sur Reddit pour exister dans les LLMs ».
ChatGPT utilise Reddit comme source d’apprentissage du contexte : pour comprendre comment les utilisateurs formulent leurs questions, quel vocabulaire ils emploient, quels débats existent dans une communauté. Mais quand il s’agit de citer une source dans sa réponse finale, le modèle privilégie un domaine plus structuré, plus signé, plus défendable juridiquement.
📌 À retenir
Reddit est utilisé par ChatGPT comme outil de compréhension de l’intention, pas comme source citable. Investir massivement sur Reddit pour gagner en visibilité IA, c’est nourrir le modèle sans en récupérer le crédit. La citation, elle, va vers les sites d’autorité.
2. Les fan-out queries : la grammaire interne de ChatGPT
Quand un utilisateur pose une question dans ChatGPT, le modèle ne cherche pas immédiatement une réponse : il décompose la requête en sous-questions dérivées, qu’on appelle les fan-out queries. Sur une question apparemment simple, il peut en générer 5 à 15 en interne avant de chercher des sources. L’étude Ahrefs montre que les pages citées sont celles dont les titres sont sémantiquement alignés non seulement sur la question principale, mais aussi sur ces dérivées.
Concrètement, si votre page traite de la « migration SEO », vos H2 et H3 doivent répondre aux sous-questions naturelles : combien de temps dure une migration ? Quels sont les risques ? Comment préparer le plan de redirection ? Quels outils de monitoring utiliser ? Si vous ne couvrez que la question principale, vous tombez du filtre dès la deuxième étape.
3. La similarité titre / prompt : un signal sous-estimé
Troisième enseignement : les URL citées par ChatGPT ont systématiquement une similarité plus élevée entre leur titre H1 et le prompt original. Plus votre titre ressemble à ce que tape l’utilisateur, plus vous êtes cité.
Cette logique paraît évidente, mais elle est massivement violée. Beaucoup d’optimiseurs ont appris à écrire des titres « accrocheurs » : tournures interrogatives stylisées, emojis, formulations marketing. Ces titres performent en CTR sur Google. Ils performent mal en citations IA, parce qu’ils s’éloignent du langage naturel des prompts. La règle pratique : écrivez vos H1 comme si l’utilisateur les tapait directement dans ChatGPT.
4. Les slugs naturels : le détail technique qui change tout
Quatrième enseignement, le plus actionnable : les pages avec des slugs en langage naturel obtiennent un taux de citation de 89,78 %. Une URL comme /comment-planter-des-tomates écrase systématiquement une URL technique comme /p?id=4729 ou /article-12847.html.

Ce critère semble trivial, mais il est massivement négligé. Beaucoup de sites e-commerce, de plateformes SaaS et de CMS anciens génèrent encore des URL non parlantes par défaut. Pour ChatGPT, ces URL constituent un signal de faible qualité éditoriale, comme si le site lui-même ne savait pas de quoi parlent ses pages. Le modèle préfère systématiquement une URL qui annonce son contenu en clair.
⚠️ Audit urgent
Si votre site génère encore des URL non parlantes, c’est probablement la première cause d’absence de citation dans les LLMs, et la plus simple à corriger. Un audit technique permet d’identifier les pages concernées et de mettre en place une stratégie de réécriture avec redirections 301.
5. Le paradoxe de l’âge : 500 jours en moyenne
Le cinquième enseignement est le plus contre-intuitif. ChatGPT déclare officiellement préférer le contenu frais : c’est l’une des promesses du mode de recherche en ligne. Pourtant, la page citée moyenne a 500 jours, soit environ 16 mois. Et ce chiffre est en hausse, pas en baisse.
L’explication est simple. Quand ChatGPT cherche une source, il arbitre entre deux signaux : la fraîcheur (récence de publication) et l’autorité (citations entrantes, mentions, ancienneté du domaine). Sur la majorité des sujets, l’autorité l’emporte. Une page de référence publiée il y a 18 mois et largement citée bat presque toujours une page récente sans signaux d’autorité établis.
Conséquence stratégique : vos vieux contenus sont un actif, pas un poids. Plutôt que les supprimer ou les laisser dépérir, il faut les enrichir, les actualiser et les remettre en avant dans votre maillage interne. Une page de 18 mois, qui a accumulé des backlinks et que vous mettez régulièrement à jour, est un meilleur candidat à la citation qu’un nouvel article publié hier.
🔍 Combien de pages de votre site cochent les 5 critères ?
C’est exactement ce que nous testons dans notre audit GEO gratuit : nous confrontons votre site aux 5 critères de l’étude Ahrefs et identifions précisément les pages les plus proches de la citation. Diagnostic livré sous 48 h.
6. Idées reçues vs données chiffrées
Voici les principales croyances SEO confrontées aux résultats chiffrés de l’étude. Ce tableau peut servir de checklist rapide pour évaluer votre stratégie GEO actuelle.
| Idée reçue | Verdict | Ce que dit l’étude |
|---|---|---|
| « Reddit est la clé pour exister dans ChatGPT » | FAUX | ChatGPT lit Reddit pour comprendre les sujets, mais cite ailleurs. 67,8 % des URL non citées viennent de Reddit. |
| « Les LLMs préfèrent le contenu frais » | NUANCÉ | La page citée moyenne a 500 jours. L’autorité l’emporte sur la fraîcheur. |
| « Le contenu prime sur la structure d’URL » | À NUANCER | Les slugs en langage naturel atteignent 89,78 % de citation. Une URL parlante double vos chances. |
| « Mon H1 doit être optimisé pour Google » | INSUFFISANT | Il doit aussi être proche du prompt utilisateur et des fan-out queries que ChatGPT génère. |
La transition SEO vers GEO ne consiste pas à abandonner les bonnes pratiques classiques, mais à ajouter une couche de critères spécifiques aux LLMs. Vous ne refaites pas tout, vous ajustez les paramètres qui n’étaient pas mesurés jusqu’ici.
7. Le plan NEWP en 5 critères
Voici le plan d’action que nous déployons pour transformer ces enseignements en résultats mesurables. Comptez 3 à 6 mois pour observer un déplacement significatif des citations.
| # | Critère | Action concrète |
|---|---|---|
| 1 | Désaturation Reddit | Identifier les sujets sur lesquels Reddit pèse dans la SERP. Créer du contenu d’autorité signé pour prendre la place de citation. |
| 2 | Mapping fan-out queries | Pour chaque page stratégique, lister 8 à 12 sous-questions probables. Adapter les H2 et H3 pour y répondre point par point. |
| 3 | Alignement titre / prompt | Tester votre H1 dans ChatGPT en mode prompt. Le titre doit ressembler à la question que poserait l’utilisateur. |
| 4 | Refonte des slugs | Remplacer /p?id=4729 par /comment-faire-x. Mettre en place les redirections 301 et auditer les URL générées dynamiquement. |
| 5 | Maturation des contenus | Conserver et enrichir les pages anciennes plutôt que les supprimer. L’âge moyen d’une citation étant de 500 jours, votre archive est un actif. |
Ces cinq critères forment un système cohérent et se renforcent mutuellement. Une page avec un slug naturel, un H1 aligné sur le prompt utilisateur, qui répond aux fan-out queries dans ses H2, qui a 18 mois et qui a été mise à jour récemment, coche les cinq cases. C’est exactement le profil que ChatGPT cherche à citer.
En résumé
La citation par ChatGPT n’est pas un mystère, c’est un système de critères mesurables. Reddit n’est pas la clé, l’autorité accumulée bat la fraîcheur, les slugs techniques sabordent vos chances, et les fan-out queries (quasiment ignorées dans les briefs SEO classiques) sont l’étape de filtrage la plus discriminante.
Bonne nouvelle : ces cinq critères sont actionnables immédiatement. Pas besoin de refaire votre site, un audit ciblé suffit à identifier les pages les plus proches de la citation et à prioriser les ajustements. Pour mesurer concrètement votre point de départ, démarrez par un audit GEO gratuit.
🎯 Slug naturel + H1 aligné + fan-out queries + 18 mois + mise à jour = profil idéal de citation. Une page qui coche les 5 cases concentre des chances exponentielles d’apparaître dans les réponses ChatGPT, Perplexity et Google AI Overviews.
🚀 ChatGPT vous cite-t-il aujourd’hui ?
Recevez un audit GEO gratuit sous 48 h. Nous testons votre site contre les 5 critères de l’étude Ahrefs et identifions précisément ce qui bloque vos citations.
Glossaire des termes techniques
Ce mini-glossaire reprend et explique les termes techniques utilisés dans l’article, pour servir de référence rapide.
| Terme | Définition |
|---|---|
| Ahrefs | Plateforme professionnelle d’analyse SEO. Elle fournit des données sur les backlinks, mots-clés, trafic organique, et publie régulièrement des études de référence dont celle citée ici. |
| Autorité (signal d’) | Faisceau d’indices qu’un moteur ou une IA utilise pour estimer la fiabilité d’une page : backlinks, mentions, ancienneté et réputation du domaine. |
| Backlink | Lien hypertexte provenant d’un autre site et pointant vers le vôtre. Plus les backlinks viennent de sources reconnues, plus ils renforcent l’autorité de la page. |
| CMS (Content Management System) | Système de gestion de contenu permettant de créer un site web sans coder. WordPress, Drupal ou Shopify en sont des exemples. |
| CTR (Click-Through Rate) | Taux de clic. Pourcentage d’internautes qui cliquent sur un résultat parmi ceux qui le voient. Améliore Google sans nécessairement améliorer les citations IA. |
| Fan-out queries | Sous-questions dérivées que ChatGPT génère automatiquement à partir d’une requête initiale, pour explorer les angles d’un sujet avant de sélectionner ses sources. |
| GEO (Generative Engine Optimization) | Discipline d’optimisation visant à apparaître et à être correctement cité dans les réponses des moteurs génératifs comme ChatGPT, Perplexity ou Google AI Overviews. |
| Google AI Overviews | Encarts de réponse générés par l’IA de Google et affichés en haut des résultats. Résument une réponse en s’appuyant sur plusieurs sources jugées fiables. |
| H1, H2, H3 | Niveaux hiérarchiques des titres dans une page web. Le H1 est le titre principal, les H2 et H3 sont les sous-titres. Leur formulation influence la compréhension de la page. |
| LLM (Large Language Model) | Grand modèle de langage. Système d’IA entraîné sur d’immenses volumes de texte. ChatGPT, Claude et Gemini en sont des exemples. |
| Maillage interne | Réseau de liens hypertextes qui relient les pages d’un même site. Aide les moteurs à comprendre la structure et à valoriser les pages stratégiques. |
| Migration SEO | Opération technique consistant à transférer un site vers un nouveau domaine, une nouvelle structure d’URL ou une nouvelle plateforme, en préservant le référencement. |
| Prompt | Question ou instruction que l’utilisateur soumet à une IA comme ChatGPT. La formulation du prompt influence directement les sources que le modèle ira chercher. |
| Plateforme communautaire structurée en sous-forums (subreddits). Très utilisée par les LLMs pour comprendre le langage et les débats, mais peu citée comme source. | |
| Redirection 301 | Redirection permanente d’une URL vers une autre. Transmet la quasi-totalité de l’autorité SEO de l’ancienne page vers la nouvelle. Indispensable lors d’un changement de slug. |
| SEO (Search Engine Optimization) | Ensemble des techniques visant à améliorer le positionnement d’un site dans les résultats naturels des moteurs de recherche. |
| SERP (Search Engine Results Page) | Page de résultats d’un moteur de recherche. Peut contenir des liens organiques, des annonces, un Knowledge Panel, des AI Overviews et d’autres encarts. |
| Similarité sémantique | Mesure de proximité de sens entre deux textes, calculée par un modèle de langage. Un H1 sémantiquement proche du prompt utilisateur a plus de chances d’être cité. |
| Slug | Partie de l’URL qui identifie une page après le nom de domaine, par exemple /comment-planter-des-tomates. Un slug naturel décrit le contenu en mots compréhensibles. |
