09 75 36 32 17
Blog NEWP

Pourquoi le fichier llms.txt est-il si controversé ?

Pourquoi le fichier llms.txt est-il si controversé ? | Newp

Présenté par une partie du secteur comme un levier de visibilité dans les moteurs IA, le fichier llms.txt divise. Les fournisseurs ne l’utilisent pas, les données d’usage le contredisent, et Google s’est exprimé à plusieurs reprises. Voici ce qui alimente vraiment le débat.

Sources de cet article : cette synthèse s’appuie sur des publications et déclarations publiques, notamment Search Engine Journal, Search Engine Roundtable, Abondance, les analyses d’Ahrefs, OtterlyAI et SE Ranking, ainsi que la proposition d’origine publiée sur llmstxt.org. La liste détaillée figure en bas de l’article.

TL;DR

Le format llms.txt a été pensé comme une commodité technique pour aider les modèles d’IA à lire le contenu d’un site, pas comme un outil SEO. Le secteur l’a réinterprété en levier de visibilité, sans preuve. Google le décourage publiquement et de façon répétée : il n’est utilisé ni pour le crawl, ni pour l’indexation, ni pour le classement, AI Overviews et AI Mode compris. Les données d’usage convergent vers un usage quasi nul. Il subsiste un cas légitime, la documentation technique destinée aux assistants de code, et une ambiguïté, l’intégration du fichier aux audits Chrome Lighthouse. Hors documentation technique, le mettre en place ne fait pas de mal, mais ne doit jamais passer avant les fondamentaux.

Aux origines : une commodité technique, pas un outil SEO

Le format llms.txt a été proposé en 2024 par Jeremy Howard, co-fondateur d’Answer.AI et de fast.ai. Le problème qu’il cherchait à résoudre était purement pratique, et n’avait rien à voir avec le référencement : les fenêtres de contexte des modèles de langage restent limitées, et convertir une page HTML complète, avec sa navigation, ses publicités et son JavaScript, en texte exploitable par une IA est un exercice laborieux.

L’idée consistait donc à proposer, à la racine du domaine, un résumé en Markdown du contenu utile d’un site, pour faciliter la vie des modèles au moment de l’inférence. Une bonne partie de la controverse vient précisément de là : le secteur SEO a réinterprété cet outil comme un nouveau levier de visibilité dans les réponses IA, alors que ce n’était pas sa vocation. C’est tout l’enjeu d’une approche rigoureuse du référencement génératif : distinguer les vrais signaux des effets de mode.

La position de Google : non, et de façon répétée

C’est l’élément le plus tranché du dossier. John Mueller, de l’équipe Search Relations de Google, a indiqué que llms.txt n’est utilisé par aucun des grands services IA et n’apporte aucun bénéfice concret. Il le compare à la balise meta keywords, que les moteurs ignorent depuis plus de dix ans parce qu’elle est contrôlée par le propriétaire du site, donc trop facile à manipuler.

L’argument de fond. Le fichier décrit ce que le propriétaire d’un site affirme à propos de son contenu. Or, si une IA peut vérifier cette affirmation, autant qu’elle consulte le site directement. Et si elle ne peut pas la vérifier, elle n’a aucune raison d’y faire confiance.

Dans le podcast officiel de Google, Search Off the Record, John Mueller a ajouté un argument structurel. Un système LLM ne peut pas se servir du fichier pour départager deux sites, puisque chacun peut y écrire qu’il est le meilleur site du monde. Même parfaitement rédigé, un llms.txt reste une information auto-déclarée par celui qui veut être choisi. Pour la phase de découverte, il renvoie donc aux fondamentaux : pages HTML classiques et maillage interne.

Gary Illyes, également chez Google, avait été tout aussi direct lors d’un Search Central Live à l’été 2025 : Google ne supporte pas le format et ne prévoit pas de le faire.

L’épisode qui a relancé la confusion

Fin 2025, des fichiers llms.txt sont apparus sur certaines propriétés de Google, notamment des pages de documentation pour développeurs. Le monde SEO y a immédiatement vu un signal fort, voire un futur facteur de classement.

L’explication s’est révélée beaucoup plus prosaïque : le CMS interne utilisé par Google avait commencé à générer ces fichiers automatiquement, et certaines équipes ne les avaient simplement pas retirés. L’équipe Search a d’ailleurs supprimé le fichier de sa propre documentation peu après. Interrogé sur Bluesky pour savoir si la présence de ces fichiers valait endossement, John Mueller a répondu par un non sans ambiguïté.

Les reproches techniques

Au-delà de la question de l’efficacité, plusieurs critiques de fond reviennent régulièrement.

REPROCHE 1 Un risque de cloaking Rien n’empêche de présenter aux robots IA une version du contenu et aux internautes une autre. Cette dissociation ouvre la porte à une forme de dissimulation que les moteurs combattent depuis toujours.
REPROCHE 2 Une expérience dégradée Si une IA citait le fichier plutôt que la page réelle, l’internaute atterrirait sur un texte brut, sans mise en forme, sans navigation et sans lien de retour vers le contenu source.
REPROCHE 3 Le problème de différenciation L’argument de la manipulation a toujours eu une parade possible : pénaliser l’abus, comme cela a été fait pour les données structurées trompeuses. Mais l’argument de la différenciation est plus difficile à lever, car votre fichier le plus exact ne dira jamais à une IA de vous préférer à un concurrent.

Ce que disent les données d’usage

C’est sans doute le point le plus accablant. Plusieurs mesures indépendantes convergent vers un usage quasi nul.

Un usage réel proche de zéro 97 % des fichiers n’ont reçu aucune requête Ahrefs, mai 2026 0,1 % des requêtes de robots IA visent le fichier OtterlyAI, 90 jours 28 % des domaines en publient un Ahrefs, 137 000 domaines
Plusieurs mesures indépendantes pointent toutes dans la même direction : un usage marginal.
AHREFS 97 % de fichiers jamais requêtés Sur 137 000 domaines analysés, 97 % des fichiers llms.txt n’ont reçu aucune requête en mai 2026, et seuls 28 % des domaines en publiaient un.
OTTERLYAI 0,1 % des requêtes de robots IA Sur 62 100 requêtes de robots IA mesurées en 90 jours, seules 84 ont visé le fichier, soit 0,1 %. C’est moins bien qu’une page de contenu moyenne du même domaine.
SE RANKING Aucune corrélation avec les citations IA Sur un échantillon de 300 000 domaines, aucun lien n’a été trouvé entre la présence d’un llms.txt et la fréquence de citation dans les réponses IA.
HÉBERGEURS Le seul visiteur est un outil d’inventaire Plusieurs hébergeurs gérant des dizaines de milliers de domaines rapportent que le seul robot crawlant le fichier est BuiltWith, un service de détection de technologies. Ce n’est pas un signal d’usage, mais un simple inventaire.

Le cas d’usage légitime et la nuance Lighthouse

Le débat n’est pas totalement clos, pour deux raisons.

D’abord, il existe un cas d’usage réellement pertinent : la documentation technique destinée aux assistants de code. Si votre audience est composée de développeurs travaillant avec des outils comme Cursor, Windsurf ou Claude Code, et que vous disposez d’une documentation d’API étendue, un llms.txt peut servir de point d’entrée structuré. John Mueller lui-même y voit une béquille temporaire : les modèles savent très bien lire du HTML, mais le format peut faire économiser quelques tokens. Il est toutefois explicite sur le périmètre, à savoir les sites de documentation technique, et rien d’autre. Créer une version Markdown de la fiche d’une chaussure ne générera pas plus de ventes.

Quand le llms.txt a du sens, et quand il n’en a pas Pertinent ✓ Documentation d’API étendue ✓ Audience de développeurs ✓ Assistants de code (Cursor…) Sans intérêt prouvé ✗ Sites vitrine ✗ E-commerce, fiches produits ✗ Recherche de visibilité IA
Le seul cas d’usage défendable reste la documentation technique pour assistants de code.

Ensuite, Google entretient lui-même une certaine ambiguïté. Son guide sur la recherche générative indique clairement que vous n’avez pas besoin de llms.txt ni d’aucun fichier spécial pour apparaître dans les AI Overviews ou l’AI Mode. Dans le même temps, les nouveaux audits Agentic Browsing de Chrome Lighthouse vérifient désormais la présence d’un résumé lisible par les machines à la racine du domaine. Cette tension nourrit la controverse, et quelques praticiens reconnus commencent à reconsidérer publiquement leur position sur le sujet.

À retenir

Hors documentation technique, le fichier llms.txt ne constitue ni un signal de classement, ni un levier de citation prouvé. Le mettre en place ne fait pas de mal, mais ne doit jamais passer avant les fondamentaux.

Ce qu’il faut retenir pour votre stratégie

La controverse tient à un décalage simple. Un format pensé comme une commodité technique pour l’inférence a été vendu comme un raccourci de visibilité IA, sans preuve d’efficacité, avec un risque d’abus et un usage réel proche de zéro, pendant que Google le décourageait publiquement tout en l’intégrant à Lighthouse.

Pour une entreprise, la priorité reste donc inchangée : un contenu de qualité et fiable, des données structurées propres et un maillage interne solide. Ce sont ces signaux, regroupés sous le principe E-E-A-T, qui pèsent réellement sur votre visibilité, dans la recherche classique comme dans les moteurs génératifs. Le llms.txt peut venir ensuite, et seulement si votre activité le justifie.

L’analyse Newp

Newp est une agence GEO et SEO. Notre position sur le llms.txt est celle de la prudence documentée : nous ne déconseillons pas de le mettre en place quand l’activité s’y prête, mais nous refusons de le présenter comme un raccourci de visibilité, parce que les données ne le soutiennent pas. Ce qui fait la différence dans les moteurs génératifs, c’est un contenu citable, crédible et bien structuré. C’est sur ces fondamentaux que nous concentrons le travail de référencement génératif de nos clients, le reste venant en complément, jamais en priorité.

Hors documentation technique, le llms.txt n’est ni un signal de classement, ni un levier de citation prouvé. Il peut venir ensuite, jamais avant les fondamentaux.

Questions fréquentes

Le fichier llms.txt améliore-t-il le référencement sur Google ?
Non. Google indique que ce fichier n’est utilisé ni pour le crawl, ni pour l’indexation, ni pour le classement, y compris dans les AI Overviews et l’AI Mode.

Les IA comme ChatGPT ou Perplexity lisent-elles ce fichier ?
À ce jour, aucun grand service IA ne documente l’usage de llms.txt comme signal de citation ou de visibilité. Les mesures de logs montrent que la plupart de ces fichiers ne sont quasiment jamais requêtés.

Faut-il quand même en créer un ?
Cela dépend de votre activité. Pour un site de documentation technique destiné aux assistants de code, le fichier peut avoir un intérêt. Pour la grande majorité des sites, l’effort se justifie après les chantiers prioritaires : contenu, données structurées et maillage interne.

Le llms.txt remplace-t-il le robots.txt ?
Non. Le robots.txt reste le seul standard officiellement reconnu pour gérer l’accès des robots. Le llms.txt ne bloque rien : il ne fait que proposer un résumé du contenu.

Audit gratuit
Obtenez votre audit SEO & GEO gratuit en 48h
Analyse complète de votre présence digitale sans engagement. Découvrez les opportunités de croissance de votre site web grâce à l’IA.
Demander l’audit →09 75 36 32 17

Glossaire

Lexique des termes techniques et concepts cités dans cet article.

AI Mode : mode de recherche conversationnel de Google, distinct des AI Overviews.
AI Overview (Aperçu IA) : résumé généré par l’IA affiché en haut des résultats de recherche Google.
Assistant de code : outil d’aide au développement (Cursor, Windsurf, Claude Code) lisant la documentation technique.
Cloaking : pratique consistant à montrer aux robots un contenu différent de celui vu par les internautes.
Données structurées : balisage décrivant le contenu d’une page pour les moteurs.
E-E-A-T : expérience, expertise, autorité et fiabilité, critères de qualité valorisés par Google.
Fenêtre de contexte : quantité de texte qu’un modèle de langage peut traiter en une fois.
GEO : Generative Engine Optimization, optimisation pour les moteurs de réponse générative.
Inférence : phase où un modèle d’IA génère une réponse à partir d’une requête.
Lighthouse : outil d’audit de Chrome, dont les audits Agentic Browsing vérifient un résumé lisible par les machines.
llms.txt : fichier Markdown à la racine d’un domaine, résumant le contenu utile pour les modèles d’IA.
Maillage interne : réseau de liens reliant les pages d’un même site.
Meta keywords : ancienne balise de mots-clés, ignorée par les moteurs depuis plus de dix ans.
robots.txt : fichier standard gérant l’accès des robots aux pages d’un site.

Sources et références

Search Engine Journal : déclarations de John Mueller dans le podcast Search Off the Record.
Search Engine Roundtable : échanges de John Mueller sur Bluesky concernant l’absence d’endossement.
Abondance : analyse de l’intégration de llms.txt aux audits Chrome Lighthouse.
Ahrefs : étude de fréquentation sur 137 000 domaines (mai 2026).
OtterlyAI : mesure des requêtes de robots IA sur 90 jours.
SE Ranking : analyse de corrélation sur un large échantillon de domaines.
llmstxt.org : proposition d’origine de Jeremy Howard (Answer.AI).
Newp — Référencement GEO : optimisation pour les moteurs génératifs de l’agence Newp.
Partager : 𝕏 in fb 🔗

Kévin Papot

Fondateur de Newp et de France Minéraux – Expert E-commerce depuis 15 ans, il a propulsé France Minéraux à +1 million de trafic mensuel en partant de 0. Il a également rédigé plusieurs livres sur le SEO, le GEO, et le référencement local avec les fiches Google Profile Business.

Audit gratuit

Obtenez votre audit SEO & GEO gratuit en 48h

Analyse complète de votre présence digitale sans engagement. Découvrez les opportunités de croissance de votre site web grâce à l’IA.

Demander l’audit 09 75 36 32 17

Besoin d'aide ?

Notre équipe est disponible pour un audit gratuit de votre projet web.

09 75 36 32 17
Réponse sous 24h · Audit GEO offert