Présenté par une partie du secteur comme un levier de visibilité dans les moteurs IA, le fichier llms.txt divise. Les fournisseurs ne l’utilisent pas, les données d’usage le contredisent, et Google s’est exprimé à plusieurs reprises. Voici ce qui alimente vraiment le débat.
TL;DR
Le format llms.txt a été pensé comme une commodité technique pour aider les modèles d’IA à lire le contenu d’un site, pas comme un outil SEO. Le secteur l’a réinterprété en levier de visibilité, sans preuve. Google le décourage publiquement et de façon répétée : il n’est utilisé ni pour le crawl, ni pour l’indexation, ni pour le classement, AI Overviews et AI Mode compris. Les données d’usage convergent vers un usage quasi nul. Il subsiste un cas légitime, la documentation technique destinée aux assistants de code, et une ambiguïté, l’intégration du fichier aux audits Chrome Lighthouse. Hors documentation technique, le mettre en place ne fait pas de mal, mais ne doit jamais passer avant les fondamentaux.
Aux origines : une commodité technique, pas un outil SEO
Le format llms.txt a été proposé en 2024 par Jeremy Howard, co-fondateur d’Answer.AI et de fast.ai. Le problème qu’il cherchait à résoudre était purement pratique, et n’avait rien à voir avec le référencement : les fenêtres de contexte des modèles de langage restent limitées, et convertir une page HTML complète, avec sa navigation, ses publicités et son JavaScript, en texte exploitable par une IA est un exercice laborieux.
L’idée consistait donc à proposer, à la racine du domaine, un résumé en Markdown du contenu utile d’un site, pour faciliter la vie des modèles au moment de l’inférence. Une bonne partie de la controverse vient précisément de là : le secteur SEO a réinterprété cet outil comme un nouveau levier de visibilité dans les réponses IA, alors que ce n’était pas sa vocation. C’est tout l’enjeu d’une approche rigoureuse du référencement génératif : distinguer les vrais signaux des effets de mode.
La position de Google : non, et de façon répétée
C’est l’élément le plus tranché du dossier. John Mueller, de l’équipe Search Relations de Google, a indiqué que llms.txt n’est utilisé par aucun des grands services IA et n’apporte aucun bénéfice concret. Il le compare à la balise meta keywords, que les moteurs ignorent depuis plus de dix ans parce qu’elle est contrôlée par le propriétaire du site, donc trop facile à manipuler.
L’argument de fond. Le fichier décrit ce que le propriétaire d’un site affirme à propos de son contenu. Or, si une IA peut vérifier cette affirmation, autant qu’elle consulte le site directement. Et si elle ne peut pas la vérifier, elle n’a aucune raison d’y faire confiance.
Dans le podcast officiel de Google, Search Off the Record, John Mueller a ajouté un argument structurel. Un système LLM ne peut pas se servir du fichier pour départager deux sites, puisque chacun peut y écrire qu’il est le meilleur site du monde. Même parfaitement rédigé, un llms.txt reste une information auto-déclarée par celui qui veut être choisi. Pour la phase de découverte, il renvoie donc aux fondamentaux : pages HTML classiques et maillage interne.
Gary Illyes, également chez Google, avait été tout aussi direct lors d’un Search Central Live à l’été 2025 : Google ne supporte pas le format et ne prévoit pas de le faire.
L’épisode qui a relancé la confusion
Fin 2025, des fichiers llms.txt sont apparus sur certaines propriétés de Google, notamment des pages de documentation pour développeurs. Le monde SEO y a immédiatement vu un signal fort, voire un futur facteur de classement.
L’explication s’est révélée beaucoup plus prosaïque : le CMS interne utilisé par Google avait commencé à générer ces fichiers automatiquement, et certaines équipes ne les avaient simplement pas retirés. L’équipe Search a d’ailleurs supprimé le fichier de sa propre documentation peu après. Interrogé sur Bluesky pour savoir si la présence de ces fichiers valait endossement, John Mueller a répondu par un non sans ambiguïté.
Les reproches techniques
Au-delà de la question de l’efficacité, plusieurs critiques de fond reviennent régulièrement.
Ce que disent les données d’usage
C’est sans doute le point le plus accablant. Plusieurs mesures indépendantes convergent vers un usage quasi nul.
Le cas d’usage légitime et la nuance Lighthouse
Le débat n’est pas totalement clos, pour deux raisons.
D’abord, il existe un cas d’usage réellement pertinent : la documentation technique destinée aux assistants de code. Si votre audience est composée de développeurs travaillant avec des outils comme Cursor, Windsurf ou Claude Code, et que vous disposez d’une documentation d’API étendue, un llms.txt peut servir de point d’entrée structuré. John Mueller lui-même y voit une béquille temporaire : les modèles savent très bien lire du HTML, mais le format peut faire économiser quelques tokens. Il est toutefois explicite sur le périmètre, à savoir les sites de documentation technique, et rien d’autre. Créer une version Markdown de la fiche d’une chaussure ne générera pas plus de ventes.
Ensuite, Google entretient lui-même une certaine ambiguïté. Son guide sur la recherche générative indique clairement que vous n’avez pas besoin de llms.txt ni d’aucun fichier spécial pour apparaître dans les AI Overviews ou l’AI Mode. Dans le même temps, les nouveaux audits Agentic Browsing de Chrome Lighthouse vérifient désormais la présence d’un résumé lisible par les machines à la racine du domaine. Cette tension nourrit la controverse, et quelques praticiens reconnus commencent à reconsidérer publiquement leur position sur le sujet.
À retenir
Hors documentation technique, le fichier llms.txt ne constitue ni un signal de classement, ni un levier de citation prouvé. Le mettre en place ne fait pas de mal, mais ne doit jamais passer avant les fondamentaux.
Ce qu’il faut retenir pour votre stratégie
La controverse tient à un décalage simple. Un format pensé comme une commodité technique pour l’inférence a été vendu comme un raccourci de visibilité IA, sans preuve d’efficacité, avec un risque d’abus et un usage réel proche de zéro, pendant que Google le décourageait publiquement tout en l’intégrant à Lighthouse.
Pour une entreprise, la priorité reste donc inchangée : un contenu de qualité et fiable, des données structurées propres et un maillage interne solide. Ce sont ces signaux, regroupés sous le principe E-E-A-T, qui pèsent réellement sur votre visibilité, dans la recherche classique comme dans les moteurs génératifs. Le llms.txt peut venir ensuite, et seulement si votre activité le justifie.
L’analyse Newp
Newp est une agence GEO et SEO. Notre position sur le llms.txt est celle de la prudence documentée : nous ne déconseillons pas de le mettre en place quand l’activité s’y prête, mais nous refusons de le présenter comme un raccourci de visibilité, parce que les données ne le soutiennent pas. Ce qui fait la différence dans les moteurs génératifs, c’est un contenu citable, crédible et bien structuré. C’est sur ces fondamentaux que nous concentrons le travail de référencement génératif de nos clients, le reste venant en complément, jamais en priorité.
Hors documentation technique, le llms.txt n’est ni un signal de classement, ni un levier de citation prouvé. Il peut venir ensuite, jamais avant les fondamentaux.
Questions fréquentes
Le fichier llms.txt améliore-t-il le référencement sur Google ?
Non. Google indique que ce fichier n’est utilisé ni pour le crawl, ni pour l’indexation, ni pour le classement, y compris dans les AI Overviews et l’AI Mode.
Les IA comme ChatGPT ou Perplexity lisent-elles ce fichier ?
À ce jour, aucun grand service IA ne documente l’usage de llms.txt comme signal de citation ou de visibilité. Les mesures de logs montrent que la plupart de ces fichiers ne sont quasiment jamais requêtés.
Faut-il quand même en créer un ?
Cela dépend de votre activité. Pour un site de documentation technique destiné aux assistants de code, le fichier peut avoir un intérêt. Pour la grande majorité des sites, l’effort se justifie après les chantiers prioritaires : contenu, données structurées et maillage interne.
Le llms.txt remplace-t-il le robots.txt ?
Non. Le robots.txt reste le seul standard officiellement reconnu pour gérer l’accès des robots. Le llms.txt ne bloque rien : il ne fait que proposer un résumé du contenu.
