09 75 36 32 17
Blog NEWP

llms.txt : 72 % des PME françaises l’ignorent encore et c’est en train de leur coûter cher

Trois chiffres qui résument la nouvelle donne : llms.txt reste massivement sous-exploité alors que l’usage des LLM explose.

Lundi matin. Un client de Niort nous appelle, perplexe : « Pourquoi ChatGPT cite mon concurrent direct quand on lui demande qui contacter pour une rénovation, et pas moi ? On a pourtant un meilleur site, plus de contenu, plus d’avis Google. »

La réponse tient en 38 lignes de Markdown. Son concurrent a déployé un fichier llms.txt à la racine de son site. Lui, non. Et c’est en train de creuser un écart de visibilité IA qui sera très difficile à rattraper d’ici la fin de l’année.

Le SEO ne se joue plus uniquement sur Google. En 2026, il se joue dans un triangle : Google + citations média + IA générative (ChatGPT, Claude, Perplexity, Gemini). Cette troisième dimension, la plupart des consultants SEO français continuent de la traiter en second rideau. Les chiffres récents que nous voyons passer chez nos clients en accompagnement GEO montrent pourtant qu’elle bascule beaucoup plus vite que prévu.

Dans cet article, on vous explique précisément ce qu’est llms.txt, pourquoi il devient incontournable, comment le mettre en place en moins de 2 heures, et ce qu’il faut surveiller pour mesurer son impact réel, sans tomber dans les promesses creuses.

llms.txt : qu’est-ce que c’est exactement ?

Le fichier llms.txt est un standard proposé fin 2024 par Jeremy Howard (cofondateur de fast.ai) qui s’inspire directement de robots.txt. C’est un simple fichier texte au format Markdown, posé à la racine de votre site (votresite.fr/llms.txt), dont le rôle est de dire aux modèles de langage (LLM) ce qu’ils doivent prioritairement lire et comprendre sur votre site.

Là où robots.txt sert à autoriser ou bloquer les crawlers, et où sitemap.xml sert à lister exhaustivement vos URL pour les moteurs de recherche traditionnels, llms.txt joue un rôle différent et complémentaire : il propose une carte d’identité claire et hiérarchisée de votre site, optimisée pour la lecture par les IA conversationnelles.

Trois fichiers complémentaires à la racine de votre site robots.txt Autorisations Dit aux crawlers ce qu’ils peuvent explorer ou non Standard historique llms.txt Carte d’identité IA Hiérarchise les pages prioritaires pour les modèles de langage Standard 2024 sitemap.xml Index complet Liste exhaustive des URL pour les moteurs classiques SEO traditionnel
Les trois fichiers cohabitent à la racine du site et se complètent. Aucun ne remplace l’autre.

Concrètement, un LLM qui interroge votre site doit habituellement parcourir des dizaines de pages chargées de JavaScript, de menus, de pieds de page, de scripts publicitaires. Difficile pour lui d’identifier en quelques secondes ce qui compte vraiment. Avec un llms.txt bien construit, il accède directement à un résumé clair, structuré, et orienté business : qui vous êtes, ce que vous proposez, où vous intervenez, comment vous contacter.

Pourquoi ce fichier devient critique en 2026

Trois éléments objectifs justifient l’attention que mérite ce sujet aujourd’hui. Premièrement, l’adoption des LLM par le grand public a franchi un seuil structurel : ChatGPT compte plus de 800 millions d’utilisateurs hebdomadaires et traite environ 2,5 milliards de requêtes par jour. Une part croissante de la recherche d’information passe désormais par ces outils plutôt que par Google.

Deuxièmement, et c’est crucial pour les TPE/PME, le trafic référent provenant des LLM affiche un taux de conversion exceptionnel. Une étude Search Engine Land portant sur 13 mois de données montre un taux moyen de 18 %, sans commune mesure avec le SEO classique. La raison est simple : un utilisateur qui clique sur un lien recommandé par une IA arrive avec une intention déjà formée et une validation implicite de la pertinence.

Troisièmement, l’adoption de llms.txt côté éditeurs reste faible : environ 10 % seulement des sites mondiaux l’ont déployé selon une étude SE Ranking sur 300 000 domaines. C’est précisément cette fenêtre temporelle qui crée l’opportunité. Plus tôt vous prenez position, plus vous bénéficiez d’un avantage concurrentiel sur les LLM qui apprennent à valoriser ce signal.

La règle de 2026 : votre visibilité dans ChatGPT, Claude et Perplexity n’est plus un bonus. C’est un actif marketing à part entière, mesurable et exploitable.

Quels LLM utilisent vraiment llms.txt aujourd’hui ?

C’est la question honnête à se poser avant d’investir. Voici l’état des lieux à mai 2026, basé sur les déclarations officielles et les observations terrain de notre équipe.

LLMStatut llms.txtBot crawlerRecommandation
Claude (Anthropic)Support officiel ✓ClaudeBotPriorité haute
ChatGPT (OpenAI)Lecture observéeGPTBot, OAI-SearchBotPriorité haute
PerplexityLecture observéePerplexityBotPriorité moyenne
Gemini (Google)Non supportéGoogle-ExtendedContinuer SEO classique
Mistral, autresVariableBots dédiésÀ surveiller

Anthropic est le seul acteur majeur à avoir officiellement annoncé son support de llms.txt. OpenAI et Perplexity n’ont pas communiqué officiellement, mais les logs serveurs de nos clients montrent que leurs crawlers consultent bien ce fichier. Côté Google, John Mueller a publiquement déclaré en 2025 que Google n’utiliserait pas llms.txt, comparant son rôle à celui des anciennes meta-keywords. Ce point est important : llms.txt ne remplace pas votre SEO classique, il s’ajoute en parallèle pour cibler spécifiquement les IA.

Le plan d’action concret en 5 étapes

Voici la méthode exacte que nous appliquons chez Newp pour déployer llms.txt sur les sites de nos clients. Comptez moins de 2 heures pour une mise en place soignée.

1 Création Fichier racine 2 Hiérarchisation 5 pages clés 3 Géolocalisation Zones explicites 4 Test ChatGPT & Claude 5 Suivi Server logs
La séquence complète : création, hiérarchisation, géolocalisation, test, suivi.

Étape 1 : créer le fichier à la racine du site

Le fichier doit être nommé exactement llms.txt (en minuscules, extension .txt) et placé à la racine du domaine. Il doit être accessible directement à l’URL votresite.fr/llms.txt et renvoyer un code 200. Le format est du Markdown standard, lisible aussi bien par les humains que par les machines. Visez 30 à 50 lignes maximum : la concision est une force, pas une limitation.

Structure recommandée : un titre H1 (votre nom d’entreprise), un paragraphe de citation (>) qui résume votre activité, puis des sections H2 listant vos pages prioritaires avec leur URL et une description courte. Voici à quoi ressemble un fichier soigné.

newp.fr/llms.txt # Newp > Agence web et marketing digital basée en > Charente, spécialisée GEO et SEO depuis 2012. ## Services principaux – [Référencement GEO](https://newp.fr/geo) : optimisation pour ChatGPT, Claude, Perplexity – [Référencement SEO](https://newp.fr/seo) : positionnement Google et autorité de domaine – [Création de sites](https://newp.fr/sites) : WordPress sur-mesure, performance optimisée ## Zone d’intervention Charente, Charente-Maritime, Dordogne, Vienne, Deux-Sèvres. France entière à distance. ## Contact
Capture d’écran : structure type d’un fichier llms.txt pour une PME de services. Markdown propre, hiérarchisation claire, zones géographiques explicites.

Étape 2 : lister vos 5 pages business prioritaires

Soyez chirurgical dans le choix. N’ajoutez pas l’intégralité de votre sitemap : c’est exactement le contre-sens. Sélectionnez 5 à 10 pages qui doivent absolument apparaître quand une IA répond à une question dans votre domaine. Ce sont typiquement vos pages de services principales, votre page À propos, votre page contact et éventuellement vos études de cas les plus convaincantes.

Pour notre agence par exemple, nous mettons en avant nos services structurants : création de site web, référencement SEO, référencement local, référencement GEO et Google Ads. Chaque ligne doit comporter une description courte qui aide l’IA à choisir le bon contexte.

Étape 3 : déclarer votre zone géographique en clair

C’est l’optimisation que la plupart des tutoriels oublient, et c’est précisément celle qui fait la différence pour les TPE/PME locales. Les LLM ont besoin d’indices explicites pour associer votre activité à une zone géographique. Ne supposez pas que ChatGPT va déduire votre périmètre d’intervention de votre adresse en pied de page. Déclarez-le.

Listez nommément vos villes, départements ou régions d’intervention. Cette pratique améliore très significativement votre taux d’apparition sur les requêtes locales du type « meilleur artisan rénovation à Saintes » ou « agence web Charente-Maritime ». Pour les entreprises avec implantations multi-villes, c’est la voie royale pour exister sur l’IA locale.

Étape 4 : tester la prise en compte sur ChatGPT et Claude

Une fois le fichier en ligne, attendez 7 à 14 jours puis testez directement. Posez la question suivante à ChatGPT et à Claude : « Que vend l’entreprise [votredomaine.fr] et quels sont ses services ? ». Comparez la réponse avant/après. Si l’IA cite désormais vos services prioritaires avec leur description et reconnaît votre zone géographique, le fichier est correctement pris en compte.

C Claude Que vend l’entreprise newp.fr et quels sont ses services ? Newp est une agence web et marketing digital basée en Charente, spécialisée depuis 2012 dans le SEO et le GEO. Ses services principaux : Référencement GEO (optimisation IA) Référencement SEO classique Création de sites WordPress sur mesure Source : llms.txt sur newp.fr
Capture d’écran : exemple de réponse d’un assistant IA citant explicitement le fichier llms.txt comme source. Les services et la zone géographique sont restitués fidèlement.

Si la réponse reste vague ou incorrecte, vérifiez trois points : le fichier est-il bien accessible publiquement (testez l’URL directement) ? Les descriptions sont-elles suffisamment explicites ? Y a-t-il des informations contradictoires ailleurs sur votre site ? Un audit GEO complet permet de lever ces ambiguïtés en quelques heures.

Étape 5 : suivre dans Search Console et les server logs

La mesure d’impact est la partie négligée par 90 % des praticiens. Sans suivi, vous ne saurez jamais si votre fichier est réellement utilisé ni quel ROI il génère. Deux outils à mobiliser en parallèle. Côté Google Search Console, ajoutez votre URL llms.txt dans les ressources surveillées pour valider l’accès des crawlers. Côté server logs (logs Apache ou Nginx), filtrez sur les user-agents ClaudeBot, GPTBot, OAI-SearchBot et PerplexityBot pour mesurer la fréquence de visite.

Visites de bots IA — 60 derniers jours +186 % sur les bots officiels 0 100 200 300 400 ClaudeBot GPTBot OAI-Search Perplexity Google-Ext. stable Avant Après llms.txt
Capture d’écran : dashboard de suivi des visites de bots IA après déploiement de llms.txt. Hausse de +186 % en 60 jours sur les bots officiels (Anthropic, OpenAI, Perplexity), aucun changement côté Google qui n’utilise pas ce fichier.

Sur les 12 derniers clients que notre équipe a accompagnés sur ce sujet, 9 ont vu apparaître leur nom dans des réponses Perplexity sous 21 jours après déploiement.

Les 4 erreurs fréquentes qui sabotent votre llms.txt

Avoir un fichier llms.txt est une chose. En avoir un qui fonctionne en est une autre. Voici les pièges récurrents que nous corrigeons régulièrement chez nos clients.

Dupliquer le sitemap Lister 200 URL n’est pas une stratégie : c’est l’inverse de ce qui est demandé. Le fichier doit être un filtre éditorial, pas un export technique. Si tout est prioritaire, rien ne l’est.
Décrire avec du jargon SEO Évitez les formulations bourrées de mots-clés du type « meilleure agence web premium leader ». Préférez une description naturelle, telle que vous l’expliqueriez à un nouveau client lors d’un premier rendez-vous.
Inclure du contenu protégé Les pages derrière login, espaces clients ou paiement n’ont rien à faire dans llms.txt. Les IA n’y accéderont pas et vous polluez le signal envoyé.
Oublier la maintenance Un fichier qui pointe vers des pages supprimées renvoie un signal négatif. Programmez une revue trimestrielle : ajout de nouveaux services, suppression des contenus obsolètes, ajustement des descriptions.

Au-delà de llms.txt : construire une stratégie GEO complète

llms.txt est un outil. Il ne fait pas tout. Pour transformer votre visibilité IA en réel levier d’acquisition, il s’inscrit dans une stratégie plus large, c’est ce que nous appelons le GEO (Generative Engine Optimization), évolution naturelle du SEO à l’ère des assistants conversationnels.

Une stratégie GEO efficace combine plusieurs leviers complémentaires. Le contenu d’abord : les LLM citent prioritairement les pages qui répondent directement à des questions, structurées avec des H2 explicites et des paragraphes courts. Les données structurées ensuite : le balisage Schema.org reste un signal fort que les IA exploitent pour comprendre votre activité. Les mentions externes enfin : les LLM accordent une autorité particulière aux sites cités par d’autres sources reconnues, surtout dans des publications professionnelles ou sectorielles.

Chez Newp, nous accompagnons depuis 2012 plus de 200 entreprises dans leur acquisition digitale. Notre offre complète couvre désormais cette nouvelle dimension stratégique avec des services spécifiquement conçus pour la visibilité IA :

Référencement GEO Discipline pionnière chez Newp : audit de votre présence dans ChatGPT, Claude et Perplexity, déploiement llms.txt, optimisation des données structurées et monitoring continu de vos citations IA.
Référencement IA Stratégie de contenu spécifiquement optimisée pour les LLM, avec rédaction de pages piliers structurées pour maximiser les chances de citation.
Référencement SEO classique Les fondamentaux Google restent essentiels : autorité de domaine, contenu de qualité, netlinking. Le SEO et le GEO se renforcent mutuellement.
SEO local Optimisation Google Business Profile, citations NAP, gestion d’avis. Indispensable pour les requêtes géolocalisées sur les LLM.
Création de site web Sites WordPress optimisés dès l’architecture pour la performance et la lecture machine, intégrant nativement llms.txt et balisage Schema.

Notre conviction : le SEO de 2026 ne se joue plus sur Google seul. Il se joue dans le triangle Google + médias spécialisés + IA générative. Les entreprises qui prennent position maintenant créent une avance qui sera difficile à rattraper.

Conclusion : une fenêtre d’opportunité courte

Soyons honnêtes : llms.txt n’est pas une recette miracle. Le standard est récent, son adoption par les LLM est inégale, et son impact réel varie selon les secteurs et les zones géographiques. Mais le coût de mise en place est dérisoire (moins de 2 heures), le risque est nul (le fichier ne peut pas nuire à votre SEO existant), et la fenêtre d’opportunité est courte. Quand 90 % des sites français auront déployé leur fichier, l’avantage concurrentiel aura disparu.

Le SEO de 2026 récompense ceux qui prennent les nouveaux signaux au sérieux avant qu’ils deviennent obligatoires. Si vous souhaitez auditer votre présence actuelle dans ChatGPT, Claude et Perplexity, et déployer une stratégie GEO complète sur votre site, l’équipe Newp réalise un audit gratuit et personnalisé sous 48 heures. Et vous, votre llms.txt est déjà en ligne ?

Demandez votre audit GEO gratuit sur newp.fr

Réponse sous 48h, sans engagement.

Mini-glossaire des termes techniques

Pour aider les lecteurs moins familiers avec le jargon SEO et IA, voici les définitions claires des principaux termes utilisés dans cet article.

llms.txt : fichier texte au format Markdown placé à la racine d’un site (votresite.fr/llms.txt) qui guide les modèles de langage vers les contenus prioritaires. Standard proposé fin 2024 par Jeremy Howard.
LLM (Large Language Model) : modèle d’intelligence artificielle entraîné sur d’immenses corpus textuels, capable de comprendre et générer du langage naturel. Exemples : ChatGPT, Claude, Gemini, Perplexity.
GEO (Generative Engine Optimization) : discipline d’optimisation du contenu pour qu’il soit cité ou recommandé par les moteurs IA. Évolution naturelle du SEO à l’ère des assistants conversationnels.
AEO (Answer Engine Optimization) : synonyme proche de GEO, mettant l’accent sur l’optimisation pour les moteurs de réponse comme Perplexity ou les AI Overviews de Google.
robots.txt : fichier historique placé à la racine d’un site qui indique aux crawlers ce qu’ils peuvent ou ne peuvent pas explorer. N’a pas le même rôle que llms.txt.
sitemap.xml : fichier listant exhaustivement toutes les URL d’un site pour aider les moteurs de recherche traditionnels à les indexer. Complémentaire de llms.txt mais distinct.
Markdown : langage de balisage léger utilisant une syntaxe simple. Format de prédilection des LLM car facilement lisible.
Crawler / Bot : programme qui parcourt automatiquement les sites web pour en extraire le contenu. Exemples : Googlebot, ClaudeBot, GPTBot.
ClaudeBot : crawler officiel d’Anthropic qui parcourt le web pour alimenter Claude. Premier acteur majeur à supporter officiellement llms.txt.
GPTBot : crawler officiel d’OpenAI utilisé pour ChatGPT et l’entraînement des modèles GPT.
PerplexityBot : crawler de Perplexity AI, moteur de recherche basé sur l’IA générative qui cite ses sources directement dans les réponses.
Google-Extended : user-agent que Google utilise pour ses produits IA (Gemini, AI Overviews). Ce crawler n’utilise pas llms.txt selon la position officielle de Google.
Server logs : fichiers générés par votre serveur web qui enregistrent chaque visite, y compris celle des crawlers. Outil de référence pour mesurer l’activité réelle des bots IA.
Trafic référent : trafic arrivant sur votre site depuis un autre site (et non depuis les résultats de recherche). Mesuré dans Google Analytics 4.
Schema.org : vocabulaire de balisage de données structurées utilisé pour aider les moteurs et les IA à comprendre le sens du contenu. Complément naturel de llms.txt.
Partager : 𝕏 in fb 🔗

Kévin Papot

Fondateur de Newp et de France Minéraux – Expert E-commerce depuis 15 ans, il a propulsé France Minéraux à +1 million de trafic mensuel en partant de 0. Il a également rédigé plusieurs livres sur le SEO, le GEO, et le référencement local avec les fiches Google Profile Business.

Audit gratuit

Obtenez votre audit SEO & GEO gratuit en 48h

Analyse complète de votre présence digitale sans engagement. Découvrez les opportunités de croissance de votre site web grâce à l’IA.

Besoin d'aide ?

Notre équipe est disponible pour un audit gratuit de votre projet web.

09 75 36 32 17
Réponse sous 24h · Audit GEO offert