Générateur robots.txt

Construisez visuellement un fichier robots.txt avec des règles User-agent, des chemins Allow et Disallow, un crawl-delay et des sitemaps. Tout s'exécute dans votre navigateur.

Vos règles robots.txt et URL de sitemap sont assemblées localement dans votre navigateur et ne sont jamais téléversées.

Besoin d'un sitemap aussi ? Essayez le Générateur de sitemap.

À propos de Générateur robots.txt

Ce générateur robots.txt vous permet de construire un fichier robots.txt visuellement au lieu de mémoriser la syntaxe exacte. Ajoutez un ou plusieurs groupes de règles, chacun avec un User-agent (par défaut *) ainsi que des lignes Allow et Disallow, puis définissez un Crawl-delay optionnel et listez vos URL de Sitemap. Des boutons de préréglage remplissent les configurations courantes : Tout autoriser, Tout bloquer, Bloquer les chemins d'administration courants comme /admin et /cgi-bin, et une configuration WordPress. Le panneau de sortie se met à jour en direct au fil de la frappe, formatant chaque groupe correctement avec une ligne vide entre les groupes et les lignes Sitemap à la fin. Lorsqu'une règle de chemin ne commence pas par une barre oblique, vous recevez un avertissement discret plutôt qu'un blocage. Copiez le résultat ou téléchargez-le sous robots.txt pour le placer à la racine de votre site. Tout est généré dans votre navigateur, donc rien de ce que vous tapez n'est téléversé.

Fonctionnalités

Comment utiliser Générateur robots.txt

  1. Choisissez un préréglage comme Tout autoriser ou Tout bloquer, ou démarrez un nouveau groupe User-agent.
  2. Définissez le User-agent et ajoutez des lignes Allow ou Disallow pour ce groupe.
  3. Ajoutez éventuellement un Crawl-delay et vos URL de Sitemap.
  4. Examinez le robots.txt en direct dans le panneau de sortie à droite.
  5. Cliquez sur Copier ou Télécharger pour enregistrer robots.txt et le téléverser à la racine de votre site.

Exemple

Entrée

User-agent: *  →  Disallow: /admin, /cgi-bin/
Sitemap: https://example.com/sitemap.xml

Sortie

User-agent: *
Disallow: /admin
Disallow: /cgi-bin/

Sitemap: https://example.com/sitemap.xml

Un seul groupe bloquant les chemins d'administration, avec un sitemap ajouté à la fin.

Erreurs courantes et dépannage

Foire aux questions

Que fait Disallow: / ?
Disallow: / indique à un robot de ne récupérer aucune URL du site pour ce User-agent. C'est la base du préréglage Tout bloquer, donc utilisez-le avec précaution sur un site en production.
Où dois-je placer le fichier robots.txt ?
Il doit se trouver à la racine de votre domaine, servi à https://example.com/robots.txt. Les robots ne regardent que là, donc un robots.txt dans un sous-dossier est ignoré.
Disallow retire-t-il une page de Google ?
Non. Disallow demande aux robots conformes de ne pas récupérer l'URL, mais une page bloquée peut quand même apparaître dans les résultats via d'autres liens. Utilisez une balise meta ou un en-tête noindex pour garder une page hors de l'index.
Puis-je définir des règles différentes pour différents robots ?
Oui. Ajoutez un groupe User-agent distinct pour chaque robot, par exemple un pour Googlebot et un pour *. Chaque groupe obtient ses propres lignes Allow et Disallow dans la sortie.
Qu'est-ce que le Crawl-delay et dois-je l'utiliser ?
Crawl-delay demande à un robot d'attendre ce nombre de secondes entre les requêtes. Il est respecté par certains moteurs comme Bing mais ignoré par Googlebot, il est donc optionnel et laissé vide par défaut.
Mon robots.txt est-il envoyé à un serveur ?
Non. Le générateur robots.txt construit le fichier dans votre navigateur au fil de la frappe, donc les règles et URL de sitemap que vous saisissez restent sur votre appareil.

Outils associés

Tous les outils ArrayKit