Generador de robots.txt

Construye visualmente un archivo robots.txt con reglas de User-agent, rutas allow y disallow, crawl-delay y sitemaps. Todo se ejecuta en tu navegador.

Tus reglas de robots.txt y las URL de sitemap se ensamblan localmente en tu navegador y nunca se suben.

¿Necesitas también un sitemap? Prueba el Generador de Sitemap.

Acerca de Generador de robots.txt

Este generador de robots.txt te permite construir un archivo robots.txt visualmente en lugar de recordar la sintaxis exacta. Añade uno o más grupos de reglas, cada uno con un User-agent (predeterminado *) más filas de rutas Allow y Disallow, luego define un Crawl-delay opcional y lista las URL de tu Sitemap. Los botones de preajuste rellenan configuraciones comunes: permitir todo, bloquear todo, bloquear rutas de administración comunes como /admin y /cgi-bin, y una configuración de WordPress. El panel de salida se actualiza en vivo mientras escribes, dando formato a cada grupo correctamente con una línea en blanco entre grupos y las líneas de Sitemap al final. Cuando una regla de ruta no empieza con una barra, recibes una advertencia suave en vez de un bloqueo. Copia el resultado o descárgalo como robots.txt para colocarlo en la raíz de tu sitio. Todo se genera en tu navegador, así que nada de lo que escribes se sube.

Características

Cómo usar Generador de robots.txt

  1. Elige un preajuste como permitir todo o bloquear todo, o empieza un grupo de User-agent nuevo.
  2. Define el User-agent y añade filas de ruta Allow o Disallow para ese grupo.
  3. Opcionalmente añade un Crawl-delay y las URL de tu Sitemap.
  4. Revisa el robots.txt en vivo en el panel de salida a la derecha.
  5. Haz clic en Copiar o Descargar para guardar robots.txt y subirlo a la raíz de tu sitio.

Ejemplo

Entrada

User-agent: *  →  Disallow: /admin, /cgi-bin/
Sitemap: https://example.com/sitemap.xml

Salida

User-agent: *
Disallow: /admin
Disallow: /cgi-bin/

Sitemap: https://example.com/sitemap.xml

Un solo grupo que bloquea rutas de administración, con un sitemap añadido al final.

Errores comunes y solución de problemas

Preguntas frecuentes

¿Qué hace Disallow: /?
Disallow: / le indica a un rastreador que no obtenga ninguna URL del sitio para ese User-agent. Es la base del preajuste bloquear todo, así que úsalo con cuidado en un sitio en producción.
¿Dónde coloco el archivo robots.txt?
Debe estar en la raíz de tu dominio, servido en https://example.com/robots.txt. Los rastreadores solo buscan ahí, así que un robots.txt en una subcarpeta se ignora.
¿Disallow elimina una página de Google?
No. Disallow pide a los rastreadores que lo cumplen que no obtengan la URL, pero una página bloqueada todavía puede aparecer en resultados a partir de otros enlaces. Usa una metaetiqueta o cabecera noindex para mantener una página fuera del índice.
¿Puedo definir reglas distintas para distintos bots?
Sí. Añade un grupo de User-agent aparte para cada bot, por ejemplo uno para Googlebot y otro para *. Cada grupo recibe sus propias líneas Allow y Disallow en la salida.
¿Qué es Crawl-delay y debería usarlo?
Crawl-delay pide a un rastreador que espere esa cantidad de segundos entre solicitudes. Algunos motores como Bing lo respetan, pero Googlebot lo ignora, así que es opcional y se deja en blanco por defecto.
¿Se envía mi robots.txt a un servidor?
No. El generador de robots.txt construye el archivo en tu navegador mientras escribes, así que las reglas y las URL de sitemap que introduces permanecen en tu dispositivo.

Herramientas relacionadas

Todas las herramientas de ArrayKit