Gerador de robots.txt

Monte visualmente um arquivo robots.txt com regras de User-agent, caminhos Allow e Disallow, crawl-delay e sitemaps. Tudo roda no seu navegador.

Suas regras de robots.txt e URLs de sitemap são montadas localmente no seu navegador e nunca são enviadas.

Precisa de um sitemap também? Experimente o Gerador de Sitemap.

Sobre Gerador de robots.txt

Este gerador de robots.txt permite montar um arquivo robots.txt visualmente em vez de lembrar a sintaxe exata. Adicione um ou mais grupos de regras, cada um com um User-agent (padrão *) mais linhas de regras Allow e Disallow, depois defina um Crawl-delay opcional e liste as URLs do seu Sitemap. Botões de predefinição preenchem configurações comuns: Permitir tudo, Bloquear tudo, Bloquear caminhos de admin comuns como /admin e /cgi-bin, e uma configuração para WordPress. O painel de saída atualiza ao vivo enquanto você digita, formatando cada grupo corretamente com uma linha em branco entre os grupos e as linhas Sitemap no final. Quando uma regra de caminho não começa com uma barra, você recebe um aviso gentil em vez de um bloqueio. Copie o resultado ou baixe-o como robots.txt para colocar na raiz do seu site. Tudo é gerado no seu navegador, então nada do que você digita é enviado.

Recursos

Como usar Gerador de robots.txt

  1. Escolha uma predefinição como Permitir tudo ou Bloquear tudo, ou inicie um novo grupo de User-agent.
  2. Defina o User-agent e adicione linhas de caminho Allow ou Disallow para esse grupo.
  3. Opcionalmente, adicione um Crawl-delay e as URLs do seu Sitemap.
  4. Revise o robots.txt ao vivo no painel de saída à direita.
  5. Clique em Copiar ou Baixar para salvar o robots.txt e enviá-lo para a raiz do seu site.

Exemplo

Entrada

User-agent: *  →  Disallow: /admin, /cgi-bin/
Sitemap: https://example.com/sitemap.xml

Saída

User-agent: *
Disallow: /admin
Disallow: /cgi-bin/

Sitemap: https://example.com/sitemap.xml

Um único grupo bloqueando caminhos de admin, com um sitemap anexado no final.

Erros comuns e solução de problemas

Perguntas frequentes

O que Disallow: / faz?
Disallow: / diz a um crawler para não buscar nenhuma URL do site para aquele User-agent. É a base da predefinição Bloquear tudo, então use-a com cuidado em um site no ar.
Onde coloco o arquivo robots.txt?
Ele deve ficar na raiz do seu domínio, servido em https://example.com/robots.txt. Os crawlers só procuram lá, então um robots.txt em uma subpasta é ignorado.
Disallow remove uma página do Google?
Não. Disallow pede que crawlers compatíveis não busquem a URL, mas uma página bloqueada ainda pode aparecer nos resultados a partir de outros links. Use uma meta tag ou cabeçalho noindex para manter uma página fora do índice.
Posso definir regras diferentes para bots diferentes?
Sim. Adicione um grupo de User-agent separado para cada bot, por exemplo um para Googlebot e um para *. Cada grupo recebe suas próprias linhas Allow e Disallow na saída.
O que é Crawl-delay e devo usá-lo?
Crawl-delay pede que um crawler espere essa quantidade de segundos entre as requisições. Ele é respeitado por alguns mecanismos como o Bing, mas ignorado pelo Googlebot, então é opcional e fica em branco por padrão.
Meu robots.txt é enviado para um servidor?
Não. O gerador de robots.txt monta o arquivo no seu navegador enquanto você digita, então as regras e URLs de sitemap que você digita permanecem no seu dispositivo.

Ferramentas relacionadas

Todas as ferramentas de ArrayKit