O WordPress é uma das plataformas mais populares para gerenciamento de conteúdo, mas em ambientes customizados, como servidores configurados com Apache, Nginx ou cache avançado como o Varnish, podem surgir problemas de indexação. Esses problemas geralmente ocorrem devido à configuração incorreta de cabeçalhos HTTP, permissões inadequadas para o vHost, ou a ausência de um arquivo robots.txt funcional.
Este artigo oferece um guia completo para corrigir esses erros, incluindo a configuração adequada do Varnish, permissões para vHosts no Apache e Nginx, e validação do arquivo robots.txt. Vamos garantir que seu site esteja totalmente otimizado para indexação por motores de busca.
O Que é o Erro de Indexação e Por Que Ele Acontece?
Os erros de indexação ocorrem quando motores de busca como o Google não conseguem acessar ou interpretar as páginas do seu site corretamente. As causas comuns incluem:
- Configurações de Cache:
- Ferramentas como o Varnish podem interferir nos cabeçalhos enviados pelo WordPress.
- Permissões de vHost Incorretas:
- Configurações inadequadas no arquivo de vHost podem bloquear o acesso ao sitemap ou ao arquivo robots.txt.
- Arquivo robots.txt Mal Configurado:
- Bots podem ser impedidos de acessar partes importantes do site se o arquivo robots.txt estiver ausente ou incorreto.
- Cabeçalhos X-Robots-Tag Inadequados:
- Configurações incorretas podem bloquear a indexação de páginas críticas.
Configuração do Varnish para Corrigir Erros de Indexação
O Varnish Cache pode interferir nos cabeçalhos enviados pelo WordPress, especialmente o X-Robots-Tag, que é essencial para indexação. Aqui está como configurar corretamente:
Configuração no Varnish
Abra o arquivo de configuração do Varnish, localizado em /etc/varnish/default.vcl
, e adicione ou edite as seguintes linhas:
sub vcl_backend_response {
# Garantir que o cabeçalho X-Robots-Tag correto seja entregue apenas uma vez
unset resp.http.X-Robots-Tag; # Remove qualquer duplicado
set resp.http.X-Robots-Tag = "index, follow"; # Define o correto
}
# Configurar cabeçalho X-Robots-Tag correto para o sitemap
if (bereq.url == "/sitemap_index.xml") {
unset beresp.http.X-Robots-Tag; # Remove cabeçalhos duplicados do backend
set beresp.http.X-Robots-Tag = "index, follow"; # Define o correto
}
Reiniciar o Varnish
Após as alterações, reinicie o serviço do Varnish para aplicar as configurações:
sudo systemctl restart varnish
sudo systemctl status varnish
Configuração de Permissões no vHost
Configurações de permissões corretas para o vHost são essenciais para garantir que o sitemap e o robots.txt estejam acessíveis tanto no Apache quanto no Nginx.
Configuração no Apache
Edite o arquivo de vHost, geralmente localizado em /etc/apache2/sites-available/seusite.conf
, adicione o seguinte trecho:
# Configuração para garantir acesso ao sitemap e robots.txt
<FilesMatch "\.(xml|txt)$">
Require all granted
</FilesMatch>
Reinicie o Apache para aplicar as alterações:
sudo systemctl restart apache2
sudo systemctl status apache2
Configuração no Nginx
Edite o arquivo de configuração do servidor, localizado em /etc/nginx/sites-available/seusite
.conf, adicione o seguinte trecho:
# Garantir acesso ao robots.txt e sitemap
location ~* /(robots\.txt|sitemap.*\.xml)$ {
allow all;
log_not_found off;
access_log off;
}
Reinicie o Nginx para validar as alterações:
sudo systemctl restart nginx
sudo systemctl status nginx
Validar o Acesso ao Robots.txt
Crie ou edite o arquivo robots.txt na raiz do diretório do WordPress (ex.: /var/www/seusite/robots.txt
) com o seguinte conteúdo:
User-agent: *
Disallow: /wp-admin/
Allow: /wp-admin/admin-ajax.php
Sitemap: https://seusite.com/wp-sitemap.xml
Certifique-se de que o arquivo tenha as permissões corretas:
chmod 644 /var/www/seusite/robots.txt
Use a ferramenta Robots.txt Tester para garantir que o arquivo está acessível e funcional.
Validar Cabeçalhos X-Robots-Tag
Depois de configurar o Varnish, Apache ou Nginx, use uma ferramenta como o HTTP Header Checker para verificar se os cabeçalhos corretos estão sendo enviados.
Você deve ver algo como:
X-Robots-Tag: index, follow
Manutenção Contínua
- Monitoramento Regular:
- Use o Google Search Console para identificar problemas de rastreamento e indexação.
- Atualizações Frequentes:
- Certifique-se de que o WordPress, plugins e servidores estão atualizados.
- Backups Automatizados:
- Realize backups regulares dos arquivos de configuração e conteúdo do site.
- Testes de Acessibilidade:
- Teste regularmente o acesso ao sitemap e ao arquivo robots.txt.
Conclusão
Corrigir erros de indexação no WordPress em ambientes customizados exige atenção às configurações de cache, permissões do vHost e acessibilidade de arquivos como o robots.txt e o sitemap. Este guia fornece um plano detalhado para resolver esses problemas em servidores Apache, Nginx e Varnish, garantindo que o site seja rastreável e indexável pelos motores de busca.
Com práticas regulares de manutenção e monitoramento, você pode evitar problemas futuros e melhorar a visibilidade do seu site nos resultados de busca.
Amante por tecnologia Especialista em Cibersegurança e Big Data, Formado em Administração de Infraestrutura de Redes, Pós-Graduado em Ciências de Dados e Big Data Analytics e Machine Learning, Com MBA em Segurança da Informação, Escritor do livro ” Cibersegurança: Protegendo a sua Reputação Digital”.