Dolutech

Como Corrigir Erro de Indexação de Páginas WordPress em Ambientes Customizados

O WordPress é uma das plataformas mais populares para gerenciamento de conteúdo, mas em ambientes customizados, como servidores configurados com Apache, Nginx ou cache avançado como o Varnish, podem surgir problemas de indexação. Esses problemas geralmente ocorrem devido à configuração incorreta de cabeçalhos HTTP, permissões inadequadas para o vHost, ou a ausência de um arquivo robots.txt funcional.

Este artigo oferece um guia completo para corrigir esses erros, incluindo a configuração adequada do Varnish, permissões para vHosts no Apache e Nginx, e validação do arquivo robots.txt. Vamos garantir que seu site esteja totalmente otimizado para indexação por motores de busca.

image 3
Indexação de sites WordPress

O Que é o Erro de Indexação e Por Que Ele Acontece?

Os erros de indexação ocorrem quando motores de busca como o Google não conseguem acessar ou interpretar as páginas do seu site corretamente. As causas comuns incluem:

  1. Configurações de Cache:
    • Ferramentas como o Varnish podem interferir nos cabeçalhos enviados pelo WordPress.
  2. Permissões de vHost Incorretas:
    • Configurações inadequadas no arquivo de vHost podem bloquear o acesso ao sitemap ou ao arquivo robots.txt.
  3. Arquivo robots.txt Mal Configurado:
    • Bots podem ser impedidos de acessar partes importantes do site se o arquivo robots.txt estiver ausente ou incorreto.
  4. Cabeçalhos X-Robots-Tag Inadequados:
    • Configurações incorretas podem bloquear a indexação de páginas críticas.

Configuração do Varnish para Corrigir Erros de Indexação

O Varnish Cache pode interferir nos cabeçalhos enviados pelo WordPress, especialmente o X-Robots-Tag, que é essencial para indexação. Aqui está como configurar corretamente:

Configuração no Varnish

Abra o arquivo de configuração do Varnish, localizado em /etc/varnish/default.vcl, e adicione ou edite as seguintes linhas:

sub vcl_backend_response {
    # Garantir que o cabeçalho X-Robots-Tag correto seja entregue apenas uma vez
    unset resp.http.X-Robots-Tag; # Remove qualquer duplicado
    set resp.http.X-Robots-Tag = "index, follow"; # Define o correto
}

# Configurar cabeçalho X-Robots-Tag correto para o sitemap
if (bereq.url == "/sitemap_index.xml") {
    unset beresp.http.X-Robots-Tag; # Remove cabeçalhos duplicados do backend
    set beresp.http.X-Robots-Tag = "index, follow"; # Define o correto
}

Reiniciar o Varnish

Após as alterações, reinicie o serviço do Varnish para aplicar as configurações:

sudo systemctl restart varnish
sudo systemctl status varnish

Configuração de Permissões no vHost

Configurações de permissões corretas para o vHost são essenciais para garantir que o sitemap e o robots.txt estejam acessíveis tanto no Apache quanto no Nginx.

Configuração no Apache

Edite o arquivo de vHost, geralmente localizado em /etc/apache2/sites-available/seusite.conf, adicione o seguinte trecho:

# Configuração para garantir acesso ao sitemap e robots.txt
    <FilesMatch "\.(xml|txt)$">
        Require all granted
    </FilesMatch>

Reinicie o Apache para aplicar as alterações:

sudo systemctl restart apache2
sudo systemctl status apache2

Configuração no Nginx

Edite o arquivo de configuração do servidor, localizado em /etc/nginx/sites-available/seusite.conf, adicione o seguinte trecho:

# Garantir acesso ao robots.txt e sitemap
    location ~* /(robots\.txt|sitemap.*\.xml)$ {
        allow all;
        log_not_found off;
        access_log off;
    }

Reinicie o Nginx para validar as alterações:

sudo systemctl restart nginx
sudo systemctl status nginx

Validar o Acesso ao Robots.txt

Crie ou edite o arquivo robots.txt na raiz do diretório do WordPress (ex.: /var/www/seusite/robots.txt) com o seguinte conteúdo:

User-agent: *
Disallow: /wp-admin/
Allow: /wp-admin/admin-ajax.php

Sitemap: https://seusite.com/wp-sitemap.xml

Certifique-se de que o arquivo tenha as permissões corretas:

chmod 644 /var/www/seusite/robots.txt

Use a ferramenta Robots.txt Tester para garantir que o arquivo está acessível e funcional.

Validar Cabeçalhos X-Robots-Tag

Depois de configurar o Varnish, Apache ou Nginx, use uma ferramenta como o HTTP Header Checker para verificar se os cabeçalhos corretos estão sendo enviados.

Você deve ver algo como:

X-Robots-Tag: index, follow

Manutenção Contínua

  1. Monitoramento Regular:
    • Use o Google Search Console para identificar problemas de rastreamento e indexação.
  2. Atualizações Frequentes:
    • Certifique-se de que o WordPress, plugins e servidores estão atualizados.
  3. Backups Automatizados:
    • Realize backups regulares dos arquivos de configuração e conteúdo do site.
  4. Testes de Acessibilidade:
    • Teste regularmente o acesso ao sitemap e ao arquivo robots.txt.

Conclusão

Corrigir erros de indexação no WordPress em ambientes customizados exige atenção às configurações de cache, permissões do vHost e acessibilidade de arquivos como o robots.txt e o sitemap. Este guia fornece um plano detalhado para resolver esses problemas em servidores Apache, Nginx e Varnish, garantindo que o site seja rastreável e indexável pelos motores de busca.

Com práticas regulares de manutenção e monitoramento, você pode evitar problemas futuros e melhorar a visibilidade do seu site nos resultados de busca.

Sair da versão mobile