Secção de indexação da Consola de Pesquisa do Google: Como a utilizo?

A secção de indexação da Consola de Pesquisa do Google é utilizada para a (adivinhou) indexação do seu Web site. Nesta visão geral, as organizações podem ver o progresso da indexação de um Web site e as possíveis razões pelas quais está ou não a correr bem. Neste artigo, vou falar sobre as funcionalidades desta secção e como a utilizo para a otimização técnica de sítios Web. (1)

A secção de indexação descreveu

Sem me aprofundar muito no assunto, aqui pode ver os dados do RalfvanVeen.com da secção de indexação da Consola de Pesquisa do Google. Neste artigo, discutirei as secções que utilizo com mais frequência: páginas, mapas de sites e eliminações. Discutirei cada secção com mais pormenor. (2)

Visão geral: páginas

Contém 2 secções: razões para não indexar páginas e progresso da indexação de páginas. É importante notar que, nestas secções, o Google está muitas vezes atrasado no rastreio destas páginas. Quanto menor for o orçamento de rastreio de um sítio Web, mais o Google ficará para trás neste domínio.

O que é interessante notar é que found – atualmente não index ado e crawled – atualmente não indexado é, com toda a probabilidade, a fila de crawl do Google (interpretação própria disto).

  1. Página redireccionada – Indica que o URL foi redireccionado para outro URL. O Google pode optar por indexar o URL de destino em vez do URL redireccionado. Note-se que isto não é necessariamente um problema. Faz sentido que um código de estado 301 ou 302 não seja indexado (afinal, já não é uma página HTML estática).
  2. Página alternativa com etiqueta canónica correcta – Indica a existência de outra página que o Google considera a versão preferida (canónica). A página não indexada tem uma etiqueta “canónica” que remete para a versão preferida que o Google deve indexar. Na prática, isto indica frequentemente alguns problemas.
  3. Não encontrado (404) – O servidor devolve um código de estado 404, o que significa que a página não pode ser encontrada. Estas páginas não são indexadas porque o Google pensa que não existem.
  4. Rastreada – atualmente não indexada – o Google rastreou a página, mas decidiu não a incluir no índice (ainda). Esta situação pode ser temporária ou resultar de problemas de qualidade da página.
  5. Página duplicada, o Google escolheu uma página canónica diferente da do utilizador – o Google identificou que esta página contém conteúdo duplicado e escolheu outra página como recurso canónico a ser indexado. Portanto, isto pode ser um problema se acontecer com mais frequência no sítio Web.
  6. Excluída pela etiqueta “noindex” – A página contém uma instrução “noindex” nas meta tags ou cabeçalhos, instruindo o Google a não indexar esta página.
  7. Bloqueada por robots.txt – A página está bloqueada por uma linha no ficheiro robots.txt do site, que dá instruções aos rastreadores para não rastrearem a página.
  8. Bloqueado devido a outro problema 4xx – Existe um erro de cliente 4xx diferente de 404, que pode indicar um problema de acesso à página, como um 403 Forbidden ou 410 Gone.
  9. Encontrada – não indexada atualmente – o Google encontrou a página, mas, por alguma razão, ainda não a indexou. Esta situação pode ser temporária ou depender de determinados factores, como a conceção do sítio ou sinais de qualidade da página.
  10. Erro com redireccionamento – Existe um problema com a forma como a página é redireccionada, possivelmente devido a um servidor mal configurado ou a um problema com a cadeia de redireccionamento.

Como se pode ver, nem tudo são problemas. Cerca de metade destes pontos acabarão por ser questões que podem ser resolvidas.

A partir destes dados, já é possível interpretar uma imagem geral do progresso da indexação de páginas. Com base nisto, posso frequentemente saber se há algo de errado com um sítio Web. É importante saber: Quase nunca conseguirá que o número de páginas não indexadas seja 0 aqui. O que a própria Google diz sobre este assunto:

Estes URLs não são indexados pelo Google. Em alguns casos, pode ser essa a sua intenção, mas noutros pode ser um erro. Veja os problemas na tabela abaixo para determinar se é necessário alterar esses URLs.

Saiba mais sobre a Consola de Pesquisa do Google

Secção Sitemaps

Na secção de mapas do site, pode olhar mais especificamente para as páginas, o que significa que todas elas estão nos seus mapas do site XML enviados para a Consola de Pesquisa do Google.(3)

É importante notar que existem duas formas de enviar um mapa do site XML para a Consola de Pesquisa do Google:

  1. Robots.txt (pode colocar uma ligação no Robots.txt para os mapas de sítios XML do seu sítio Web).
  2. Google Search Console (através da imagem acima).

Um é suficiente, mas gosto sempre de fazer os dois para ser o mais explícito possível neste domínio.

O que é interessante na secção de mapas do sítio é que permite analisar muito mais especificamente os possíveis problemas de determinadas páginas. Quando clico num mapa do sítio XML:

Em seguida, clique em ver indexação de páginas.

Aqui pode ver o progresso novamente, mas muito concentrado nas páginas de um mapa do site XML específico. O que o torna tão interessante é que agora é possível analisar e efetuar determinadas optimizações de uma forma muito mais direccionada. Ao fazê-lo, não encontrará aqui nenhuma página de “ruído” porque todas estas páginas estão no mapa do sítio XML.

Por estas páginas de “ruído”, entendo, por exemplo, os URL de parâmetros provenientes da navegação facetada de uma loja virtual. Todos eles são também detectados pelo GoogleBot e incluídos na Consola de Pesquisa do Google.

Por exemplo, se eu clicar aqui em encontrado – atualmente não indexado….

Acabo por ficar com uma lista de URLs que não são indexados por este motivo. Se depois clicar numa página específica, acabo por ver o resumo abaixo.

Com esta visão geral, posso ver em pormenor porque é que uma determinada página não está indexada. Como se pode ver, não existe nenhuma página de referência para esta página em particular, pelo que provavelmente não está indexada. Na mesma declaração, posso pedir a indexação. Isto permite-lhe analisar estes URLs ao nível da página.

Visão geral: Mudanças

Nesta vista, como o nome sugere, pode remover rapidamente conteúdos dos resultados da pesquisa.

Três grandes oportunidades.

  • Eliminações temporárias (6 meses): Para remover rapidamente algo que provavelmente será removido permanentemente do sítio Web.
  • Conteúdo obsoleto: de acordo com o Google, esta ferramenta só funciona se o conteúdo que pretende remover dos resultados de pesquisa já tiver sido removido de um sítio Web.
  • Filtragem com SafeSearch: mostra todos os conteúdos que foram assinalados como explícitos por uma utilização no Google nos últimos seis meses. Considera que isto está incorreto? Então pode objetar.(4)

Conclusão

Estou certo de que isto não é tudo o que é possível nesta secção da Consola de Pesquisa do Google, mas é suficiente para um primeiro artigo sobre este assunto. Utilizo esta secção principalmente para a interpretação do conjunto (como é que o Google o indexa) e, em seguida, para a eventual análise de problemas específicos ao nível do URL. Boa sorte com a otimização!

Fontes

  1. Como usar o Console de pesquisa | Central de pesquisa do Google | Documentação | Google para desenvolvedores. (s.d.-b). Google para programadores. https://developers.google.com/search/docs/monitor-debug/search-console-start
  2. Rastreamento e indexação do Google | Central de pesquisa do Google | Documentação | Google para desenvolvedores. (s.d.). Google para programadores. https://developers.google.com/search/docs/crawling-indexing
  3. Criar e enviar um mapa do site | Central de pesquisa do Google | Documentação | Google para desenvolvedores. (s.d.-d). Google para programadores. https://developers.google.com/search/docs/crawling-indexing/sitemaps/build-sitemap
  4. Novo relatório de remoções no Search Console | Blogue da Central de pesquisa do Google | Google para programadores. (s.d.). Google para programadores. https://developers.google.com/search/blog/2020/01/new-removals-report-in-search-console
Senior SEO-specialist

Ralf van Veen

Senior SEO-specialist
Five stars
Obtenho um 5.0 no Google em 78 revisões

Há 12 anos que trabalho como especialista independente em SEO para empresas (nos Países Baixos e no estrangeiro) que pretendem obter uma classificação mais elevada no Google de uma forma sustentável. Durante este período, prestei consultoria a marcas de renome, criei campanhas internacionais de SEO em grande escala e orientei equipas de desenvolvimento globais sobre otimização de motores de busca.

Com esta vasta experiência em SEO, desenvolvi o curso de SEO e ajudei centenas de empresas a melhorar a sua capacidade de serem encontradas no Google de uma forma sustentável e transparente. Para isso, pode consultar o meu portefólio, referências e colaborações.

Este artigo foi originalmente publicado em 11 Abril 2024. A última atualização deste artigo foi em 11 Abril 2024. O conteúdo desta página foi escrito e aprovado por Ralf van Veen. Saiba mais sobre a criação dos meus artigos nas minhas directrizes editoriais.