Rastreio, indexação e classificação: os significados e as diferenças
Como especialista em SEO, utilizo estes termos diariamente: rastreamento, indexação e classificação . O rastreio refere-se ao processo através do qual os motores de busca recolhem o conteúdo das páginas Web na Internet. A indexação consiste em armazenar este conteúdo na base de dados do motor de busca. A classificação refere-se ao posicionamento da página Web nos resultados de pesquisa de um motor de busca para uma determinada consulta.
Neste artigo, vou levá-lo a conhecer o mundo do rastreio, indexação e classificação e as formas como afecta toda uma campanha de SEO.
O que é rastreio, indexação e classificação?
Em primeiro lugar, vou dar uma breve explicação de cada secção, após o que entrarei em mais detalhes.
- Rastreio: Durante este processo, o Google descarrega o texto, as imagens e os vídeos de uma página com “programas” automatizados (rastreadores).
- Indexação: O Google analisa estes dados e armazena-os no Google (que é basicamente uma grande base de dados).
- Classificação: Quando alguém pesquisa algo no Google, esse pesquisador pode deparar-se com estes dados.
O que é rastejar?
O Google descobre e mantém uma lista de páginas Web através da “descoberta de URLs”, onde rastreia ligações ou utiliza sitemaps. Um programa chamado Googlebot rastreia as páginas de acordo com um algoritmo, gerindo cuidadosamente a velocidade para evitar sobrecarregar os sítios Web.
No entanto, nem todas as páginas encontradas são rastreadas; algumas estão bloqueadas pelo proprietário do site ou requerem início de sessão. Durante a pesquisa, o Google processa a página e executa JavaScript para garantir que todo o conteúdo relevante é apresentado.(1)
- O Googlebot encontra uma página.
- O Googlebot descarrega a página e todo o seu conteúdo.
- O Googlebot coloca os links para outras páginas na fila de rastreio, prontos para serem rastreados.
O que é a indexação?
Esta parte é designada por indexação e envolve a análise/compreensão do texto, de etiquetas importantes como
Durante a indexação, o Google verifica se uma página é uma duplicata ou a versão “real” desse conteúdo. A canónica é a página apresentada nos resultados da pesquisa. O Google começa por agrupar páginas semelhantes e selecciona a mais representativa. Outras páginas do grupo podem ser apresentadas em situações específicas, por exemplo, para utilizadores móveis. (2)
O processo funciona da seguinte forma:
- O Googlebot forma uma imagem a partir do texto, das imagens, do HTML e do CSS descarregados.
- O Googlebot executa o JavaScript encontrado (este é um processo separado), que se torna HTML renderizado.
- O GoogleBot forma uma imagem completa da página.
- O Googlebot indexa a página (quando é possível e o próprio Google o quer).
O que são gavinhas?
Agora, a parte mais divertida para muitos proprietários de sítios Web: a classificação. Quando um utilizador introduz uma consulta de pesquisa, os sistemas do Google pesquisam no índice as páginas correspondentes e apresentam os resultados que consideram ter a melhor qualidade e relevância para o utilizador.
A relevância é determinada por centenas de factores, como a localização, o idioma e o dispositivo (computador ou telemóvel). Por exemplo, a pesquisa “padeiro” dará resultados diferentes para utilizadores em Paris e em Hong Kong.
A página de resultados da pesquisa também muda com base na consulta de pesquisa. Se pesquisares por “padeiro”, é provável que apareçam resultados locais, enquanto que “como ser padeiro” é mais provável que apareçam resultados nacionais.(3)
Em resumo:
- Na secção “processamento”, o Google toma a decisão (sim/não) de indexar uma página.
- Depois é indexada e esta página pode ser classificada no índice.
Como é que influencio o rastreio, a indexação e a classificação com SEO?
Agora que sabes o que cada componente do rastreio, indexação e classificação implica, vou mostrar-te o que faço dentro de uma estratégia de SEO para promover estes componentes.
O que afecta o rastreio e a indexação pelo Googlebot?
Por isso, centra-se na facilidade com que o Google consegue aceder a tudo o que está no sítio Web. Alguns dos componentes que afectam esta situação:
- estrutura do sítio Web com uma estrutura de silo;
- ligações internas para as páginas mais importantes;(4)
- Mapas de sítios XML e HTML;(5)
- Optimiza o robots.txt (certifica-te de que o Google consegue aceder a tudo);(6)
- optimiza os canónicos;
- Evita as etiquetas noindex nas páginas importantes;
- Evita as páginas 4xx e 5xx;
- Evita cadeias de redireccionamento e/ou redireccionamentos desnecessários;
- Optimiza o sítio Web para o orçamento de rastreio.
Como é que posso influenciar a classificação?
Isto começa a parecer-se mais com uma viagem normal de SEO, mas as partes que interessam aqui são as seguintes:
- velocidade do sítio web;
- estrutura do sítio Web;
- conteúdo de qualidade (e escrito sobre os temas certos);
- links internos de qualidade;
- boa usabilidade móvel (responsiva);
- uma boa experiência de utilização;
- valoriza os potenciais visitantes.
Em suma, todos os problemas conhecidos são importantes para este efeito. Para o efeito, criei o roteiro de SEO.
Conclusão
Neste artigo, expliquei-te o que significa crawling, indexação e classificação e como diferem. Um “verdadeiro” especialista em SEO sabe a diferença… agora tu também sabes. Boa sorte com a otimização!
- Guia detalhado de como funciona a pesquisa do Google | Central de pesquisa do Google | Documentação | Google para desenvolvedores. (s.d.-j). Google para programadores. https://developers.google.com/search/docs/fundamentals/how-search-works#crawling
- Guia detalhado de como funciona a pesquisa do Google | Central de pesquisa do Google | Documentação | Google para desenvolvedores. (s.d.-k). Google para programadores. https://developers.google.com/search/docs/fundamentals/how-search-works#indexing
- Guia detalhado de como funciona a pesquisa do Google | Central de pesquisa do Google | Documentação | Google para desenvolvedores. (s.d.-l). Google para programadores. https://developers.google.com/search/docs/fundamentals/how-search-works#serving
- Melhores práticas de ligação SEO para o Google | Central de pesquisa do Google | Documentação | Google para programadores. (s.d.-g). Google para programadores. https://developers.google.com/search/docs/crawling-indexing/links-crawlable#internal-links
- O que é um mapa do site | Central de pesquisa do Google | Documentação | Google para desenvolvedores. (s.d.-c). Google para programadores. https://developers.google.com/search/docs/crawling-indexing/sitemaps/overview
- Introdução e guia do Robots.txt | Central de pesquisa do Google | Documentação | Google para desenvolvedores. (s.d.). Google para programadores. https://developers.google.com/search/docs/crawling-indexing/robots/intro