Rastreo, indexación y clasificación: significados y diferencias

Como especialista en SEO, utilizo estos términos a diario: rastreo, indexación y clasificación . El rastreo se refiere al proceso mediante el cual los motores de búsqueda recopilan el contenido de las páginas web de Internet. La indexación consiste en almacenar estos contenidos en la base de datos del motor de búsqueda. La clasificación se refiere al posicionamiento de la página web en los resultados de búsqueda de un motor de búsqueda para una consulta determinada.

En este artículo, te llevaré a través del mundo del rastreo, indexación y clasificación y las formas en que afecta a toda una campaña de SEO.

¿Qué es el rastreo, la indexación y la clasificación?

En primer lugar, daré una breve explicación de cada sección, tras lo cual entraré en más detalles.

  1. Rastreo: Durante este proceso, Google descarga el texto, las imágenes y los vídeos de una página con «programas» automatizados (rastreadores).
  2. Indexación: Google analiza estos datos y los almacena en Google (que es básicamente una gran base de datos).
  3. Clasificación: Cuando alguien busca algo en Google, este buscador puede encontrarse con estos datos.

¿Qué es arrastrarse?

Google descubre y mantiene una lista de páginas web mediante el «descubrimiento de URL», donde rastrea los enlaces o utiliza sitemaps. Un programa llamado Googlebot rastrea las páginas según un algoritmo, gestionando cuidadosamente la velocidad para evitar sobrecargar los sitios web.

Sin embargo, no se rastrean todas las páginas encontradas; algunas están bloqueadas por el propietario del sitio o requieren iniciar sesión. Durante el rastreo, Google renderiza la página y ejecuta JavaScript para asegurarse de que se muestra todo el contenido relevante.(1)

  1. Googlebot encuentra una página.
  2. Googlebot descarga la página y todo su contenido.
  3. Googlebot pone los enlaces a otras páginas en la cola de rastreo, listos para ser rastreados.

¿Qué es la indexación?

Esta parte se llama indexación y consiste en analizar/comprender el texto, las etiquetas importantes como

y los atributos alt, así como las imágenes y los vídeos.

Durante la indexación, Google mira si una página es un duplicado o la versión «real» de ese contenido. La canónica es la página que se muestra en los resultados de búsqueda. Google agrupa primero las páginas similares y selecciona la más representativa. Otras páginas del grupo pueden mostrarse en situaciones específicas, por ejemplo para usuarios móviles. (2)

El proceso funciona como sigue:

  1. Googlebot forma una imagen a partir del texto, las imágenes, el HTML y el CSS descargados.
  2. Googlebot ejecuta el JavaScript encontrado (se trata de un proceso independiente), éste se convierte en HTML renderizado.
  3. GoogleBot forma una imagen completa de la página.
  4. Googlebot indexa la página (cuando es posible y Google lo desea por sí mismo).

¿Qué son los zarcillos?

Ahora viene la parte más divertida para muchos propietarios de sitios web: la clasificación. Cuando un usuario introduce una consulta de búsqueda, los sistemas de Google buscan páginas coincidentes en el índice y muestran los resultados que consideran de mayor calidad y relevancia para el usuario.

La relevancia viene determinada por cientos de factores, como la ubicación, el idioma y el dispositivo (ordenador o teléfono). Por ejemplo, la búsqueda «panadero» arrojará resultados diferentes para los usuarios de París y Hong Kong.

La página de resultados de búsqueda también cambia en función de la consulta de búsqueda. Si buscas «panadero» es probable que aparezcan resultados locales, mientras que si buscas «cómo ser panadero» es más probable que aparezcan resultados nacionales.(3)

En resumen:

  1. A partir de la sección «procesamiento», Google toma una decisión (sí/no) para indexar una página.
  2. Entonces se indexa y esta página puede clasificarse en el índice.

¿Cómo influyo en el rastreo, la indexación y la clasificación con SEO?

Ahora que sabes lo que implica cada parte del rastreo, la indexación y la clasificación, te mostraré lo que hago dentro de una estrategia SEO para promover estas partes.

¿Qué afecta al rastreo y la indexación por parte de Googlebot?

Así que esto se centra en la facilidad con la que Google puede acceder a todo lo que hay en el sitio web. Algunos de los componentes que afectan a esto:

  • estructura del sitio web con una estructura de silo;
  • enlaces internos a las páginas más importantes;(4)
  • Mapas de sitio XML y HTML;(5)
  • Optimiza robots.txt (asegúrate de que Google puede acceder a todo);(6)
  • optimizar los canónicos;
  • Evita las etiquetas noindex en las páginas importantes;
  • Evita las páginas 4xx y 5xx;
  • Evita las cadenas de redireccionamiento y/o los redireccionamientos innecesarios;
  • Optimiza el sitio web para el presupuesto de rastreo.

¿Cómo influyo en la clasificación?

Esto empieza a parecerse más a un viaje SEO normal, pero las partes que importan aquí son las siguientes:

  • velocidad del sitio web;
  • estructura del sitio web;
  • contenido de calidad (y escrito sobre los temas adecuados);
  • enlaces internos de calidad;
  • buena usabilidad móvil (responsive);
  • una buena experiencia de usuario;
  • gran valor para los visitantes potenciales.

En resumen, todas las cuestiones conocidas son importantes para ello. Para ello, creé la hoja de ruta SEO.

Conclusión

En este artículo expliqué qué significan rastreo, indexación y clasificación y en qué se diferencian. Un «verdadero» especialista en SEO conoce la diferencia… ahora tú también. ¡Buena suerte con la optimización!

Fuentes

  1. Guía detallada sobre el funcionamiento de la Búsqueda de Google | Google Search Central | Documentación | Google para desarrolladores. (s.d.-j). Google para desarrolladores. https://developers.google.com/search/docs/fundamentals/how-search-works#crawling
  2. Guía detallada sobre el funcionamiento de la Búsqueda de Google | Google Search Central | Documentación | Google para desarrolladores. (s.d.-k). Google para desarrolladores. https://developers.google.com/search/docs/fundamentals/how-search-works#indexing
  3. Guía detallada sobre el funcionamiento de la Búsqueda de Google | Google Search Central | Documentación | Google para desarrolladores. (s.d.-l). Google para desarrolladores. https://developers.google.com/search/docs/fundamentals/how-search-works#serving
  4. SEO Link Best Practices for Google | Google Search Central | Documentación | Google para desarrolladores. (s.d.-g). Google para desarrolladores. https://developers.google.com/search/docs/crawling-indexing/links-crawlable#internal-links
  5. Qué es un sitemap | Google Search Central | Documentación | Google para desarrolladores. (s.d.-c). Google para desarrolladores. https://developers.google.com/search/docs/crawling-indexing/sitemaps/overview
  6. Introducción y guía de Robots.txt | Google Search Central | Documentación | Google para desarrolladores. (s.d.). Google para desarrolladores. https://developers.google.com/search/docs/crawling-indexing/robots/intro
Senior SEO-specialist

Ralf van Veen

Senior SEO-specialist
Five stars
Obtengo un 5.0 en Google de 78 reseñas

Llevo 10 años trabajando como especialista independiente en SEO para empresas (en los Países Bajos y en el extranjero) que desean posicionarse mejor en Google de forma sostenible. Durante este tiempo, he asesorado a grandes marcas, he puesto en marcha campañas SEO internacionales a gran escala y he formado a equipos de desarrollo globales en el ámbito de la optimización de motores de búsqueda.

Con esta amplia experiencia dentro del SEO, he desarrollado el curso de SEO y he ayudado a cientos de empresas a mejorar su encontrabilidad en Google de forma sostenible y transparente. Para ello puedes consultar mi Cartera, referencias and colaboraciones.

Este artículo fue publicado originalmente el 15 septiembre 2023. La última actualización de este artículo data del 15 mayo 2024. El contenido de esta página fue escrito y aprobado por Ralf van Veen. Más información sobre la creación de mis artículos en mis directrices editoriales.