Sección de indexación de Google Search Console: ¿Cómo se utiliza?

La sección de indexación de Google Search Console se utiliza para la indexación (lo has adivinado) de tu sitio web. En esta vista general, las organizaciones pueden ver el progreso de la indexación de un sitio web y las posibles razones por las que va o no va bien. En este artículo, explicaré con más detalle las funciones de esta sección y cómo la utilizo para la optimización técnica de sitios web. (1)
La sección de indexación
Sin entrar en detalles de inmediato, aquí puedes ver los datos de RalfvanVeen.com de la sección de indexación de Google Search Console. En este artículo, hablaré de las secciones que yo mismo utilizo con más frecuencia: páginas, mapas del sitio y eliminaciones. Trataré cada sección con más detalle. (2)
Resumen: páginas
Contiene 2 secciones: razones para no indexar páginas y progreso de la indexación de páginas. Es importante tener en cuenta que Google suele rastrear estas páginas con retraso. Cuanto menos presupuesto de rastreo tenga un sitio web, más se retrasará Google con esto.
Lo que es interesante observar es que encontrado – actualmente no indexado y rastreado – actualmente no indexado es con toda probabilidad la cola de rastreo de Google (interpretación propia de esto).

- Página redirigida – Indica que la URL ha sido redirigida a otra URL. Google puede optar por indexar la URL de destino en lugar de la URL redirigida. Tenga en cuenta que esto no tiene por qué ser un problema. Es lógico que un código de estado 301 o 302 no se indexe (después de todo, ya no es una página HTML estática).
- Página alternativa con etiqueta canónica correcta: indica la existencia de otra página que Google considera la versión preferida (canónica). La página no indexada tiene una etiqueta «canonical» que hace referencia a la versión preferida que Google debería indexar. En la práctica, esto suele indicar ciertos problemas.
- No encontrado (404) – El servidor devuelve un código de estado 404, lo que significa que no se puede encontrar la página. Estas páginas no se indexan porque Google piensa que no existen.
- Rastreada – no indexada actualmente – Google ha rastreado la página, pero ha decidido no incluirla en el índice (todavía). Esto puede ser temporal o el resultado de problemas de calidad con la página.
- Página duplicada, Google ha elegido una página canónica diferente a la del usuario: Google ha identificado que esta página contiene contenido duplicado y ha elegido otra página como el recurso canónico que se indexará. Así que esto podría ser un problema si ocurre más a menudo en el sitio web.
- Excluida por la etiqueta «noindex»: la página contiene una instrucción «noindex» en las metaetiquetas o en los encabezados, que indica a Google que no indexe esta página.
- Bloqueada por robots.txt – La página está bloqueada por una línea en el archivo robots.txt del sitio, que indica a los rastreadores que no rastreen la página.
- Bloqueado debido a otro problema 4xx – Hay un error de cliente 4xx distinto de un 404, que puede indicar un problema de acceso a la página, como un 403 Forbidden o un 410 Gone.
- Encontrada – no indexada actualmente – Google ha encontrado la página, pero por alguna razón aún no la ha indexado. Esto puede ser temporal o depender de determinados factores, como el diseño del sitio o las señales de calidad de la página.
- Error con la redirección – Hay un problema con la forma en que la página redirige, posiblemente debido a un servidor mal configurado o a un problema con la cadena de redirección.
Como puede ver, estos no son todos los problemas. Alrededor de la mitad de estos puntos acabarán siendo problemas que se podrán resolver.

A partir de estos datos, ya se puede interpretar una imagen general del progreso de indexación de las páginas. A partir de esto, a menudo puedo decir si hay algo mal en un sitio web. Es importante saberlo: Aquí casi nunca conseguirás que el número de páginas no indexadas sea 0. Lo que dice el propio Google al respecto:
Google no indexa estas URL. En algunos casos, ésta puede ser su intención, pero en otros puede ser un error. Consulte los problemas en la tabla siguiente para determinar si necesita cambiar estas URL.
Más información sobre Google Search Console
- Informe de rendimiento de Google Search Console
- Verificación de la propiedad del sitio en Google Search Console
- Despliegue del informe de funcionalidades en Google Search Console
- La guía de Google Search Console para 2024
- ¿Qué es Google Search Console?
- Vinculación de Google Search Console con Google Analytics
- Añadir nuevo usuario Google Search Console
Sección Sitemaps
En la sección de sitemaps, puede ver más específicamente las páginas, lo que significa que están todas en sus sitemaps XML enviados a Google Search Console.(3)

Es importante tener en cuenta que existen dos formas de enviar un mapa del sitio XML a Google Search Console:
- Robots.txt (puede poner un enlace en el Robots.txt a los sitemaps XML de su sitio web).
- Google Search Console (a través de la imagen superior).
Con uno es suficiente, pero de todas formas siempre me gusta hacer los dos para ser lo más explícito posible en esto.
Lo interesante de la sección de sitemaps es que permite examinar de forma mucho más específica los posibles problemas de determinadas páginas. Cuando hago clic a través de un mapa del sitio XML:

A continuación, haga clic en ver indexación de páginas.

Aquí puedes ver el progreso de nuevo, pero muy centrado en las páginas de un mapa del sitio XML en particular. Lo que lo hace tan interesante es que ahora puede analizar y realizar determinadas optimizaciones de forma mucho más específica. Al hacerlo, no encontrará aquí ninguna página «ruidosa» porque todas estas páginas están en el mapa del sitio XML.
Con estas páginas «ruidosas» me refiero, por ejemplo, a las URL de parámetros procedentes de la navegación por facetas de una tienda virtual. GoogleBot también los recoge y los incluye en Google Search Console.
Por ejemplo, si hago clic aquí en encontrado – actualmente no indexado….

Entonces termino con una lista de URLs que no están indexadas por esta razón. Si luego pincho en una página concreta, me encuentro con el resumen que aparece a continuación.

Con esta visión de conjunto, puedo ver en detalle por qué una página en particular no está indexada. Como puede verse, no hay ninguna página de referencia a esta página en particular, por lo que probablemente no esté indexada. En la misma declaración, puedo solicitar la indexación. Esto le permite analizar estas URL a nivel de página.
Panorama general: Mudanzas
En esta vista, como su nombre indica, puede eliminar rápidamente contenidos de los resultados de búsqueda.

Tres grandes oportunidades.
- Supresiones temporales (6 meses): Esto es si desea eliminar rápidamente algo que es probable que elimine permanentemente del sitio web después.
- Contenido obsoleto: según Google, esta herramienta sólo funciona si el contenido que se desea eliminar de los resultados de búsqueda ya se ha eliminado de un sitio web.
- Filtrado con SafeSearch: Esto muestra todo el contenido que ha sido marcado como explícito por un uso en Google en los últimos seis meses. ¿Crees que esto es incorrecto? Entonces puedes oponerte.(4)
Conclusión
Estoy seguro de que esto ni siquiera es todo lo que se puede hacer en esta sección de Google Search Console, pero suficiente para un primer artículo sobre esto. Utilizo principalmente esta sección para la interpretación del conjunto (cómo lo indexa Google) y luego la posible inmersión en problemas específicos a nivel de URL. Buena suerte con la optimización.
- Cómo utilizar Search Console | Google Search Central | Documentación | Google para desarrolladores. (s.d.-b). Google para desarrolladores. https://developers.google.com/search/docs/monitor-debug/search-console-start
- Rastreo e indexación de Google | Google Search Central | Documentación | Google para desarrolladores. (s.d.). Google para desarrolladores. https://developers.google.com/search/docs/crawling-indexing
- Creación y envío de un sitemap | Google Search Central | Documentación | Google para desarrolladores. (s.d.-d). Google para desarrolladores. https://developers.google.com/search/docs/crawling-indexing/sitemaps/build-sitemap
- Nuevo informe de eliminaciones en Search Console | Blog de Google Search Central | Google para desarrolladores. (s.d.). Google para desarrolladores. https://developers.google.com/search/blog/2020/01/new-removals-report-in-search-console