Section Indexation de la Search Console de Google : Comment l’utiliser ?

La section Indexation de la Google Search Console est utilisée pour l’indexation (vous l’aurez deviné) de votre site web. Dans cette vue d’ensemble, les organisations peuvent voir la progression de l’indexation d’un site web et les raisons possibles pour lesquelles elle se déroule bien ou mal. Dans cet article, je développerai les fonctionnalités de cette section et la façon dont je l’utilise pour l’optimisation technique des sites web. (1)

La section sur l’indexation a décrit

Sans entrer dans le vif du sujet, voici les données de RalfvanVeen.com dans la section indexation de la Search Console de Google. Dans cet article, j’aborderai les sections que j’utilise le plus souvent moi-même, à savoir les pages, les sitemaps et les suppressions. J’aborderai chaque section plus en détail. (2)

Vue d’ensemble : pages

Contient 2 sections : raisons pour lesquelles les pages ne sont pas indexées et progrès de l’indexation des pages. Il est important de noter que Google est souvent en retard dans l’exploration de ces pages. Moins votre site web dispose d’un budget pour le crawl, plus Google sera à la traîne dans ce domaine.

Il est intéressant de noter que found – currently not indexed et crawled – currently not indexed correspondent selon toute vraisemblance à la file d’attente de Google (interprétation personnelle).

  1. Page redirigée – Ceci indique que l’URL a été redirigée vers une autre URL. Google peut choisir d’indexer l’URL cible au lieu de l’URL redirigée. Il est à noter que cela ne doit pas poser de problème. Il est logique qu’un code de statut 301 ou 302 ne soit pas indexé (après tout, il ne s’agit plus d’une page HTML statique).
  2. Page alternative avec balise canonique correcte – Ceci indique l’existence d’une autre page que Google considère comme la version préférée (canonique). La page non indexée possède une balise « canonique » qui renvoie à la version préférée que Google devrait indexer. Dans la pratique, cela indique souvent certains problèmes.
  3. Non trouvé (404) – Le serveur renvoie un code d’état 404, ce qui signifie que la page est introuvable. Ces pages ne sont pas indexées parce que Google pense qu’elles n’existent pas.
  4. Crawled – not currently indexed – Google a parcouru la page, mais a décidé de ne pas (encore) l’inclure dans l’index. Cela peut être temporaire ou résulter de problèmes de qualité de la page.
  5. Page dupliquée, Google a choisi une page canonique différente de celle de l’utilisateur – Google a identifié que cette page contient du contenu dupliqué et a choisi une autre page comme ressource canonique à indexer. Cela pourrait donc être un problème si cela se produit plus souvent sur le site web.
  6. Exclue par la balise « noindex » – La page contient une instruction « noindex » dans les balises méta ou les en-têtes, indiquant à Google de ne pas indexer cette page.
  7. Bloquée par robots.txt – La page est bloquée par une ligne dans le fichier robots.txt du site, qui indique aux robots d’exploration de ne pas explorer la page.
  8. Bloqué en raison d’un autre problème 4 xx – Il existe une erreur client 4xx autre que 404, qui peut indiquer un problème d’accès à la page, tel que 403 Forbidden ou 410 Gone.
  9. Trouvé – pas encore indexé – Google a trouvé la page, mais ne l’a pas encore indexée pour une raison quelconque. Cela peut être temporaire ou dépendre de certains facteurs tels que la conception du site ou des signaux de qualité de la page.
  10. Erreur de redirection – Il y a un problème dans la façon dont la page est redirigée, peut-être en raison d’une mauvaise configuration du serveur ou d’un problème dans la chaîne de redirection.

Comme vous pouvez le constater, il n’y a pas que des problèmes. Environ la moitié de ces points seront finalement des questions qui pourront être traitées.

À partir de ces données, vous pouvez déjà interpréter une image générale de la progression de l’indexation des pages. Cela me permet souvent de savoir si quelque chose ne va pas sur un site web. Important à savoir : Vous ne parviendrez presque jamais à ramener le nombre de pages non indexées à 0. Ce que dit Google lui-même à ce sujet :

Ces URL ne sont pas indexées par Google. Dans certains cas, cela peut être votre intention, mais dans d’autres, il peut s’agir d’une erreur. Examinez les questions figurant dans le tableau ci-dessous pour déterminer si vous devez modifier ces URL.

En savoir plus sur la Search Console de Google

Section Sitemaps

Dans la section sitemaps, vous pouvez regarder plus spécifiquement les pages, ce qui signifie qu’elles sont toutes dans vos sitemaps XML soumis à Google Search Console.(3)

Il est important de noter qu’il existe deux façons de soumettre un sitemap XML à la Google Search Console :

  1. Robots.txt (vous pouvez mettre un lien dans le Robots.txt vers les sitemaps XML de votre site web).
  2. Google Search Console (via l’image ci-dessus).

Un seul suffit, mais j’aime toujours faire les deux pour être aussi explicite que possible.

Ce qui est intéressant dans la section sitemaps, c’est qu’elle vous permet d’examiner de manière beaucoup plus précise les problèmes éventuels de certaines pages. Lorsque je clique sur un sitemap XML :

Cliquez ensuite sur Afficher l’indexation des pages.

Ici, vous pouvez à nouveau constater les progrès, mais en vous concentrant sur les pages d’un sitemap XML particulier. Ce qui est intéressant, c’est qu’il est désormais possible d’analyser et d’effectuer certaines optimisations de manière beaucoup plus ciblée. Ce faisant, vous ne trouverez pas de pages « parasites », car toutes ces pages figurent dans le sitemap XML.

Par ces pages « parasites », j’entends, par exemple, les URL de paramètres provenant de la navigation à facettes d’une boutique en ligne. Ces éléments sont également repris par GoogleBot et inclus dans la Google Search Console.

Par exemple, si je clique ici sur found – currently not indexed….

Je me retrouve alors avec une liste d’URL qui ne sont pas indexées pour cette raison. Si je clique ensuite sur une page spécifique, j’obtiens l’aperçu ci-dessous.

Grâce à cette vue d’ensemble, je peux voir en détail pourquoi une page particulière n’est pas indexée. Comme on peut le voir, il n’y a pas de page de référence pour cette page particulière, qui n’est donc probablement pas indexée. Dans la même déclaration, je peux demander l’indexation. Cela vous permet d’analyser ces URL au niveau de la page.

Vue d’ensemble : Déménagements

Dans cette vue, comme son nom l’indique, vous pouvez rapidement supprimer du contenu des résultats de recherche.

Trois grandes opportunités.

  • Suppressions temporaires (6 mois) : Il s’agit de supprimer rapidement un élément que vous êtes susceptible de retirer définitivement du site web par la suite.
  • Contenu obsolète : selon Google, cet outil ne fonctionne que si le contenu que vous souhaitez supprimer des résultats de recherche a déjà été retiré d’un site web.
  • Filtrage à l’aide de SafeSearch : ce message affiche tous les contenus qui ont été signalés comme explicites par une utilisation de Google au cours des six derniers mois. Vous pensez que ce n’est pas correct ? Dans ce cas, vous pouvez vous y opposer.(4)

Conclusion

Je suis sûr que ce n’est pas tout ce qui est possible dans cette section de la Google Search Console, mais c’est suffisant pour un premier article sur ce sujet. J’utilise principalement cette section pour l’interprétation de l’ensemble (comment Google l’indexe-t-il) et ensuite pour la plongée éventuelle dans des problèmes spécifiques au niveau de l’URL. Bonne chance pour l’optimisation !

Sources d’information

  1. Comment utiliser la Search Console | Google Search Central | Documentation | Google pour les développeurs. (s.d.-b). Google pour les développeurs. https://developers.google.com/search/docs/monitor-debug/search-console-start
  2. Google Crawling and Indexing | Google Search Central | Documentation | Google pour les développeurs. (s.d.). Google pour les développeurs. https://developers.google.com/search/docs/crawling-indexing
  3. Créer et envoyer un plan du site | Google Search Central | Documentation | Google pour les développeurs. (s.d.-d). Google pour les développeurs. https://developers.google.com/search/docs/crawling-indexing/sitemaps/build-sitemap
  4. Nouveau rapport sur les déménagements dans la Search Console | Google Search Central Blog | Google pour les développeurs. (s.d.). Google pour les développeurs. https://developers.google.com/search/blog/2020/01/new-removals-report-in-search-console
Senior SEO-specialist

Ralf van Veen

Senior SEO-specialist
Five stars
Mon client m'a donné 5.0 sur Google sur 78 avis

Je travaille depuis 12 ans en tant que spécialiste SEO indépendant pour des entreprises (néerlandaises et l'étrangèr) qui souhaitent obtenir un meilleur classement dans Google de manière durable. Au cours de cette période, j'ai conseillé des marques de premier plan, mis en place des campagnes internationales de référencement à grande échelle et coaché des équipes de développement mondiales dans le domaine de l'optimisation des moteurs de recherche.

Grâce à cette vaste expérience dans le domaine de l'optimisation des moteurs de recherche, j'ai développé le cours d'optimisation des moteurs de recherche et j'ai aidé des centaines d'entreprises à améliorer leur visibilité dans Google de manière durable et transparente. Pour cela, vous pouvez consulter mon portfolio, références et mes collaborations.

Cet article a été initialement publié le 3 avril 2024. La dernière mise à jour de cet article date du 3 avril 2024. Le contenu de cette page a été rédigé et approuvé par Ralf van Veen. Pour en savoir plus sur la création de mes articles, consultez mes lignes directrices éditoriales.