Abschnitt Indizierung in der Google Search Console: Wie verwende ich ihn?
Der Indexierungsbereich der Google Search Console wird für die (Sie haben es erraten) Indexierung Ihrer Website verwendet. In dieser Übersicht können Organisationen den Fortschritt der Indizierung einer Website sehen und die möglichen Gründe, warum es gut oder schlecht läuft. In diesem Artikel werde ich auf die Funktionen dieses Bereichs eingehen und erläutern, wie ich diesen Bereich für die technische Optimierung von Websites verwende. (1)
Der Abschnitt über die Indexierung skizziert
Ohne gleich zu sehr ins Detail zu gehen, können Sie hier die Daten von RalfvanVeen.com aus dem Indexierungsbereich der Google Search Console sehen. In diesem Artikel werde ich die Abschnitte besprechen, die ich selbst am häufigsten verwende: Seiten, Sitemaps und Löschungen. Ich werde auf jeden Abschnitt näher eingehen. (2)
Übersicht: Seiten
Enthält 2 Abschnitte: Gründe für die Nichtindizierung von Seiten und Fortschritt der Indizierung von Seiten. Bei diesen Abschnitten ist zu beachten, dass Google diese Seiten oft erst mit Verzögerung crawlt. Je weniger Crawl-Budget Sie als Website haben, desto weiter hinkt Google damit hinterher.
Interessant ist, dass „found – currently not indexed “ und „crawled – currently not indexed “ höchstwahrscheinlich die Crawl-Warteschlange von Google ist (eigene Interpretation).
- Seite umgeleitet – Dies zeigt an, dass die URL auf eine andere URL umgeleitet wurde. Google kann sich dafür entscheiden, die Ziel-URL anstelle der umgeleiteten URL zu indizieren. Dies muss jedoch kein Problem sein. Es ist sinnvoll, dass ein 301- oder 302-Statuscode nicht indiziert wird (schließlich handelt es sich nicht mehr um eine statische HTML-Seite).
- Alternative Seite mit korrektem kanonischen Tag – Dies zeigt die Existenz einer anderen Seite an, die Google als bevorzugte (kanonische) Version betrachtet. Die nicht indizierte Seite hat ein „canonical“-Tag, das auf die bevorzugte Version verweist, die Google indizieren sollte. In der Praxis weist dies häufig auf bestimmte Probleme hin.
- Nicht gefunden (404 ) – Der Server gibt einen 404-Statuscode zurück, was bedeutet, dass die Seite nicht gefunden werden kann. Diese Seiten werden nicht indiziert, weil Google denkt, dass sie nicht existieren.
- Crawled – currently not indexed – Google hat die Seite gecrawlt, aber beschlossen, sie (noch) nicht in den Index aufzunehmen. Dies kann vorübergehend sein oder auf Qualitätsprobleme mit der Seite zurückzuführen sein.
- Doppelte Seite, Google hat eine andere kanonische Seite gewählt als der Nutzer – Google hat festgestellt, dass diese Seite doppelten Inhalt enthält und hat eine andere Seite als kanonische Ressource gewählt, die indiziert werden soll. Dies könnte also ein Problem sein, wenn es auf der Website häufiger vorkommt.
- Ausgeschlossen durch Tag „noindex“ – Die Seite enthält eine „noindex“-Anweisung in den Meta-Tags oder Headern, die Google anweist, diese Seite nicht zu indizieren.
- Blockiert durch robots.txt – Die Seite ist durch eine Zeile in der robots.txt-Datei der Website blockiert, die Crawler anweist, die Seite nicht zu crawlen.
- Blockiert aufgrund eines anderen 4xx-Problems – Es liegt ein anderer 4xx-Client-Fehler als 404 vor, der auf ein Problem beim Zugriff auf die Seite hinweisen kann, z. B. 403 Forbidden oder 410 Gone.
- Gefunden – derzeit nicht indiziert – Google hat die Seite gefunden, aber aus irgendeinem Grund noch nicht indiziert. Dies kann vorübergehend sein oder von bestimmten Faktoren wie dem Design der Website oder Signalen für die Qualität der Seite abhängen.
- Fehler bei der Weiterleitung – Es gibt ein Problem mit der Art und Weise, wie die Seite weitergeleitet wird, möglicherweise aufgrund eines falsch konfigurierten Servers oder eines Problems mit der Weiterleitungskette.
Wie Sie sehen können, sind dies nicht alle Themen. Ungefähr die Hälfte dieser Punkte wird letztendlich ein Problem sein, das gelöst werden kann.
Aus diesen Daten können Sie bereits ein allgemeines Bild des Fortschritts bei der Indizierung der Seiten interpretieren. Daran kann ich oft erkennen, ob mit einer Website etwas nicht stimmt. Wichtig zu wissen: Sie werden die Anzahl der nicht indizierten Seiten hier fast nie auf 0 bekommen. Was Google selbst dazu sagt:
Diese URLs werden von Google nicht indiziert. In einigen Fällen mag dies Ihre Absicht sein, in anderen kann es ein Fehler sein. Schauen Sie sich die Probleme in der folgenden Tabelle an, um festzustellen, ob Sie diese URLs ändern müssen.
Lesen Sie mehr über die Google Search Console
- Der Leistungsbericht der Google Search Console
- Überprüfung der Eigentümerschaft Ihrer Website in der Google Search Console
- Bericht über die Bereitstellung von Funktionalitäten in der Google Search Console
- Der Leitfaden für die Google Search Console bis 2024
- Was ist die Google Search Console?
- Verknüpfung der Google Search Console mit Google Analytics
- Neuen Benutzer hinzufügen Google Search Console
Abschnitt Sitemaps
Im Abschnitt Sitemaps können Sie sich die Seiten genauer ansehen, d. h. sie sind alle in Ihren XML-Sitemaps enthalten, die an die Google Search Console übermittelt wurden.(3)
Wichtig ist, dass es zwei Möglichkeiten gibt, eine XML-Sitemap an die Google Search Console zu übermitteln:
- Robots.txt (Sie können in der Robots.txt einen Link zu den XML-Sitemaps Ihrer Website setzen).
- Google Search Console (über das Bild oben).
Eine reicht aus, aber ich mache sowieso immer gerne beides, um so eindeutig wie möglich zu sein.
Das Interessante an den Sitemaps ist, dass sie es Ihnen ermöglichen, die möglichen Probleme bestimmter Seiten viel genauer zu untersuchen. Wenn ich mich zu einer XML-Sitemap durchklicke:
Klicken Sie dann auf Seitenindizierung anzeigen.
Hier können Sie den Fortschritt wieder sehen, aber sehr konzentriert auf die Seiten einer bestimmten XML-Sitemap. Das Interessante daran ist, dass man jetzt viel gezielter analysieren und bestimmte Optimierungen vornehmen kann. Dabei werden Sie hier keine „Rauschseiten“ finden, da alle diese Seiten in der XML-Sitemap enthalten sind.
Mit diesen „Rauschseiten“ meine ich zum Beispiel Parameter-URLs, die aus der Facettennavigation eines Webshops stammen. Diese werden auch alle von GoogleBot erfasst und in die Google Search Console aufgenommen.
Wenn ich zum Beispiel hier auf found – currently not indexed…. klicke
Dann erhalte ich eine Liste von URLs, die aus diesem Grund nicht indiziert sind. Wenn ich dann auf eine bestimmte Seite klicke, erhalte ich die unten stehende Übersicht.
Mit dieser Übersicht kann ich im Detail sehen, warum eine bestimmte Seite nicht indiziert ist. Wie man sieht, gibt es keine verweisende Seite zu dieser Seite, so dass sie wahrscheinlich nicht indiziert ist. In der gleichen Erklärung kann ich die Indexierung beantragen. So können Sie diese URLs auf Seitenebene analysieren.
Überblick: Umzüge
In dieser Ansicht können Sie, wie der Name schon sagt, Inhalte schnell aus den Suchergebnissen entfernen.
Drei großartige Möglichkeiten.
- Vorübergehende Löschungen (6 Monate): Dies ist der Fall, wenn Sie etwas schnell entfernen möchten, das Sie danach wahrscheinlich dauerhaft von der Website entfernen werden.
- Veralteter Inhalt: Laut Google funktioniert dieses Tool nur, wenn der Inhalt, den Sie aus den Suchergebnissen entfernen möchten, bereits von einer Website entfernt wurde.
- Filterung mit SafeSearch: Hier werden alle Inhalte angezeigt, die in den letzten sechs Monaten durch eine Verwendung in Google als explizit gekennzeichnet wurden. Sind Sie der Meinung, dass dies nicht korrekt ist? Dann können Sie widersprechen.(4)
Schlussfolgerung
Ich bin mir sicher, dass dies noch nicht einmal alles ist, was in diesem Bereich der Google Search Console möglich ist, aber es reicht für einen ersten Artikel zu diesem Thema. Ich verwende diesen Abschnitt hauptsächlich für die Interpretation des Ganzen (wie wird es von Google indiziert) und dann für das mögliche Eintauchen in spezifische Probleme auf URL-Ebene. Viel Erfolg bei der Optimierung!
- So verwenden Sie die Search Console | Google Search Central | Dokumentation | Google für Entwickler. (s.d.-b). Google für Entwickler. https://developers.google.com/search/docs/monitor-debug/search-console-start
- Google Crawling und Indexierung | Google Search Central | Dokumentation | Google für Entwickler. (s.d.). Google für Entwickler. https://developers.google.com/search/docs/crawling-indexing
- Erstellen und Einreichen einer Sitemap | Google Search Central | Dokumentation | Google für Entwickler. (s.d.-d). Google für Entwickler. https://developers.google.com/search/docs/crawling-indexing/sitemaps/build-sitemap
- Neuer Bericht über Umzüge in Search Console | Google Search Central Blog | Google für Entwickler. (s.d.). Google für Entwickler. https://developers.google.com/search/blog/2020/01/new-removals-report-in-search-console