Sitemap en SEO (2/2)

Sitemap en SEO (2/2)

XML Sitemap Indexatie Optimalisatie
Nu voor het leuke gedeelte. Hoe gebruik je een XML sitemaps om SEO KPI’s aan te sturen.

Neem alleen SEO Relevante
Pagina’s op in XML Sitemaps. Een XML sitemap is een lijst van pagina’s die je aanbeveelt om te crawlen, wat niet noodzakelijkerwijs elke pagina van jouw website is. Een zoekspin komt aan op jouw website met een “budget” voor het aantal pagina’s dat hij zal kruipen. De XML sitemap geeft aan dat je de opgenomen URL’s belangrijker vindt dan de URL’s die niet geblokkeerd zijn maar niet in de sitemap staan.

Je gebruikt het om zoekmachines te vertellen “Ik zou het zeer op prijs stellen als je zich op deze URL’s in het bijzonder zou willen focussen”. In wezen helpt het je om je crawl budget effectief te gebruiken. Door alleen SEO relevante pagina’s op te nemen, help je zoekmachines jouw site slimmer te crawlen om de voordelen van een betere indexatie te plukken.

U dient niet uit te sluiten:
– Niet-canonieke pagina’s.
– Dubbele pagina’s.
– Genummerde pagina’s.
– Parameter of sessie
-ID gebaseerde URL’s.
– Pagina’s met zoekresultaten.
– Reageer op commentaar URL’s.
– Deel via e-mail URL’s.
– URL’s die zijn gemaakt door te filteren die onnodig zijn voor SEO.
– Pagina’s archiveren.
– Eventuele omleidingen (3xx), ontbrekende pagina’s (4xx) of server foutpagina’s (5xx).
– Pagina’s geblokkeerd door robots.txt.
– Pagina’s zonder index.
– Bronpagina’s die toegankelijk zijn via een lead gen formulier (bijv. white paper PDF’s).
– Hulppagina’s die nuttig zijn voor gebruikers, maar niet bedoeld zijn als landingspagina’s (inlogpagina, contacteer ons, privacybeleid, accountpagina’s, etc.).

Ik wil een voorbeeld van Michael Cottam delen over het prioriteren van pagina’s. Stel dat jouw website 1.000 pagina’s telt. 475 van die 1.000 pagina’s zijn SEO-relevante inhoud. je markeert die 475 pagina’s in een XML-sitemap, waarbij je Google in wezen vraagt om de rest van de indexering te deprioriseren.

Laten we zeggen dat Google die 475 pagina’s crawlt, en algoritmisch besluit dat 175 pagina’s “A” zijn, 200 zijn “B+”, en 100 “B” of “B-“. Dat is een sterk gemiddeld cijfer, en wijst waarschijnlijk op een website van hoge kwaliteit waar gebruikers naartoe gestuurd kunnen worden. Zet dat af tegen het indienen van alle 1.000 pagina’s via de XML-sitemap.

Google kijkt nu naar de 1.000 pagina’s die je als SEO-relevante inhoud beschouwt, en ziet dat meer dan 50 procent van de pagina’s “D” of “F” zijn. Jouw gemiddelde cijfer ziet er niet meer zo goed uit en dat kan schadelijk zijn voor jouw organische sessies.

Maar onthoud, Google gaat jouw XML-sitemap alleen gebruiken als een aanwijzing voor wat belangrijk is op jouw site. Het feit dat het niet in jouw XML-sitemap staat, betekent niet noodzakelijkerwijs dat Google die pagina’s niet zal indexeren. Als het gaat om SEO, is de algemene kwaliteit van de site een belangrijke factor.

Om de kwaliteit van jouw site te beoordelen, gaat je naar de sitemap gerelateerde rapportage in Google Search Console (GSC). Beheer crawl budget door XML sitemap URL’s te beperken tot SEO relevante pagina’s en investeer tijd om het aantal pagina’s van lage kwaliteit op jouw website te verminderen.

Volledige benutting van Sitemap
De XML-sitemaps sectie in de nieuwe Google Search Console is niet zo rijk aan gegevens als wat eerder werd aangeboden. Het is nu in de eerste plaats bedoeld om te bevestigen dat jouw sitemap-index met succes is ingediend. Als je ervoor hebt gekozen om beschrijvende naamgevingsconventies te gebruiken in plaats van numerieke, kun je ook een gevoel krijgen voor het aantal verschillende soorten SEO-pagina’s die zijn “ontdekt”, oftewel alle URL’s die Google via sitemaps heeft gevonden, evenals andere methoden zoals het volgen van links.

In de nieuwe GSC, het meer waardevolle gebied voor SEO’s met betrekking tot sitemaps is de Index Coverage rapport. Het rapport laat standaard “Alle bekende pagina’s” staan. Hier kunt je: – Eventuele “Fouten” of “Geldig met waarschuwingen” problemen aangeven. Deze zijn vaak het gevolg van tegenstrijdige robotrichtlijnen. Een tip, zorg ervoor dat je jouw oplossing valideert via het Dekkingsrapport.

Bekijk de indexeringstrends
De meeste sites voegen voortdurend waardevolle inhoud toe, dus “Geldige” pagina’s (oftewel pagina’s die geïndexeerd zijn door Google) moeten gestaag toenemen. Begrijp de oorzaak van drastische veranderingen.

Selecteer “Geldig” en kijk in detail voor het type “Geïndexeerd, niet ingediend in sitemap”. Dit zijn pagina’s waar je en Google het niet eens zijn over de waarde ervan.

Het is bijvoorbeeld mogelijk dat je de URL van jouw privacy beleid niet hebt opgegeven, maar Google de pagina wel heeft geïndexeerd. In dergelijke gevallen hoeven er geen acties te worden ondernomen. Wees op je hoede voor de geïndexeerde URL’s die het gevolg zijn van een slechte pagina-afhandeling, slechte parameterafhandeling, dubbele inhoud of het per ongeluk weglaten van pagina’s uit sitemaps.

Beperk het rapport tot de SEO relevante URL’s die je in jouw sitemap heeft opgenomen door de drop-down te wijzigen in “Alle ingediende pagina’s”. Controleer dan de details van alle “Uitgesloten” pagina’s.

Redenen voor uitsluiting van sitemap URL’s kunnen in vier actiegroepen worden geplaatst:

1. Quick wins: Voor dubbele inhoud, canonieke, robots richtlijnen, 40X HTTP-statuscodes, doorverwijzingen of wettige uitsluitingen, kun je de juiste oplossing vinden.
2. Pagina’s onderzoeken: Voor zowel de “Ingezonden URL verwijderd” als de “Crawl-anomalie” worden uitsluitingen verder onderzocht met behulp van de Fetch als Google-tool.
3. Verbeterde pagina’s: Voor “Crawled, momenteel niet geïndexeerde” pagina’s, bekijk de pagina (of paginatype, omdat het over het algemeen veel URL’s van een vergelijkbaar ras zullen zijn) inhoud en interne links. De kans is groot dat het lijdt aan dunne inhoud, niet-originele inhoud of dat het verwaarloosd is.
4. Verbeter het domein: Voor “Ontdekte, momenteel niet geïndexeerde” pagina’s merkt Google de typische reden voor uitsluiting op, omdat ze “probeerden de URL te crawlen, maar de site was overbelast”.

Laat je niet misleiden. Het is waarschijnlijker dat Google heeft besloten dat het de moeite niet waard is om te crawlen. Dit vanwege de slechte interne links of de lage kwaliteit van de inhoud gezien vanaf het domein. Als je een groter aantal van deze uitsluitingen ziet, bekijk dan de SEO-waarde van de pagina (of paginatypes) die je via sitemaps hebt ingediend, richt je zich op het optimaliseren van het crawl-budget en bekijk jouw informatiearchitectuur, inclusief parameters, zowel vanuit een link- als een inhoudsperspectief.

Wat jouw plan van aanpak ook is, noteer zeker de KPI’s van de referentiepunt. De meest bruikbare metriek om de impact van sitemap optimalisatie inspanningen te beoordelen is de “Alle ingediende pagina’s” indexering, berekend door het percentage geldige pagina’s te nemen op het totaal aantal ontdekte URL’s. Werk eraan om dit boven de 80 procent te krijgen.

Waarom niet tot 100 procent? Omdat als je al jouw energie heeft gericht op het verzekeren dat elke SEO relevante URL die je op dit moment heeft geïndexeerd is, heeft je waarschijnlijk kansen gemist om jouw contentdekking uit te breiden. Opmerking: Als je een grotere website bent die ervoor heeft gekozen om hun site op te splitsen in meerdere sitemap indexen, dan kunt je filteren op deze indexen.

Conclusie
Naast het identificeren van waarschuwingen en fouten, kunt je het Index Coverage-rapport gebruiken als een XML-sitemap- speurwerk hulpmiddel om indexatieproblemen te isoleren. XML sitemap best gebruikte oefen controlelijst Investeer tijd in:

– Comprimeer sitemap bestanden met behulp van gzip
– Gebruik een sitemap-indexbestand
– Gebruik alleen afbeeldingen, video’s en Google-nieuwssitemaps als indexering jouw KPI’s aandrijft.
– Dynamisch XML-sitemaps dynamisch genereren
– Zorg ervoor dat URL’s slechts in één sitemap worden opgenomen
– Referentie sitemap index URL(‘s) in robots.txt
– Dien sitemap index in bij zowel Google Search Console als Bing Webmaster Tools
– Neem alleen SEO relevante pagina’s op in XML sitemaps.
– Alle fouten en waarschuwingen verhelpen
– Analyseer trends en typen geldige pagina’s
– Bereken het indexeringspercentage van de ingediende pagina’s
– Adres oorzaken van uitsluiting voor ingediende pagina’s Controleer nu jouw eigen sitemap en zorg ervoor dat je het goed doet.