Wat is een 404-pagina?
Het duurt ca. 8 minuten om dit blog te lezen. Hierna weet je meer over het optimaliseren van een 404-pagina, wat dit voor effect heeft op SEO en hoe je 404-foutmeldingen opspoort en oplost.
If a tree falls in a forest and no one is around to hear it, does it make a sound?
Een filosofisch gedachte experiment over observatie en perceptie. Uren kunnen we hier over discussiëren en van gedachte over wisselen. Alleen die tijd hebben we niet. Want we zijn allemaal druk. Met onze telefoon als verlengstuk van ons lichaam, zijn we continu online en altijd bereikbaar. Het laatste wat we willen is dat we niet bereikbaar zijn. Dit geldt voor onszelf, onze smartphone maar ook zeker voor onze website. We willen allemaal de beste zijn en we willen allemaal de beste website met de beste ervaring voor onze bezoekers en als het even kan ook nog de hoogste rankings. Maar staan we er ooit bij stil wat er gebeurt als die website even niet bereikbaar is? Wat gebeurt er eigenlijk als iemand onze website probeert te bereiken en we geven niet thuis.
If a tree falls in a forest and no one is around to hear it, does it make a sound?
Gelukkig hebben we systemen die ons waarschuwen als onze website het niet doet. Zo hebben we verschillende mechanismen om op terug te vallen. Een bekend voorbeeld van zo’n mechanisme is de 404-pagina. Dit is de manier om bezoekers te vertellen dat ze op een dood spoor zijn beland en iets niet goed hebben gedaan. Want heel eerlijk, wij hadden toch die beste website? Het is bijzonder om te zien hoe weinig aandacht er eigenlijk wordt besteed aan zo’n belangrijk vangnet.
Om deze reden leek het ons goed om eens dieper in te gaan op the good old 404-pagina. Wat is een 404-pagina nou eigenlijk?
Wat is een 404-pagina?
Als we het hebben over een 404-pagina dan doelen we op een webpagina die aangeeft dat de opgevraagde webpagina niet meer bestaat. De 404-pagina is zo de pagina waarop een gebruiker terechtkomt als deze een niet bestaande pagina probeert te bereiken. Het getal 404 komt voort vanaf de server. Het is een statuscode of foutmelding die de server teruggeeft aan de browser wanneer je op een pagina komt die niet meer bestaat. Omdat deze webpagina er niet meer is, kan de server deze ook niet aan jou serveren via de browser (=chrome, firefox etc.). Het resultaat is een 404-foutmelding en vaak zie je daarom de 404-pagina.
Jouw 404-foutmeldingen vinden
Om een idee te krijgen bij het aantal verwijderde of niet bestaande pagina’s die je op jouw website hebt, en die nog wel toegankelijk zijn voor bezoekers, kun je een crawler gebruiken zoals Screamingfrog of Deepcrawl. Hiermee boots je als het ware Googlebot (=de robot waarmee Google jouw website bezoekt) na. URL’s die nog wel via jouw website bereikbaar zijn, maar niet meer bestaan (=404), worden dan gesorteerd weergegeven onder statuscodes.
Tip: Screaming Frog is gratis te gebruiken tot 500 URL's.
Vaak denkt menig websitehouder dat 404-foutmeldingen niet op zijn of haar website voorkomen. Echter is de realiteit vaak anders. Het ontstaan van 404-foutmeldingen kan vele oorzaken hebben. Wat je in ieder geval moet onthouden is dat elke URL uniek is. Onderstaande URL’s leiden naar verschillende pagina’s:
http://example.com/teSt/
http://example.com/test/
De hoofdletter S zorgt ervoor dat de twee URL’s van elkaar verschillen. Wanneer je dus een pagina live zet, en daarna nog snel wat verandert aan de URL, heb je daarmee ook een nieuwe pagina gemaakt. De pagina waarvan je de URL hebt gewijzigd dien je dan eigenlijk te herleiden (=301 redirect) naar de uiteindelijk URL. Echter gebeurt dit in de praktijk niet. Deze URL’s die niet meer wenselijk zijn kunnen dan gaan zwerven en bijvoorbeeld via een geautomatiseerde sitemap bij een zoekmachine bekend worden. Om begrijpelijke redenen is dit niet handig (bijvoorbeeld omdat je zo een resultaat in de zoekmachine hebt dat leidt naar een 404-pagina). Heb je dan geen geoptimaliseerde 404-pagina… you catch my drift?
Naast een crawler is er nog een tweede manier om erachter te komen welke 404-foutmeldingen aanwezig zijn. En dat is via Google Search Console (=GSC). Hier slaat Google namelijk alle 404-foutmeldingen op die het tegenkomt tijdens een crawl.
Het mooie van GSC is dat het vaak meer ziet dan Screamingfrog of Deepcrawl. Dit komt omdat de crawl van Google veel breder is. Google komt, bijvoorbeeld, via (oude) externe links (=vanaf een andere website) jouw website binnen. Hier kan je denken aan een externe partner die nog verwijst naar een oude actie die nu niet meer bestaat. Al deze URL’s worden door Google mooie gegroepeerd weergegeven, vaak ook met de vindplaats van de foutieve URL erbij.
Omdat sommige foutmeldingen binnen Google Search Console gedateerd kunnen zijn en daarmee niet meer bestaan, is het goed om de foutmeldingen te controleren. Handmatig zou dit een enorme klus kunnen zijn. Er zijn twee opties. De hele batch resetten. Dan begint de lijst weer op 0 en zullen oude foutmeldingen die niet meer bestaan (dus foutmeldingen die opgelost zijn of niet meer vindbaar zijn) niet meer te zien zijn. Echter is dit niet de meest tactische oplossing.
Wat je ook kan doen is alle foutmeldingen downloaden en controleren. Binnen Google Search Console kan je de lijst downloaden. Zie het screenshot hierboven, naast de knop markeren als gecorrigeerd. Daarna kan je deze lijst door Screamingfrog halen. Hiermee zie je direct welke pagina’s nog wel een 404-foutmelding geven en welke al zijn opgelost.
Hoe weet ik hoe mijn 404-pagina eruit ziet?
Je kan vrij eenvoudig checken hoe jouw 404-pagina eruit ziet. Bijvoorbeeld door naar jouw domein te gaan en iets nietszeggends direct achter het domein te typen: https://www.iodigital.com/asdioqwiodjasd
Dat is onze 404-pagina. Herkenbaar niet? De ironie van dit verhaal wil dat onze 404-pagina helemaal niet zo goed is. Want als dit zo’n belangrijk vangnet is, dan is onze 404-pagina met slechts een zoekfunctie, wel wat mager. Als we niet weten wanneer bezoekers op deze pagina terecht komen (..if a tree falls) dan willen we in ieder geval ervoor zorgen dat ze niet weg gaan. Om drop-off (=een bezoeker die de website verlaat) op een website te voorkomen kan het optimaliseren van een 404-pagina enorm zinvol zijn. Zeker e-commerce websites hebben hier baat bij. Daar zien we vaker 404-foutmeldingen ontstaan. Vaak omdat producten out-of-stock gaan, hetgeen kan resulteren in een 404-foutmelding.
Een 404-pagina optimaliseren
Hoe kan je een 404-pagina optimaliseren? Allereerst is het erg belangrijk om het doel van jouw website voor ogen te houden. Heb je een blog en geef je dus voornamelijk informatie dan ziet een 404-pagina er waarschijnlijk anders uit dan wanneer je een webshop hebt. Hieronder een aantal tips om jouw 404-pagina mee te vullen.
Vriendelijk bericht
Probeer in contact te komen met je bezoek. Laat zien dat ook jij wel eens een fout maakt. En als je dit ook nog met een humoristische twist weet te brengen dan snijdt het mes aan twee kanten.
Contact
Bied een mogelijkheid om in contact te komen. Vermeld de belangrijkste gegevens of biedt een link aan richting de contact mogelijkheid.
Belangrijkste pagina’s
Bied links aan richting de belangrijkste pagina’s op jouw website. Bij een webshop kunnen dit bijvoorbeeld de belangrijkste categorieën zijn. Bij een blog kan je denken aan de meest gelezen categorieën. Maar zorg er in ieder geval voor dat iemand verder kan navigeren.
Belangrijkste producten
In het verlengde hiervan kan op een 404-pagina ook aanbod getoond worden. Bijvoorbeeld de best lopende producten of meest gelezen artikelen.
Thema website
Probeer het thema van de website op de 404-pagina terug te laten komen. Hierdoor valt het minder op dat iemand op een 404-pagina terecht is gekomen en zal de respons om weg te klikken minder heftig zijn. Immers wanneer je iets niet verwacht en niet aansluit bij de verwachtingen die je had, dan ben je eerder geneigd om weg te klikken (…vluchten zit in de menselijke natuur).
404 pagina’s en SEO
Is het hebben van 404-foutmeldingen slecht voor jouw organische rankings? Dat hangt er vanaf. Puur vanuit het gedachtegoed van Google is het niet wenselijk om pagina’s te hebben die niet meer bestaan en leiden naar een 404-pagina. Dit omdat Google graag de beste resultaten voorschotelt aan haar gebruikers. Als de top 10 van de SERP (=de resultaten in de zoekmachine) bestaat uit niet bestaande pagina’s dan sluit dit niet aan bij de beste resultaten en daarmee het gedachtegoed van Google. Maar dit houdt niet direct verband met de organische rankings van andere pagina’s op jouw website. Daarnaast is het zo dat Google 404-foutmeldingen niet direct verwijderd uit de index, maar deze af en toe nog bezoekt om te kijken of er al iets veranderd is. Het hebben van 404-foutmeldingen is daarmee wel schadelijk voor het crawlbudget.
Kort gezegd is het crawlbudget het aantal pagina’s dat Google kan crawlen per bezoek. Voor webshops kan dit een probleem zijn. Vaak hebben deze websites heel veel pagina’s met producten. Hierbij wil je graag dat nieuwe producten/content zo snel mogelijk zichtbaar zijn in de zoekmachine. Als Google bij een bezoek dan alleen maar 404-foutmeldingen gaat crawlen, dan is dit zonde. Dat had namelijk niet gehoeven. De reden dat webshops vaak 404-pagina’s hebben heeft te maken met het verwijderen van producten (out of stock). Regelmatig hebben we gezien dat de URL dan niet meer bestaat en er dan een 404-pagina verschijnt. Omwille van het crawlbudget en de indexatie van een website is dit niet wenselijk.
Heb je moeite om de 404-foutmeldingen weg te werken of wil je graag advies over jouw huidige 404-pagina? Onze consultants helpen je graag op weg! Neem hiervoor vrijblijvend contact met ons op.