Begin 2020 schreef ik mijn scriptie over zoekmachine optimalisatie ranking factoren. Een van de onderdelen van deze scriptie was uitleg over de werking van een zoekmachine. Hoe werkt indexering, hoe werken zoekwoorden en hoe werkt de SERP? Al deze onderwerpen werden kort en bondig uitgelegd. In dit artikel vind je de uitkomsten van dit onderzoek en laat ik je precies zien hoe een zoekmachine werkt.
Inhoudsopgave
Introductie
Zoekmachine optimalisatie kan op verschillende manieren gedaan worden. Er is weinig wetenschappelijke literatuur beschikbaar die nog relevant is. Zoekmachines veranderen constant en met ieder update van het algoritme wordt eerder geschreven literatuur minder relevant. Er worden jaarlijks honderden kleine updates aan het algoritme doorgevoerd. Meestal worden er tussen de 5 en 10 grote updates per jaar gedaan die de zoekresultaten meetbaar beïnvloeden (Google Algorithm Update History, 2019). De grotere updates aan het algoritme worden core algorithm updates genoemd. (Sullivan, 2019)
Ondernemers die een eigen site onderhouden hoeven zich niet druk te maken om deze updates. De updates zijn allemaal gemaakt met een doel: Het verzorgen van de beste resultaten voor een bepaalde zoekopdracht. Een ondernemer die zich richt op zo goed mogelijk de gebruiker van dienst zijn zal dus weinig hinder ondervinden van de updates. Wel is het belangrijk voor de ondernemer om te weten hoe hij een site maakt die zo relevant mogelijk is, hier zijn verschillende theorieën en modellen over te vinden. Ook is het begrijpen van het algoritme belangrijk zodat een site zo gemaakt kan worden dat deze door een zoekmachine goed in de index gezet kan worden.
“If a core algorithm update can wipe out your performance, you were *always* doing it wrong / not good enough. You were just getting away with it.” (Alderson, 2019, pp. 1–3)
Indexering in een zoekmachine
Als we willen weten hoe een website geoptimaliseerd kan worden voor google is het handig om eerst te weten hoe Google werkt.
Wanneer een gebruiker zoekt naar informatie op het web wordt er niet op internet gezocht maar wordt er gezocht binnen de index van Google (Google, z.d.). Deze index wordt gemaakt met software programma’s die spiders genoemd worden. Een spider begint op een website bij enkele pagina’s en kijkt op die pagina’s wat er voor informatie te vinden is. Deze informatie wordt opgeslagen in de index van google. Vervolgens kijkt de spider naar de links die op de pagina’s aanwezig zijn. De spider gaat door naar de pagina’s waarnaar verwezen wordt, indexeert die weer en gaat verder met de links die op die pagina’s staan. De spider wordt geholpen door sitemaps (Google, z.d.) die door websitebeheerders op websites gezet worden. In een sitemap staat welke pagina’s er op welke plek aanwezig zijn. De sitemap helpt de spider om efficiënt door een website te crawlen.
De index die hieruit komt bevat miljoenen pagina’s. Deze index is de basis van een zoekopdracht.
Zoekopdrachten in een zoekmachine
Wanneer een gebruiker de zoekopdracht in google intypt wordt gekeken naar de woorden die ingetypt worden, in de index wordt gekeken naar welke pagina’s de woorden die ingetypt worden bevatten (Shehata, S., Karray, F., & Kamel, M. S. 2016). Het kan voorkomen dat een zoekvraag duizenden pagina’s oplevert waar het woord aanwezig is. De zoekmachine zal dan een overzicht moeten geven van de meest relevante pagina’s. Dit doet de zoekmachine door de pagina’s te toetsen aan de hand van het algoritme. Het algoritme zijn enkele vragen die beantwoord worden zoals:
- Hoeveel keer komt het woord voor op de pagina
- Komt het woord voor in de titel
- komt het woord voor in de url
- worden er synoniemen van het woord gebruikt
- komt de pagina van een betrouwbare bron (domein)
- wat is de pagerank van de pagina
Die laatste factor, de pagerank wordt bepaald door te kijken naar hoeveel websites er naar de pagina linken en hoe belangrijk die websites zijn (Avrachenkov, K., & Litvak, N., 2006). Naast deze voorbeeld factoren zijn er nog veel meer factoren die meegenomen worden. Google geeft aan dat er in totaal meer dan 200 factoren zijn waar naar gekeken wordt (Luh, C. J., Yang, S. A., & Huang, T. L. D., 2016) . Niet iedere factor heeft dezelfde weging dus bij zoekmachine optimalisatie is het raadzaam om op de factoren met de zwaarste weging te nadruk te leggen.
De ranking factoren worden toegepast op de websites die de initiële vragen beantwoorden en vervolgens wordt bekeken welke pagina waarschijnlijk het beste bij de zoekvraag past.
Weergeven van de zoekresultaten
De resultaten van de zoekopdrachten worden in de SERP weergegeven. Dit is het overzicht van pagina’s die relevant zijn voor de zoekvraag. Iedere pagina in de zoekresultaten bevat de titel, url en een samenvatting of snippet van de tekst. Dit zorgt er voor dat de gebruiker kan bepalen of een bepaald resultaat relevant is voor hem of haar. Onderaan de zoekresultaten zijn zoekvragen te vinden die mogelijk relevant zijn voor de gebruiker als volgende zoekvraag. Soms worden er in de zoekresultaten ook advertenties weergegeven. Die staan altijd boven de organische zoekresultaten. Extra functies die recent toegevoegd zijn zijn:
- Video’s
- Relevante afbeeldingen
- Featured snippet (een box die direct een antwoord geeft)
- Sectie met vragen die ook gesteld werden
Het zoekalgoritme heeft nog een extra functie, het begrijpen van de zoekvraag. Veel woorden hebben een dubbele betekenis. Het is voor Google belangrijk om deze dubbele betekenissen te begrijpen omdat anders niet relevante zoekwoorden op basis van een verkeerde betekenis getoond kunnen worden.
Een voorbeeld hiervan is het woord “laat”. In het voorbeeld dat google in de uitleg over algoritmes geeft gaat het om de zoekvragen:
- Hoe laat is het in tokio?
- Laat de zon in je hart
- Waar laat ik mijn oude fiets?
Zoals te zien is wordt het woord met verschillende betekenissen gebruikt. Een tijdsindicatie bij de zoekvraag hoe laat het op een specifieke plek is, een zoekvraag waar het woord onderdeel is van songtekst en een zoekvraag waar het woord beter weggelaten kan worden omdat het geen keyword is.
Wanneer dit deel van de zoekopdracht opgelost is wordt de zoekopdracht pas vergeleken met de pagina’s die in de index staan, zo worden alleen de relevante pagina’s meegenomen in dit proces. De zoekwoorden die overblijven nadat de intentie is bepaald vormen de basis van het zoeken in de index. Dit wordt gedaan op basis van de ranking factoren van het algoritme die eerder besproken zijn. De eerste factoren waar naar gekeken wordt zijn de woorden die op de pagina staan. Daarna wordt gekeken naar interactiegegevens. (Hatch, 2018) Deze data is de historische data van zoekers. Wanneer eerder is gebleken dat personen een pagina voorgeschoteld kregen die zij snel weer verlieten zal de pagina bij de volgende zoekopdracht minder snel getoond worden. Deze data helpt mee de relevantie in te schatten op basis van gebruikersgegevens en interactie met pagina’s. Het algoritme kijkt ook naar waar de gebruiker naar op zoek is. Een zoekopdracht die duidelijk informatie gerelateerd is zal lange artikelen laten zien. Een zoekopdracht waaruit blijkt dat een andere vorm van informatie zoals een video of afbeeldingen een betere match is zal dus ook andere resultaten opleveren.
Tot slot wordt gekeken naar de taal van de zoekopdracht en wordt voorrang gegeven naar informatie die in dezelfde taal beschikbaar is.
Als duidelijk is welke pagina’s er voldoen aan de zoekopdracht is het zaak om deze pagina’s te rangschikken. Op basis van honderden factoren wordt gekeken welke pagina het meest relevant is. Er wordt gekeken naar hoe oud de content is (Soulo, 2019), het aantal keren dat de zoekvraag voorkomt in de tekst maar ook of de pagina door gebruikers goed gebruikt kan worden, bijvoorbeeld door te kijken naar de bounce rate of pogosticking. Tot slot worden alle pagina’s die misleidend te werk gaan door een keyword te vaak te noemen, page rank te kopen of duidelijk spam bevatten uit de zoekresultaten gefilterd.
Wanneer een gebruiker vervolgens op een van de zoekresultaten klikt wordt de interactie van de gebruiker gemeten. Deze informatie wordt meegenomen als onderdeel van het algoritme. De gebruikersdata vertelt google of de pagina die zij aanbevolen heeft relevant was voor de gebruiker.
Hoe werken zoektermen
Een zoekterm wordt ook wel een search query genoemd. Het refereert aan de input die gebruikers geven aan de zoekmachine om tot bepaalde informatie te komen. Een zoekterm bevat veelal een woord dat beschrijft waar de zoeker naar op zoek is in combinatie met een woord dat aangeeft wat de zoekintentie is. Enkele voorbeelden zijn:
- Schoenen kopen
- Hoe oud is donald trump?
- Hoe werkt een zoekmachine?
Een ieder van deze vragen die in de zoekmachine gesteld worden kunnen op verschillende manieren gesteld worden. Wanneer we kijken naar de zoekterm “hoe oud is donald trump” dan wordt dit duidelijk. Zoekvragen als “leeftijd donald trump”, “trump leeftijd” of “Donald turmp hoe oud?” zijn gelijk aan elkaar. De informatiebehoefte is hetzelfde. De zoekmachine zal dus deze zoekvragen clusteren en de zoekresultaten zullen vergelijkbaar zijn.
Toch zit er in een dergelijk voorbeeld een verschil in pagina’s die omhoog komen. Pagina’s die de zoekwoorden “hoe oud” bevatten scoren beter op vragen die precies die woorden gebruiken. Pagina’s die het woord “leeftijd” bevatten scoren beter op de zoekvraag waar het woord leeftijd in verwerkt zit.
Precies om die reden wordt er door veel online marketeers gekeken naar zoekvolumes bij zoekwoorden. Dit wordt Keyword Research genoemd. Keyword research is het vinden van zoekwoorden waar voldoende zoekvolume op zit en waar weinig concurrentie is.
In het verleden werd keyword research erg misbruikt. Een schilder die goed wilde scoren schreef teksten over schilder, schilders, kosten schilder, schilder prijs en zo voort. Iedere variant van een zoekwoord kreeg zijn eigen tekst waar dat woord vervolgens erg vaak in voor kwam. Dit werd door Google gezien en er werden verschillende algoritme updates uitgerold om dit tegen te gaan. In februari 2011 werd de panda update uitgerold, opgevolgd door de hummingbird update in augustus 2013. Deze updates zorgden ervoor dat zoekwoord varianten geclusterd werden. Ook zorgt de update er voor dat pagina’s die puur geschreven waren om het algoritme te foppen niet meer boven kwamen.
Keyword research is nog steeds nuttig. Het is bij het maken van een pagina handig om te weten hoeveel verkeer de pagina in theorie binnen kan halen voor een site eigenaar. De exacte data wordt echter door google niet gegeven. De hoeveelheid verkeer die met een zoekwoord binnen gehaald kan worden is dus wel in te schatten maar niet exact vast te stellen.
Naast keyword research wordt veel gekeken naar het tweede deel van een hoop zoekopdrachten. De zoekintentie. Er zijn drie zoekintenties te onderscheiden:
- Informationele zoekopdrachten: de gebruiker is naar specifieke informatie op zoek. Dit kan een review, kennis of vergelijking zijn. Vaak beginnen informationele zoekopdrachten met wie, wat, waar, waarom, hoe of wanneer.
- navigationele zoekopdrachten: Zoekopdrachten waar de zoeker op zoek is naar een specifieke site of pagina worden navigationele zoekopdrachten genoemd. Een voorbeeld kan zijn: Facebook.
- transactionele zoekopdrachten: Wanneer er een koopintentie is spreken we van transactionele zoekopdrachten. Voorbeelden zijn: Schoenen kopen, auto huren of goedkope vliegtickets. Ook zoekopdrachten waar geen directe koopintentie is worden onder transactionele zoekopdrachten gecategoriseerd. Zoekvragen bevatten in dit geval bijvoorbeeld de woorden: Review of vergelijken.
De zoekintentie geeft aan naar wat voor type pagina een gebruiker op zoek is. Een pagina met informatie is niet waardevol voor een gebruiker die simpelweg iets wil kopen. Zo is ook een verkoop pagina voor iemand die naar informatie op zoek is hinderlijk. Bij het maken van een pagina is het dus belangrijk om een combinatie van een zoekwoord en een zoekintentie te begrijpen. (White, R. W., Richardson, M., & Yih, W. T. 2015, May).