Hoe werkt een zoekmachine?

Als je je website wilt gaan optimaliseren voor zoekmachines, dus als je een hogere plaatsing in de zoekresultaten wilt, moet je een beetje weten hoe een zoekmachine in elkaar zit.

Iemand die iets wilt vinden op internet is de klant van een zoekmachine, de zoekmachine wilt deze klant natuurlijk zo tevreden mogelijk houden en zal er alles voor doen om die zoeker de meest relevante zoekresultaten te geven. Stel, jij bent een zoeker, en je zoekt informatie over appels. Maar er zijn twee websites over appels! Welke website zet de zoekmachine dan bovenaan en welke tweede?

We gaan vanaf nu uit van Google, omdat deze zoekmachine het meest geavanceerd is en het meest gebruikt wordt. Google wil jou, de zoeker, de beste resultaten aanbieden, door zelf van te voren te bepalen welke website over appels nu beter is, site A? Of site B? Om dit te kunnen bepalen heeft Google een zogenaamd algoritme. Dit algoritme is één grote berekening met alle factoren die een rol spelen voor de positie van een website in de zoekresultaten. Nu is het belangrijkste van zoekmachine optimalisatie om uit te vogelen wat de factoren van dat algoritme zijn en je website daar aan aan te passen.

Nu is dit wel een beetje veel werk, je moet patenten gaan lezen en onderzoeken doen. Dit hoeft niet, dat hebben anderen al gedaan voor je. Ik zelf heb ook regelmatig onderzoekjes gedaan, maar zelf heb ik ook veel op internet van anderen geleerd die al langer in het vak zaten. Daarom zal ik nu even uitleggen wat de meest belangrijke factoren zijn in Google.

Google is eigenlijk heel logisch, je moet er alleen even opkomen. Neem bijvoorbeeld de offline wereld. Stel, je hebt twee boeken over appels, Boek A heeft 10 pagina's over appels en Boek B heeft 1000 pagina's over appels. Iemand vraagt aan jou informatie over appels, welk boek geef je? Boek B natuurlijk, de kans dat de informatie die de zoeker zoekt in een boek van 1000 pagina's staat is groter dan de kans dat het in een boek van 10 pagina's staat. Dit is ook met websites zo. De website met meer pagina's is zogezegd belangrijker dan een website met weinig pagina's. Maar, dit kan ook verwarrend zijn, je kunt 10 pagina's op je website hebben met ieder 100 woorden, maar je kunt ook 5 pagina's op je website hebben met ieder 1000 woorden. Het gaat dus vooral om de hoeveelheid inhoud van je website. Dit wordt ook wel de hoeveelheid content op je website genoemd.

Nog even hetzelfde voorbeeld van die twee boeken, alleen hebben ze nu allebei evenveel pagina's alleen Boek A komt uit 2006 en Boek B komt uit 1874. Welk boek geef je aan de zoeker? Het meest recente boek natuurlijk! De kans dat daar recente en correcte informatie in staat is groter dan in het oude boek.

Nu even een heel ander voorbeeld, er zijn twee personen, jij hebt een vraag over appels. De twee personen zijn allebei appelboeren. Persoon A zit pas twee weken in het vak en persoon B zit al 50 jaar in het vak. Aan wie stel je je vraag? Aan persoon B, deze heeft de meeste ervaring en waarschijnlijk de meeste kennis. Dit wil in de online wereld zeggen dat oudere websites vaak betrouwbaarder zijn dan nieuwe. Maar is dit niet in tegenspraak met het vorige voorbeeld over de oude boeken? Ja dat klopt, het gaat ook om een combinatie. Als een oude website regelmatig haar content update en nieuwe artikelen toevoegt heeft deze site een voorsprong op nieuwe websites met nieuwe artikelen.

Tegenwoordig speelt autoriteit een heel belangrijke rol in het algoritme van Google. Het voorbeeld van de oude boeken en de oude wijze persoon is deel van de autoriteit. Hoe ouder de website, en hoe meer verse content er regelmatig aan deze oude website toegevoegd wordt, hoe groter de autoriteit van die website wordt.

Maar om hoge autoriteit te krijgen is niet alleen de content en leeftijd van de site van belang. Ook nog een andere heel belangrijke factor. Namelijk de referenties, om het zo maar even te noemen. Ik zal het weer proberen duidelijk te maken met een voorbeeldje.

Een hoogleraar in de wiskunde zegt dat Persoon A veel verstand heeft van wiskunde. Maar een middelbare scholier met wiskunde in zijn pakket zegt dat Persoon B veel verstand heeft van wiskunde. Welke persoon heeft het meest verstand van wiskunde? Omdat de hoogleraar meer autoriteit heeft dan de student zal een zoekmachine zeggen dat Persoon A meer verstand heeft van wiskunde. Dit heeft ook weer met autoriteit te maken, omdat de hoogleraar zegt dat Persoon A veel verstand heeft van wiskunde krijgt Persoon A een beetje autoriteit erbij.

Hoe kun je dit "stem" systeem nu eigenlijk op het internet gaan bepalen? Heel simpel, door links. Als er bijvoorbeeld op CNN.com een link staat die verwijst naar een nieuws website dan geeft die link autoriteit door aan de nieuws website (zonder zelf die autoriteit te verliezen). Hierdoor moet je dus links zien te vinden van websites die een hoge autoriteit hebben, maar links met een lage autoriteit hebben ook invloed, eigenlijk elke link heeft invloed, alleen de ene meer dan de andere. Er zijn wel uitzonderingen, met websites die zich niet aan de richtlijnen van Google houden, maar die geven geen negatieve autoriteit door aan je website.

Daarnaast is relevantie heel belangrijk. Is een autoritaire website relevant qua onderwerp aan jouw website, dan geeft die site ook weer meer waarde door dan als de autoritaire site niet relevant is. Maar ook hier geld weer dat niet-autoritaire websites ook waarde doorgeven, en relevante ook weer meer dan irrelevante.

Zo, dit zijn een paar voorbeelden van factoren die een rol spelen voor de ranking van je website. Het algoritme van Google bestaat waarschijnlijk uit honderden factoren waarbij de ene factor weer zwaarder weegt dan de andere, en het gaat uiteindelijk allemaal om de combinatie van de factoren.

Leuk om te weten
Let wel, dit is allemaal zeer complex. Voor een zoekwoord berekend Google 1000 resultaten, de webpagina's die in de resultaten staan moeten allemaal afzonderlijk bekeken worden, die informatie moet opgeslagen worden, en de berekening van het algoritme mag niet langer dan een fractie van een seconde duren. En dat is alleen voor 1 zoekterm! Kun je nagaan hoeveel mensen dagelijks Google gebruiken en hoeveel zoektermen er tegelijkertijd berekent moeten worden! Daarom heeft Google ook een aantal datacenters, dit zijn er een stuk of honderd. Een datacenter moet je zien als een groot gebouw ongeveer ter grootte van een voetbalveld. In dit gebouw staan de servers waar dit allemaal berekend wordt. Een server heeft de grootte van een pizzadoos. Stel je dus voor een voetbalveld volgestapeld met twee meter hoge rekken pizzadozen (uiteraard nog wel met wandelpaden). En dat honderd keer verspreid over de hele wereld! Dat is dus allemaal nodig om het bedrijf Google draaiende te houden.