Google, please don't be evil

Terwijl jullie dit lezen weet Google allang dat ik dit geschreven heb. Sterker nog, ze wisten het al toen ik het aan het schrijven was. Want ik schrijf deze tekst in Google Docs. Lekker makkelijk, het is overal bereikbaar, en aangezien mijn M$ Word versie verlopen is, is zo'n gratis toegankelijke teksteditor wel handig. Ik zal het toegeven, ik gebruik Google's diensten dagelijks, ze zijn retehandig en gratis. Iets wat mij als Nederlander zeer aanstaat. Maar kan dit tegen mij gebruikt worden? Wat weet Google over mij, en welke gegevens heeft Google en waar worden ze voor gebruikt? Dat ga ik in dit document uitgebreid aankaarten.

Allereerst wil ik hier geen mening verspreiden. Ik ben zelf van mening dat Google geen kwaad in de zin heeft, die mening baseer ik op niets, ik heb namelijk geen reden om dit te geloven, ik wil het alleen graag geloven. Ik ben niet iemand die complottheoriën aanhangt en verspreidt. Daarom zal ik niet een kant van het verhaal, maar twee kanten vertellen. Allereerst zal ik ingaan op wat Google over mij als persoon weet.

Wat weet Google over mij?
Allereerst zal ik jullie uitleggen wat Google allemaal over mij weet, en wat jullie zelf ook kunnen achterhalen. Namelijk met simpele Google Search. Ik ben zelf actief op internet op gebruikers gebied maar ook op webmaster en marketing gebied. Er zal dus waarschijnlijk veel over mij te vinden zijn.
Jullie weten nu nog helemaal niets over mij. Alleen dat ik dit artikel geschreven heb en op deze site gepubliceerd heb. Jullie weten dus dat deze site van mij is. Als jullie mijn naam, adres en woonplaats willen weten kun je simpelweg naar www.sidn.nl gaan en dit domein invullen. Je krijgt al deze informatie gratis en voor niks. Dit is mogelijk voor elk .nl domein.
Goed, via die site weten jullie mijn naam. W van der Meij. Ik zal jullie een weggevertje geven: mijn voornaam is Wouter. Nu zijn we klaar om erachter te komen wat Google over mij weet.

Ga gewoon naar Google en vul mijn naam in in het zoekveld, vergeet er geen dubbele quotes omheen te zetten om te zoeken naar een exacte woordcombinatie. Je ziet resultaten: een account op tbforum.nl, een account op netters.nl, posts in Google Groups, enz. Wat heb je aan deze informatie? Ten eerste kun je erachter komen wat mijn interesses zijn (tbforum.nl netters.nl en de posts in Google Groups zijn allemaal webmaster en internet marketing gerelateerd). Ook weet je mijn gebruikersnaam van tbforum.nl. Deze kun je op hun beurt weer Googlen. Op deze manier kom je nog meer te weten waar ik allemaal berichten achter laat in forums en weblogs onder die gebruikersnaam. Wat is hier erg aan? Helemaal niets! Althans dat vind ik, ik heb namelijk niets te verbergen. Maar stel dat ik vaak post op forums waar ik vragen stel over goede viagra pillen, of waar ik vragen stel over de juiste uitvoer van satanistische rituelen. Misschien staat er wel ergens een online krantenbericht waarin staat dat ik in mijn jonge jaren een oud vrouwtje op straat heb berooft en in elkaar heb geslagen. Dan kan ik mij heel goed voorstellen dat je niet wil dat de hele wereld dit te weten komt nietwaar? Iedereen heeft immers beschikking tot Google, dus iedereen kan zoiets te weten komen! Maargoed, ik geef even mezelf als voorbeeld omdat ik het niet erg vind als jullie erachter komen dat ik interesse heb in dingen als zoekmachine optimalisatie en handbal bijvoorbeeld, I'm innocent :-).

Wat je kortom dus kunt weten over een persoon is wat er over die persoon geschreven is op internet en wat die persoon zelf heeft achter gelaten op internet. Neem dit trouwens niet te letterlijk! Als jullie een beetje goed gezocht hebben, hebben jullie namelijk allang kunnen ontdekken dat ik het record chocolademelk drinken op mijn naam heb staan. In de letterlijke zin is dat wel zo, maar niet in de figuurlijke zin. Er loopt namelijk nog een Wouter van der Meij rond op dit aardbolletje. Het record chocolademelk drinken staat dus wel op mijn naam (waar ik overigens best wel trots op ben), maar niet op mij persoonlijk.

Dit is dus eigenlijk al een voorbeeld dat informatie verkeerd begrepen kan worden. Stel dat die andere Wouter nou een oud vrouwtje in elkaar heeft geslagen, en dat staat op internet. Als bijvoorbeeld een werkgever mijn naam Googled, krijgt deze een verkeerde opvatting van mijn verleden. En geloof mij, er wordt veel gegoogled bij bedrijven voorafgaande sollicitaties, en geef ze eens ongelijk!

Dit is dus de informatie die Google aan iedereen in de wereld beschikbaar stelt. Dit doen ze natuurlijk niet expres. Google is een software programma, en kan dus niet ontdekken of bijvoorbeeld het woord appel een naam van iemand is of een object. Google heeft dus nooit bewust persoonlijke informatie over mij beschikbaar gesteld aan anderen.

Laten we nu verder gaan naar wat Google allemaal over mij weet en wat het niet beschikbaar stelt aan de wereld. Dat is namelijk een stuk schokkender.

Google weet namelijk het volgende:
- Mijn bankrekening nummer
- Mijn persoonlijke email
- Enkele van mijn documenten (deze bijvoorbeeld)
- Welke websites ik beheer
- Hoeveel bezoek ik krijg op deze websites
- Waar dat bezoek vandaan komt
- Een indicatie van hoeveel ik verdien met die websites
- Wat mijn interesses zijn
- Welke pagina's ik bezoek op internet
- Dat jij op dit moment deze pagina aan het lezen bent
- En vast nog wel meer...

Veel van bovenstaande weet Google niet over de doorsnee internetter, daarom ga ik eerst uitleggen waarom ze het wel over mij weten. Maar wat ze wel over de doorsnee internetter weten is meer dan je denkt.

Ik zal eerst even toelichten dat ik lid ben bij Google Adwords en Google Adsense. Google Adwords is het adverteren in Google en in het Adsense netwerk. Google weet daarom dus wat ik uitgeef aan advertentiegeld, en wat mijn bankrekening nummer is. Ik maak immers geld naar hun over.

Ze weten mijn persoonlijke email. De email account die ik het meest gebruik is namelijk een Gmail account. Dit is de emaildienst van Google. Volledig gratis en een grote opslagcapaciteit. Het lijkt mij logisch dat ze dan mijn email weten, het staat tenslotte bij hun op de servers.

Ze weten enkele van mijn documenten, namelijk deze. Ik heb dit document in Google Docs geschreven, een gratis online teksteditor. Het mooie van deze applicatie is dat ik overal met een internet verbinding vanaf elke computer mijn documenten kan opvragen en kan aanpassen. Ook kan ik deze documenten delen met anderen. Wat weten ze in mijn geval? Globale plannen voor het opzetten van websites, informatie over indianen, informatie over Nederlandse literatuur en zo zijn er nog wel meer onschuldige dingen te vinden.

Ze weten welke websites ik beheer, ik maak namelijk ook gebruik van Google Analytics. Dit is statistieken software van Google. Deze software kan ik (weer gratis) gebruiken op mijn websites om zo te kunnen zien welke pagina's populair zijn, wat bezoekers graag lezen, waar ze vandaan komen en welk bezoekpatroon ze vertonen. Hier kan ik mijn websites op aanpassen door bijvoorbeeld op bepaalde pagina's meer advertenties te zetten, of door bepaalde onderdelen van de site vaker te updaten omdat deze populairder zijn bij bezoekers. Ik dank Google dan ook erg voor deze mooie dienst, dankzij hun kan ik optimaal verdienen en bezoekers optimale informatie leveren die ze willen lezen. Maar aangezien ik dit op al mijn websites gebruik weet Google dus ook welke websites van mij zijn.

Ook hebben ze een indicatie van wat ik ongeveer verdien met mijn websites. Ik ben namelijk ingeschreven bij Google Adsense. Het advertentie programma van Google. Met dit programma kan ik gratis advertenties uit het Adwords netwerk op mijn site plaatsen en daar geld mee verdienen. Dit is vaak te herkennen aan de "ads door Google" tekst op een site. De advertenties zijn vaak aan hun uiterlijk al snel te herkennen. Maar hierdoor weet Google wel hoeveel geld ik met mijn sites verdien. Ach, is logisch natuurlijk, en ik vind het zelf ook niet zo heel erg, zolang ze maar iedere maand een mooi bedrag overmaken naar mijn bankrekening.

Dit is natuurlijk mijn eigen schuld, ik heb mij daar vrijwillig aangemeld en ben ermee ingestemd dat Google deze gegevens mag weten en gebruiken. Ook heeft dit niet echt invloed op de doorsnee internetter. Maar wat nu gaat komen kan wel invloed op de algemene internetter hebben.

Google weet namelijk wat mijn interesses zijn...

Ik gebruik Google net als miljoenen anderen iedere dag. Iedere dag zoek ik informatie op met Google. Ik geef hierbij termen op, ook wel zoekwoorden genoemd en krijg daar resultaten bij. Google geeft jou als gebruiker een uniek nummer/code. Dit wordt op je computer opgeslagen in een zogenaamde cookie. Iedere keer als jij Google bezoekt weet Google dat jij het bent door die cookie. Google kan hierdoor dus een dossier maken met waar jij naar zoekt. En dat houdt Google geen weekje bij, maar tientallen jaren...

Zelf heb ik al een tijdje een Google account, ik kan in deze account kijken waar ik naar gezocht heb sinds ik die Google account heb. Om je een idee te geven zal ik er een paar termen uit toelichten:
Op 26 April 2005 om 15.58 uur heb ik gezocht naar muziek van de Murderdolls (een of andere achterlijke band).
Verder heb ik nog gezocht naar "tuinhuis kopen", "Realtones", "Hoger komen in Google" en nog duizenden andere zoekwoorden. Per zoekwoord is te zien hoe laat ik ernaar zocht en wanneer en welke websites ik bezocht heb uit de resultaten.

Hier kun je dus heel makkelijk uit opmaken wat mijn interesses zijn, zeker met zo'n groot dossier van zo'n lange periode.

Maar wat heeft Google hieraan?
Google kan hierop haar zoekresultaten aanpassen, maar ook de advertenties die aan de zijkant verschijnen. Als ik bijvoorbeeld zou zoeken naar "online cd kopen" zou Google mijn muzieksmaak kunnen gebruiken om advertenties weer te geven die gebaseerd zijn op die smaak. Bijvoorbeeld advertenties weergeven van websites waar ik cd's van Bruce Springsteen kan kopen omdat ik eerder deze week gezocht heb naar lyrics van Bruce Springsteen nummers.

In principe is dit onschuldig, sterker nog, ik vind het handig. Maar ik hoop maar dat Google de enige is die deze informatie heeft, en dat het optimaliseren van zoekresultaten en advertenties ook het enige doel is van deze informatie. Maar hier kom ik later op terug.

Het is natuurlijk allemaal je eigen schuld dat Google dit over jou te weten komt omdat je het ze verteld. Jij kiest ervoor om Gmail te gebruiken, jij kiest ervoor om je documenten online te beheren, jij kiest ervoor je aan te melden bij Adsense en Adwords, jij kiest ervoor iedere dag Google te gebruiken om informatie op te zoeken, jij kiest ervoor om Google analytics op je site te zetten.

Maar zelfs als jij Google nooit zal gebruiken, en je nooit laat verleiden gebruik te maken van haar diensten, dan weten ze toch nog dingen over je!

Zoals ik al eerder heb gezegd heb ik bijvoorbeeld Google Analytics op mijn websites draaien. Ook op deze. Hierdoor weet Google dus dat jij deze pagina op dit moment aan het bekijken bent. Google weet hoelang je dat doet. Google weet waar je vandaan gekomen bent voordat je hier kwam. Google weet welke pagina's je hierna op deze website gaat bekijken. Google kan, als meerdere websites Google analytics hebben draaien, weten welke andere website je bezoekt nadat je deze hebt bezocht. Op deze manier kan Google dus je hele surfpatroon stap voor stap vastleggen zonder dat je ooit gebruik zal maken van de diensten van Google, en zonder dat je het zelf weet! En geloof me, veel websites maken al gebruik van Google Analytics. Google kan deze gegevens vastleggen en koppelen aan je ip-adres. Let wel, ze weten natuurlijk niet WIE je bent, tenzij ze dat aan je surfgedrag kunnen opmaken. Ze weten ook niet waar je woont en ze weten dit alleen als jij websites bezoekt die de software van Google op de site geïnstalleerd hebben.

Waar gaat het heen?
Google heeft nu alle andere grote bedrijven min of meer overbodig gemaakt. Ten eerste kunnen we bij Google terecht om te zoeken naar informatie. Daarnaast kun je online presentaties maken, tekst verwerken en zijn andere office tools overbodig geworden. Je kunt emailen met Google, Google heeft haar eigen online betaaldienst. Je kunt online boeken inzien, video's zoeken, je kunt satellietfoto's bekijken van iedere plek op de wereld tot op een hoogte waarbij je je eigen auto van die van de buurman kunt onderscheiden. Je kunt virtueel door straten lopen, verder zijn er nog diensten als Orkut, Blogger, Calendar, Discussie groepen, foto editing software Picasa, instant messenger Google Talk, Google Desktop, Google SketchUp, Google Pack, er is een operating systeem ontwikkeld voor mobiele telefoons en ga zo nog maar even door. De volgende logische stap zou zijn om een Operating system te ontwikkelen om te concurreren met Microsoft's Windows (edit: Google officials hebben gezegd nog geen concrete plannen hiervoor te hebben). Er zou een Google Browser aan zitten te komen om te concurreren met Internet Explorer. En dit is allemaal GRATIS.

Google heeft het software programma Google Desktop uitgebracht, waarmee naar bestanden op de pc gezocht kan worden, deze bestanden zijn geïndexeerd, dus elk woord uit een tekstbestand staat in de database van Google Desktop. Wat als Google deze informatie nou aan je online informatie koppelt? Dan weet Google dus de inhoud van ieder document dat op je computer staat.

Dit heeft Google bereikt in iets meer dan tien jaar. Kun jij je voorstellen wat Google zou kunnen hebben ontwikkeld over nog eens tien jaar?

Wat nu?
Je moet je voorstellen dat Google deze informatie weet van miljoenen zoniet miljarden mensen van overal over de wereld. En het is blijkbaar geen nutteloze informatie als je de omzetcijfers van Google bekijkt. Deze informatie is natuurlijk erg gewild bij bedrijven. Ik bijvoorbeeld, zou graag willen weten waar veel mensen naar zoeken, dan zou ik er een website over maken en van de advertentie opbrengsten de rest van mijn dagen slijten in een hangmat op Hawaii. Maar ook overheden kunnen deze informatie goed gebruiken bij het opsporen van criminelen, terroristen en andere bedreigingen. Maar als ik op een website kom waar uitgelegd wordt hoe je een bom kunt maken, ben ik dan meteen een terrorist? Misschien was de website wel een popup die ik niet gezien heb en de hele tijd op de achtergrond openstond. Misschien was ik gewoon nieuwsgierig. Kortom, hoe kun je er zeker van zijn dat overheden de informatie niet verkeerd interpreteren of misbruiken? Daarom heeft Google een duidelijke privacy policy. Zo duidelijk zelfs dat toen de Amerikaanse overheid Google beval om gebruikersgegevens over te dragen, Google dit weigerde en het uitliep op een rechtzaak. Andere bedrijven (Yahoo! en Microsoft) die door de Amerikaanse overheid gevraagd werden gegevens over haar gebruikers over te dragen deden dat vrijwillig zonder mokken. Uiteindelijk heeft Google slechts 10.000 zoekopdrachten moeten afstaan van de rechter. Een aanzienlijk minder aantal dan dat in eerste instantie geëist werd.

Hieruit blijkt gelukkig dus dat Google niet zomaar haar gebruikersgegevens op straat gooit of aan derden verkoopt of geeft. Maar... er is een andere kant van het verhaal.

Ex-CIA agent Robert Steele zei namelijk dat Google samenwerkt met de Amerikaanse CIA. Nu ben ik niet zo'n fan van samenzweringen, en ik weet ook niet wat ik ervan moet geloven. Maargoed, het is aan jullie om hier zelf een mening over te vormen.

Heeft Google nu teveel macht?
Met al die gedetailleerde gegevens over haar gebruikers heeft Google dus veel macht. Of deze macht in goede handen is laat ik even in het midden. De vraag is of de macht te beperken is. Naar mijn idee niet. We kunnen allemaal stoppen met het gebruiken van de Google diensten, maar dan gaan mensen vanzelf op zoek naar alternatieven. Dus we gaan bijvoorbeeld Yahoo Search gebruiken als zoekmachine. Maar in principe verschuiven we dan alleen het probleem. Dan is Google niet degene die al die gegevens heeft over haar gebruikers, maar is Yahoo dat. En Yahoo! was wel een van de bedrijven die zonder mokken gebruikersdata aan de Amerikaanse overheid heeft gegeven...

Google staat in een kwaad daglicht omdat iedereen Google meteen aanwijst als het om online privacy gaat, omdat Google het grootste internet bedrijf van dit moment is. Maar als ik een uitgebreid statistieken programma op deze site installeer kan ik ook allerlei informatie krijgen over de gebruikers op mijn site, maar daar zul je niemand over horen, ik ben immers maar een 18-jarig jongetje met een uit de hand gelopen hobby. Nu moeten jullie jezelf de vraag stellen: Wie zal ik meer vertrouwen met mijn gegevens, John Doe of Internet gigant Google met haar advocaten en een privacybeleid dat nauwlettend in de gaten wordt gehouden door de halve wereld?

Ik denk dat ik liever Google blijf vertrouwen.