Google doet er alles aan om jou te begrijpen

Google kan veel, maar lang niet alles. Grootste probleem: een computer snapt taal niet. De zoekmachine leert nu de betekenis van woorden. Een hels karwei, zegt Google-brein Amit Singhal.

Amit Singhal verzuchtte eens tegen zijn moeder dat we eigenlijk nog niets begrijpen van hoe computers werken. Zij had daar wel een oplossing voor, zegt Singhal, zijn Indiase accent nog even aandikkend om zijn moeder te imiteren: "Vraag het Google, Google weet alles." Voor veel internetgebruikers lijkt het of Google overal het antwoord op heeft. Singhal weet wel beter. "Maar mam, we hebben Google zélf gebouwd", riep hij wanhopig uit.

Als iemand weet wat computers níet kunnen, is het Singhal. Hij besteedde zijn halve leven aan het verbeteren van de zoekmachine die door miljoenen mensen wereldwijd wordt gebruikt. Google bestaat sinds 1998 en versloeg alle andere zoekmachines. Alleen Bing van Microsoft doet nog een beetje mee. Hoewel er nauwelijks concurrenten zijn, zijn er wel andere manieren van zoeken via Twitter, Facebook en LinkedIn bijgekomen. Twitter is geschikt voor actuele nieuwtjes, LinkedIn voor het vinden van mensen en Facebook om de mening van anderen te horen.

Singhal mag dan nog lang niet tevreden zijn, googelen is een werkwoord, dat geeft wel aan hoezeer de zoekmachine onderdeel is van het dagelijks leven. En dat grotendeels dankzij de bescheiden veertiger - brilletje, paarse trui - die vanuit het hoofdkantoor van Google in Mountain View, Californië via een webcamvebinding geduldig de techniek van het zoeken probeert uit te leggen aan de Nederlandse journalisten in het kantoor van Google Nederland aan de Amsterdamse Zuidas.

Grootste probleem: een computer snapt taal niet. "Als je een woord intoetst, ziet de computer niet meer dan een rijtje letters. De betekenis erachter kent hij niet. Wij weten dat Amsterdam een stad is, dat er mensen in wonen, dat het de hoofdstad is van Nederland, de computer niet. Waar wij mee bezig zijn is de computer de betekenis achter de woorden te leren. Maar dat is heel erg lastig. Zo lastig dat ik vaak de moed heb opgegeven."

Google begon op basis van algoritmen: de zoekmachine zoekt het woord in de teksten op internet en berekent met wiskundige formules welke sites relevant zouden kunnen zijn. De gebruiker moet zelf maar uitzoeken of tussen al die blauwe linkjes één zit die zijn vraag beantwoordt. De kwalitatief best gebouwde websites verschijnen bovenaan.

De nieuwe manier van zoeken die Singhal met zijn team ontwikkelt, heet semantisch zoeken. De gebruiker merkt nu al verschil. "Als je 'Gogh' typt, dan weet Google dat Van Gogh een persoon is, dat hij kunst maakt, en dat die twee dingen met elkaar verbonden zijn. Dus dan vind je teksten, maar nu ook een rijtje met afbeeldingen van kunstwerken van Van Gogh. Dat snapt Google al."

Een stap vooruit zette Google volgens Singhal toen het twee jaar geleden Metaweb kocht, een eenmansbedrijf uit San Francisco. Metaweb had een index gemaakt van twaalf miljoen begrippen en hun betekenis, zoals personen, voorwerpen en plaatsen, op een zelfde soort manier als de online encyclopedie Wikipedia. Google werkte verder aan het in kaart brengen van het onderling verband van alle feiten in de database. In amper twee jaar is de index van de database volgens Singhal gegroeid tot 200 miljoen begrippen met hun onderlinge verband. Ter vergelijking: de Engelstalige index van Wikipedia heeft bijna vier miljoen artikelen.

En zo komt Google stapje voor stapje dichter bij Singhals ideale zoekmachine. Zoals zo velen van zijn generatie internetwhizzkids die nu topposities bekleden in de computerindustrie, is Singhals kijk op de wereld sterk beïnvloed door Star Trek. Aan de voet van de Himalaya in de Indiase staat Uttar Pradesh waar hij opgroeide, miste de jonge Singhal geen aflevering van de sciencefictionserie op de zwartwit-televisie in zijn ouderlijk huis. "Kapitein Kirk was mijn held, ik wist niet beter of met computers kon alles, mensen konden worden gebeamd, alle planeten binnen enkele minuten bereikt."

Singhal ging als twintiger informatica studeren in Minnesota en begreep toen eigenlijk pas echt dat de wereld van Star Trek niet bestond. "Het was een teleurstelling hoe weinig computers konden en wat voor babystapjes er werden gezet." Na zijn studie ging hij werken bij telecomgigant AT&T. Tot een vriend hem overhaalde bij het nog kleine bedrijf Google van Sergey Brin en Larry Page te solliciteren. Hij werd aangenomen, als werknemer 167. Inmiddels werken er bij Google 32.467 mensen en is het de grootste internetonderneming ter wereld, met een jaaromzet van 37,9 miljard dollar.

Toch is Singhal verre van tevreden. Wel geven de laatste ontwikkelingen de Indiër soms een gevoel van opwinding die hem doen denken aan zijn kindertijd. "Nu weet Google eindelijk dat er een Apple bestaat die eetbaar is wanneer je hem in de ene context gebruikt, en een merk voor iPhones en iPads in de andere context. Dat GM staat voor General Motors, maar voor Genetisch Gemanipuleerd als het verwijst naar tomaten."

Terwijl Google dus in staat is preciezer te zoeken, komen er dagelijks duizenden internetpagina's bij. In april telde Worldwidewebsize.com acht miljard internetpagina's. Wil je precies die informatie krijgen die je zoekt, dan moet Google ook iets weten van degene die zoekt, zegt Singhal. "Ik zal een persoonlijk voorbeeld geven. Bij het skiën probeerde ik mijn zoon van acht bij te houden op een voor mij iets te steile helling en natuurlijk viel ik en raakte gewond."

"Hoe had Google mij kunnen helpen? Ik had kunnen vragen of de helling misschien te steil was. Maar dat hoefde niet meer. Dat had ik ondervonden. Dat een achtjarige minder pijn heeft als hij valt dan een volwassene, wist ik inmiddels ook al. Ik had kunnen opzoeken wat te doen aan een gescheurde meniscus. Maar in dit geval had ik meer aan een vriend die arts is, die me dezelfde informatie gaf als Google, maar me daarbij aanraadde om me te laten opereren. Hij kon me die informatie geven, omdat hij me kent. Hij wist mijn leeftijd, hij wist dat ik die knie hard nodig had omdat ik hardloop. Omdat hij me goed kent, kon hij me beter adviseren dan mijn eigen arts. Zo gedraagt een zoekmachine zich niet."

"De zoekmachine van mijn dromen is de zoekmachine die mij persoonlijk kent", roept hij enthousiast in de webcam. Vandaar dat Google met eerdere zoekopdrachten, de netwerksite Google+ en via Gmail zoveel mogelijk informatie verzamelt en opslaat en gebruikt om relevantere zoekresultaten te geven. Om dit mogelijk te maken, heeft Google net zijn privacybeleid veranderd. Als je niet wilt dat Google al je persoonlijke informatie uit alle Googlediensten, zoals fotoprogramma Picasa, YouTube, Gmail en het vriendennetwerk Google+, aan elkaar koppelt, moet je dat zelf aangeven.

Privacywaakhonden kijken met argusogen naar zoveel privéinformatie in handen van één bedrijf. Google gebruikt de gegevens niet alleen om betere zoekresultaten te krijgen; het hengelt met alleen al de persoonsgerichte advertenties jaarlijks 1,7 miljard euro aan reclame-inkomsten binnen, ongeveer evenveel als Facebook.

Uit een Amerikaanse enquête van het Pew Research Centre blijkt dat driekwart van de Amerikanen vindt dat Google hun privacy aantast. Singhal begrijpt de ongerustheid, zegt hij. "Maar het is geen goede oplossing om dan maar de technologische ontwikkeling stil te zetten, uit angst voor wat er kan gebeuren. Ik zie een parallel met de uitvinding van de drukpers. Toen de kerk ontdekte dat die werd gebruikt voor andere boeken dan de Bijbel, wilden religieuze leiders een verbod."

De Google-top draagt uit de vrijheid van meningsuiting en mensenrechten hoog in het vaandel te hebben. Zo is het bedrijf vorig jaar vertrokken uit China omdat de overheid zoekresultaten censureerde. Google liet daardoor een enorme markt van miljoenen mensen over aan de Chinese concurrent Baidu.

Als hij naar zijn eigen kinderen kijkt, denkt hij dat het belangrijk is de digitale generatie te coachen. Google biedt volgens Singhal genoeg mogelijkheden privacy-instellingen zelf te bedienen. "Het individu moet controle hebben over welke informatie door wie wordt gebruikt. Wil je het vertrouwen houden, dan moeten bedrijven daar transparant in zijn. Dat is Google."

"Techniek is onderdeel van hun leven", zegt Singhal over zijn twee kinderen. "Zij weten niet beter of ze kunnen antwoord krijgen op al hun vragen, met de snelheid waarop ze zelf denken. Als ik een vraag had als kind, moest ik eerst naar de bibliotheek. Als een boek er niet was, moest ik twee weken wachten op het antwoord. Deze generatie heeft andere vaardigheden nodig. We moeten ze leren informatie kritisch te beoordelen. We moeten optimistisch zijn en ze de handvatten aanreiken." Dan lacht hij: "Hoor mij nou. Mijn kinderen kennende zitten ze op dit moment gewoon Angry Birds te spelen."

Europa kritisch over nieuw privacybeleid
Eén Amerikaans bedrijf dat alles weet over het privéleven van zo ongeveer iedere wereldburger: het voelt ongemakkelijk. Sinds 1 maart heeft Google een nieuw privacybeleid. De belangrijkste verandering: Google combineert per gebruiker de gegevens van zijn verschillende diensten, zoals YouTube, Gmail en de zoekmachine. Op die manier heeft Google van bijna iedereen een soort superprofiel, met daarin alles wat diegene doet, wie zijn vrienden zijn en waar hij is. Verschillende Europese privacywaakhonden betwijfelen of het privacybeleid in overeenstemming is met Europese wet- en regelgeving.

Janneke Slöetjes van de digitale mensenrechtenorganisatie Bits of Freedom: "Het voordeel voor de gebruiker is dat als ik bijvoorbeeld zoek op 'jaguar', Google zo eerder weet dat ik geen dier zoek, maar een auto, omdat ik veel autofilmpjes op YouTube bekijk. Het grote voordeel is vooral voor adverteerders. Google weet beter wat je leuk vindt, door het combineren van gegevens, en kan dus advertenties plaatsen waar je eerder op klikt. Maar dat kan ook een nadeel zijn: als Google eerder dan ik zelf weet welke nieuwe schoenen ik wil hebben, vind ik het creepy worden."

De Franse gegevensbeschermingsautoriteit CNIL stuurde half maart een vragenlijst met 69 vragen naar Google. De brief is gestuurd namens alle Europese lidstaten. Een jurist van Google heeft inmiddels 24 vragen beantwoord in een eerste reactie. De jurist klaagt in de begeleidende brief dat de Fransen Google zwart maken door te suggereren dat het Californische bedrijf de wet overtreedt, zonder hard bewijs te leveren. De jurist stelt dat gebruikers volledige controle hebben over hoe Google met hun gegevens omgaat. Ze kunnen inloggen op een 'dashboard', een website waar precies staat wat Google allemaal weet over ze, en daar precies aangeven welke gegevens Google wel en niet mag gebruiken en combineren. Wil je geen gerichte reclame? Dan krijg je die niet meer.

Volgens Slöetjes is dat echter een ingewikkeld klusje. Bovendien is Google niet duidelijk of het ergens toch alle gegevens van jou opslaat. "Wat nou als een opsporingsdienst die informatie opvraagt?", zegt Slöetjes. "Die weten dan meteen alles over je." Ook onduidelijk is hoe lang Google de privéinformatie bewaart. In Nederland stelt de privacywet dat bedrijven persoonlijke gegevens niet langer mogen bewaren dan nodig is.

Gouden aankopen
Naast het besturingssysteem heeft Google tientallen andere producten, zoals Picasa, Gmail, en Google+. Het bedrijf heeft de naam om nieuwe diensten snel in roulatie te brengen en gebruik te maken van kritiek van de gebruikers om ze verder te ontwikkelen. Sommige initiatieven sterven dan ook een roemloze dood.

Google heeft daarnaast een paar gouden aankopen gedaan. Zo kocht Google in 2005 Android, een besturingssysteem voor mobiele telefoons. Zo'n 300 miljoen telefoons wereldwijd draaien op Android, waarmee het een serieuze concurrent is voor Apple. Ook YouTube, de website waar mensen hun eigen filmpjes op kunnen zetten, bleek een hit.

Het nieuwe zoeken: Google geeft antwoord
Google probeert voortaan ook direct antwoord te geven. Nu al is het zo dat als iemand 'weer' en 'Lutjebroek' intoetst, hij te zien krijgt wat het weer is in het Noord-Hollandse dorp.

Dit lukt alleen nog bij ondubbelzinnige standaardvragen en alleen in de Engelstalige versie. 'How high is the Mount Everest', snapt Google bijvoorbeeld (8848 meter).

Naast het antwoord geeft Google overigens ook de websites waaruit de machine het antwoord wist te halen.

Meer over

Wilt u iets delen met Trouw?

Tip hier onze journalisten

Op alle verhalen van Trouw rust uiteraard copyright. Linken kan altijd, eventueel met de intro van het stuk erboven.
Wil je tekst overnemen of een video(fragment), foto of illustratie gebruiken, mail dan naar copyright@trouw.nl.
© 2020 DPG Media B.V. - alle rechten voorbehouden