Gaat de infrastructuur bij zoekmachines het verschil uitmaken?
(…)“Google is as much about infrastructure as it is about the search engine.”
Deze quote is afkomstig van Martin Reynolds, analyst bij de Gartner Group uit een artikel in de New York Times. Keer op keer hebben we het over de verbeteringen in indexeringen, maar ook op gebied van infrastructuur heeft Google een paar aardige paradepaardjes. Martin stelt dat Google na Dell, Hewlett-Packard en IBM de grootste fabrikant van computerservers is. Er zijn zelfs signalen dat Google haar eigen custom-made microchips aan het ontwikkelen is. Desondanks zijn de computerkosten bij Google de helft van de kosten bij vergelijkbare grote internetbedrijven.
Bill Gates reageert met “Google doesn’t have anything magic here. We spend a little bit more per machine. But to do the same tasks, we have less machines.” Of er nu wel of geen verschillen zijn, Google heeft in elk geval een imago weten te creëren van een bedrijf dat continu de grenzen van moderne computerwetenschap op zoekt.
Rode draad in het geheel is de veronderstelling dat hardware kan uitvallen en dat dit softwarematig opgevangen moet worden. Zo is er het Google File system waarbij data op verschillende plaatsen is gekopieerd. Mocht een server uitvallen dan is dat geen enkel probleem. Iets dat essentieel is voor Google’s recent gelanceerde Google Checkout. Regulier backup’s maken is hierdoor niet nodig. Verder maakt Google gebruik van een grote pool van servers die verschillende taken kunnen uitvoeren. Dit scheelt behoorlijk in kosten ten opzichte van de aanschaf van dedicated servers voor een bepaald systeem. Het artikel maakt duidelijk dat de strijd tussen zoekmachines niet alleen op het vlak van algoritme’s zich afspeelt. Wat denken julie zou de (bijna) wetenschappelijke benadering van Google ten aanzien van hun infrastructuur, het verschil uit zal gaan maken met de concurrent?