woensdag, juli 12, 2006

'World Wide Web telt zeker 14 miljard pagina's'

TILBURG - Het world wide web telt zeker 14,3 miljard webpagina's. Dat heeft de Tilburgse student Maurice de Kunder becijferd. Het Nederlandse web telt minstens 291 miljoen webpagina's.
De Kunder, student bedrijfscommunicatie en digitale media in Tilburg, heeft zijn afstudeerscriptie aan het onderwerp gewijd. Gewoon tellen zou de duur van de studie aanzienlijk verlengen. Daarom hanteerde De Kunder een methode die uitgaat van woord- en documentfrequenties in verschillende tekstverzamelingen.
Als een woord in dertig artikelen voorkomt in een verzameling van 30.000 krantenartikelen, dan is de verwachte documentfrequentie van dat woord 1 op 1000. Wanneer een zoekmachine meldt dat er 9 miljoen webpagina's zijn waarop dat woord voorkomt, dan is het aannemelijk er 9 miljard webpagina's te vinden zijn.
De Kunder herhaalde de rekensom voor een groot aantal woorden en kon op die manier de omvang van de database van de zoekmachines Google, Yahoo Search, MSN Search en Ask schatten. Maar omdat de machines voor een deel dezelfde sites vinden, moest de student via een steekproef de overlap er uit halen. Die correctie bracht De Kunder op 14,3 miljard. Volgens de student groeit het wereldwijde web met 2 procent per maand.
Google, de meest gebruikte zoekmachine, geeft als het om de omvang gaat zeer uiteenlopende resultaten, vond De Kunder uit. In een maand, waarin iedere dag werd gemeten, varieerde de geschatte grootte tussen de 25 en de 45 miljard webpagina's.
Volgens hoofddocent Antal van den Bosch, die De Kunder begeleidde, zet Google op drukkere tijden een kleinere database in. De Kunder meent dat Yahoo Search veel beter de omvang van het web weergeeft.
(Bron)

Geen opmerkingen: