Geplaatst op 8 september 2009 door Raphael Cockx

'Google Books zit vol fouten'

Boeken Terwijl internetbedrijf Google een soms bitse juridische strijd met auteurs en uitgeverijen uitvecht over Google Books, lijkt niemand echt aandacht te hebben voor de inhoud van de virtuele bibliotheek. De dienst zou volgens een Amerikaanse prof immers bol staan van de fouten, vooral dan wanneer het gaat om de zogenaamde 'metadata' van de boeken.

Dat zijn databasevelden die bijvoorbeeld aangeven wie de auteur is, wanneer het boek verschenen is of hoeveel bladzijden het werk telt. Het zijn stuk voor stuk belangrijke criteria om gerichte zoekopdrachten te kunnen uitvoeren, maar bevatten opvallend veel fouten, aldus Geoffrey Nunberg van de Berkeley School of Information op zijn blog.

Zo bevat Google Books opvallend veel werken die in 1899 zouden gepubliceerd zijn, waaronder boeken van auteurs die toen amper 11 waren of... pas 2 jaar later geboren werden. Gevolg: Nunberg vond meer dan 1000 vermeldingen van het woord 'internet' bij het zoeken naar werken van voor 1950. In feite gaat het bijna steeds om boeken die de laatste jaren verschenen zijn.

Daarnaast gaat Google soms wel erg raar om met de indeling in categorieën. Die gebeurt in vele gevallen schijnbaar enkel op basis van bepaalde woorden die vaak in de tekst voorkomen. Dat zorgt er bijvoorbeeld voor dat werken die vaak het woord 'icoon' bevatten automatisch aanzien worden als boeken over religie. Volgens Google zijn de fouten terug te voeren op de bibliotheken die de werken aanleveren.

Terwijl internetbedrijf Google een soms bitse juridische strijd met auteurs en uitgeverijen uitvecht over Google Books, lijkt niemand echt aandacht te hebben voor de inhoud van de virtuele bibliotheek. De dienst zou volgens een Amerikaanse prof immers bol staan van...

Reacties

Volg T-zine ook via Twitter Facebook Google+ RSS

Laatste reacties op T-zine

Onze blogs

Meer
Related Posts with Thumbnails