BOEKRECENSIE          BERT ZEEMAN

Dagdromen 

VAN EEN  
UNIVERSELE
DIGITALE 
BIBLIOTHEEK

Toen Google Books het levenslicht zag, was de hoop groot dat dit zou leiden tot een ‘universele digitale bibliotheek’. Helaas kwam die niet van de grond, zo constateren de auteurs van Along Came Google. In hun boek blikken ze kritisch terug en dromen ze verder over zo’n allesomvattende digitale bibliotheek. Bert Zeeman nam het onder de loep.

‘Ik weet nog precies waar ik was toen ik hoorde dat president John F. Kennedy was neergeschoten.’ Of, voor de jongere generaties: ‘Ik weet nog exact wat ik aan het doen was toen de aanslagen op de Twin Towers plaatsvonden.’ Het is uiteraard van een heel andere orde, maar voor de bibliotheekwereld is er ook zo’n moment waarvan iedereen weet wat hij of zij op dat moment aan het doen was. De dag: 14 december 2004. De gebeurtenis: Google maakt bekend dat het de bibliotheekcollecties van de New York Public Library, Oxford University, Stanford University, Harvard University en University of Michigan gaat digitaliseren en vrij beschikbaar gaat stellen via zijn zoekmachine. Dit nieuws sloeg zeker in de Amerikaanse bibliotheekwereld in als een bom. Ik lag overigens op het moment van bekendmaking lekker op een oor.


Overeenkomsten met bibliotheken

Het is inmiddels alweer zeventien jaar geleden dat de basis werd gelegd voor wat we nu nog steeds kennen als Google Books: een enorme verzameling gedigitaliseerde boeken en tijdschriften afkomstig uit bibliotheken van over de hele wereld. Niemand weet hoe groot de verzameling is en Google zelf hult zich daarover meestal in stilzwijgen. Een Google-medewerker becijferde in 2010 dat er op dat moment bijna 130 miljoen boeken ooit gepubliceerd zouden zijn; volgens een van de laatste berichten heeft Google daarvan inmiddels zo’n 40 miljoen gedigitaliseerd.

Niemand weet zeker of Google zich nog steeds ten doel stelt álle ooit gepubliceerde werken te digitaliseren, maar regelmatig vinden er nog steeds bekendmakingen plaats van weer nieuwe overeenkomsten met bibliotheken. In 2019 bijvoorbeeld nog met de universiteiten van Colorado en Georgia, met een Zwitsers consortium en met de nationale bibliotheek van Israël; in 2020 met Rutgers University in New Jersey, en met het Museum Plantin-Moretus en de Erfgoedbibliotheek Hendrik Conscience in Antwerpen. Niemand weet wat Google nu eigenlijk nog meer doet met al dat gescande materiaal, al laat de Ngram Viewer zien dat er veel meer is dan alleen maar gescande tekst.


Juridisch moeras

Verwacht over dit soort zaken ook geen onthullingen in Along Came Google: A History of Library Digitization. Niet omdat de auteurs, Deanna Marcum en Roger Schonfeld, daarvoor niet over de juiste credentials zouden beschikken. Marcum heeft een lange loopbaan in de Amerikaanse bibliotheekwereld achter de rug, onder meer als directeur van de Council on Library and Information Resources (CLIR) en bij de Library of Congress. Schonfeld is een centrale pion in diezelfde wereld, als programmadirecteur van de onderzoeksorganisatie Ithaka S+R. Hij is een veelgevraagd spreker op congressen en schrijft als een van de chefs met grote regelmaat voor het onvolprezen blog The Scholarly Kitchen.

Natuurlijk schenken zij aandacht aan de voorgeschiedenis van Google Books, de besprekingen met de verschillende bibliotheken en, na de officiële lancering eind 2004, het juridische moeras waarin Google Books terechtkwam door toedoen van met name de Authors Guild, de zelfbenoemde vakbond van Amerikaanse auteurs, en in mindere mate de Association of American Publishers (AAP), de belangenbehartiger van de Amerikaanse uitgevers. De primaire interesse van Marcum en Schonfeld gaat echter uit naar het perspectief van de universele (digitale) bibliotheek dat Googles initiatief in zich herbergde en de, naar hun mening, gemiste kans om die universele bibliotheek ook daadwerkelijk te realiseren.


Vooral voor Amerikanen?

Er is overigens iets ongemakkelijks met dat concept van de universele bibliotheek zoals Marcum en Schonfeld het hanteren. Enerzijds gebruiken ze daarvoor een definitie die alomvattend lijkt: ‘A single coordinated program to provide digital access for the entire intellectual and cultural record that is easy to use and ubiquitously accessible’. Anderzijds lijken ze in de feitelijke realisering ervan eigenlijk alleen maar oog te hebben voor een universele bibliotheek die weliswaar universeel is in de zin van het volledige boekenuniversum, maar die vooral toch in de eerste plaats toegankelijk moet zijn voor Amerikaanse wetenschappers en het Amerikaanse publiek. Met enige regelmaat hebben ze het dan ook niet over die universele bibliotheek, maar over a national digital library.

Het is jammer dat dat bredere, internationale perspectief af en toe veronachtzaamd wordt, bijvoorbeeld als Marcum en Schonfeld te spreken komen over de fameuze Google settlement die Google na jarenlang procederen in 2008 met de Authors Guild en de AAP wist de bereiken. Volgens hen een win-win-winsituatie (voor Google, voor de bibliotheekwereld én voor auteurs en uitgevers), waarbij de beperkingen die de settlement oplegde aan niet-Amerikanen niet lijken te bestaan. En dat terwijl Marcum en Schonfeld wel degelijk oog hebben voor dat internationale perspectief als ze terecht Europese critici kapittelen over hun onterechte kritiek dat Google Books vooral toch een Anglo-Amerikaanse bias zou hebben. Ik heb ook zelf overzichten gezien waaruit duidelijk blijkt dat meer dan de helft van het Google Books-corpus uit niet-Engelstalige publicaties bestaat.


Helden

Vanwege hun netwerk in de Amerikaanse bibliotheekwereld hebben Marcum en Schonfeld kunnen beschikken over interne documenten (maar jammer genoeg niet van Google) en hebben ze uitvoerige interviews gehouden met bibliothecarissen van de betrokken bibliotheken en provosts van betrokken universiteiten (maar, afgezien van Dan Clancey, niet met Googlers). Dat draagt vooral bij aan een beter begrip van de afwegingen die bibliotheken maakten op het moment dat de oorspronkelijke vijf bibliotheken door Google werden benaderd (dat wisten ze niet van elkaar) en, nadat ze tot de overtuiging waren gekomen dat dit een once in a lifetime opportunity was om de digitalisering van de eigen bibliotheekcollecties écht van de grond te krijgen, op welke voorwaarden ze bereid waren met Google in zee te gaan.

Als er al helden in Along Came Google aan te wijzen zijn, dan zijn dat zonder twijfel Paul Courant en John Price Wilkin, beiden van de University of Michigan. Als enige van de initieel betrokken bibliotheken kwamen zij met Google overeen dat de volledige collectie van Michigan (7 miljoen banden) gedigitaliseerd zou worden. De andere vier partners kozen nadrukkelijk voor de veiliger route om Google alleen boeken te laten digitaliseren die zich al in het publieke domein bevonden.


Basis voor HathiTrust

Daarnaast zorgden Courant en Price Wilkin ervoor dat in hun overeenkomst met Google (een van de weinige die vanaf het begin publiek toegankelijk is geweest) werd vastgelegd dat Michigan van elk boek dat uit haar collectie gedigitaliseerd zou worden, van Google een exemplaar van de digitale scan zou krijgen. En dat Michigan die niet alleen binnen de eigen instelling beschikbaar zou mogen stellen, maar ook in samenwerkingsverbanden met gelijkgestemde instellingen. Daarmee zou later de basis worden gelegd voor de HathiTrust, de organisatie die in de Verenigde Staten zo veel mogelijk gedigitaliseerd materiaal (dus niet alleen Google-scans) verzamelt, preserveert en beschikbaar stelt voor zowel de wetenschap als het grote, maar dan toch vooral Amerikaanse, publiek.


Kritisch

Zijn Marcum en Schonfeld nu optimistisch over het uiteindelijk toch realiseren van die echte universele bibliotheek? Eigenlijk niet. In de aanloop naar het initiatief van Google uit 2004 staan ze uitvoerig stil bij alle andere initiatieven tot samenwerking, ook op het gebied van digitalisering, die zich in de Amerikaanse bibliotheekwereld voltrokken en die – tot Google met de geldbuidel ging rammelen – vaak maar beperkt succesvol waren. Ze zijn kritisch over de bibliotheken en hun moederorganisaties, de universiteiten, omdat die vaak aan lokale en regionale overwegingen een groter belang hechten dan aan het nationale belang. Ze zijn kritisch over de rol van de Library of Congress, die te weinig leiderschap heeft getoond en dat ook onder de nieuwe leiding van Carla Hayden op dit vlak niet lijkt te willen grijpen. En ze zijn kritisch over de rol van financiers (zoals de Mellon Foundation) en belangenorganisaties (zoals de Digital Library Federation en het Institute of Museum and Library Services) omdat zij er niet in slagen een meer gecoördineerde aanpak af te dwingen.


Doorbraak door corona

Gaat corona dan ook hier voor een doorbraak zorgen? Marcum en Schonfeld memoreren in hun slothoofdstuk terecht dat door de pandemie het belang van digitale toegang tot informatie (óók toegang tot gedigitaliseerde boeken) nog eens wordt onderstreept. Terwijl fysieke bibliotheken gedwongen hun poorten moesten sluiten, opende de HathiTrust haar Emergency Temporary Access Service waardoor haar gehele corpus (inmiddels zo’n 17,5 miljoen banden) voor deelnemende bibliotheken beschikbaar kwam en zette Brewster Kahle zijn National Emergency Library, onderdeel van het Internet Archive, voor een beperkte periode onbeperkt open voor het brede publiek. 

Desondanks zijn de auteurs er niet van overtuigd, althans niet voor de Verenigde Staten, dat bij gebrek aan nationaal leiderschap en de noodzaak van landelijke financiering er nu een doorbraak is gerealiseerd. Volgens hen is Google zijn strategische interesse in de digitalisering van boeken door het definitief mislukken van de Google settlement in 2015 inmiddels verloren. Ze zeggen het nergens expliciet, maar tussen de regels door lees je het eigenlijk wel: misschien moet zich opnieuw een internetgigant melden wil de echte doorbraak plaatsvinden. Meta? De naam heeft het in ieder geval al mee.    <

‘Er is iets ongemakkelijks met het concept van de universele bibliotheek zoals Marcum en Schonfeld het in hun boek hanteren’

‘Vanwege hun netwerk hebben de auteurs kunnen beschikken over interne documenten (maar jammer genoeg niet van Google)’

‘Volgens de auteurs heeft Google zijn strategische interesse in de digitalisering van boeken door het definitief mislukken van de Google settlement inmiddels verloren’

IP | vakblad voor informatieprofessionals | 09/ 2021

DIGITALE 
Dagdromen 

VAN EEN  
UNIVERSELE
BIBLIOTHEEK

BOEKRECENSIE          BERT ZEEMAN

‘Ik weet nog precies waar ik was toen ik hoorde dat president John F. Kennedy was neergeschoten.’ Of, voor de jongere generaties: ‘Ik weet nog exact wat ik aan het doen was toen de aanslagen op de Twin Towers plaatsvonden.’ Het is uiteraard van een heel andere orde, maar voor de bibliotheekwereld is er ook zo’n moment waarvan iedereen weet wat hij of zij op dat moment aan het doen was. De dag: 14 december 2004. De gebeurtenis: Google maakt bekend dat het de bibliotheekcollecties van de New York Public Library, Oxford University, Stanford University, Harvard University en University of Michigan gaat digitaliseren en vrij beschikbaar gaat stellen via zijn zoekmachine. Dit nieuws sloeg zeker in de Amerikaanse bibliotheekwereld in als een bom. Ik lag overigens op het moment van bekendmaking lekker op een oor.


Overeenkomsten met bibliotheken

Het is inmiddels alweer zeventien jaar geleden dat de basis werd gelegd voor wat we nu nog steeds kennen als Google Books: een enorme verzameling gedigitaliseerde boeken en tijdschriften afkomstig uit bibliotheken van over de hele wereld. Niemand weet hoe groot de verzameling is en Google zelf hult zich daarover meestal in stilzwijgen. Een Google-medewerker becijferde in 2010 dat er op dat moment bijna 130 miljoen boeken ooit gepubliceerd zouden zijn; volgens een van de laatste berichten heeft Google daarvan inmiddels zo’n 40 miljoen gedigitaliseerd.

Niemand weet zeker of Google zich nog steeds ten doel stelt álle ooit gepubliceerde werken te digitaliseren, maar regelmatig vinden er nog steeds bekendmakingen plaats van weer nieuwe overeenkomsten met bibliotheken. In 2019 bijvoorbeeld nog met de universiteiten van Colorado en Georgia, met een Zwitsers consortium en met de nationale bibliotheek van Israël; in 2020 met Rutgers University in New Jersey, en met het Museum Plantin-Moretus en de Erfgoedbibliotheek Hendrik Conscience in Antwerpen. Niemand weet wat Google nu eigenlijk nog meer doet met al dat gescande materiaal, al laat de Ngram Viewer zien dat er veel meer is dan alleen maar gescande tekst.


Juridisch moeras

Verwacht over dit soort zaken ook geen onthullingen in Along Came Google: A History of Library Digitization. Niet omdat de auteurs, Deanna Marcum en Roger Schonfeld, daarvoor niet over de juiste credentials zouden beschikken. Marcum heeft een lange loopbaan in de Amerikaanse bibliotheekwereld achter de rug, onder meer als directeur van de Council on Library and Information Resources (CLIR) en bij de Library of Congress. Schonfeld is een centrale pion in diezelfde wereld, als programmadirecteur van de onderzoeksorganisatie Ithaka S+R. Hij is een veelgevraagd spreker op congressen en schrijft als een van de chefs met grote regelmaat voor het onvolprezen blog The Scholarly Kitchen.

Natuurlijk schenken zij aandacht aan de voorgeschiedenis van Google Books, de besprekingen met de verschillende bibliotheken en, na de officiële lancering eind 2004, het juridische moeras waarin Google Books terechtkwam door toedoen van met name de Authors Guild, de zelfbenoemde vakbond van Amerikaanse auteurs, en in mindere mate de Association of American Publishers (AAP), de belangenbehartiger van de Amerikaanse uitgevers. De primaire interesse van Marcum en Schonfeld gaat echter uit naar het perspectief van de universele (digitale) bibliotheek dat Googles initiatief in zich herbergde en de, naar hun mening, gemiste kans om die universele bibliotheek ook daadwerkelijk te realiseren.


Vooral voor Amerikanen?

Er is overigens iets ongemakkelijks met dat concept van de universele bibliotheek zoals Marcum en Schonfeld het hanteren. Enerzijds gebruiken ze daarvoor een definitie die alomvattend lijkt: ‘A single coordinated program to provide digital access for the entire intellectual and cultural record that is easy to use and ubiquitously accessible’. Anderzijds lijken ze in de feitelijke realisering ervan eigenlijk alleen maar oog te hebben voor een universele bibliotheek die weliswaar universeel is in de zin van het volledige boekenuniversum, maar die vooral toch in de eerste plaats toegankelijk moet zijn voor Amerikaanse wetenschappers en het Amerikaanse publiek. Met enige regelmaat hebben ze het dan ook niet over die universele bibliotheek, maar over a national digital library.

Het is jammer dat dat bredere, internationale perspectief af en toe veronachtzaamd wordt, bijvoorbeeld als Marcum en Schonfeld te spreken komen over de fameuze Google settlement die Google na jarenlang procederen in 2008 met de Authors Guild en de AAP wist de bereiken. Volgens hen een win-win-winsituatie (voor Google, voor de bibliotheekwereld én voor auteurs en uitgevers), waarbij de beperkingen die de settlement oplegde aan niet-Amerikanen niet lijken te bestaan. En dat terwijl Marcum en Schonfeld wel degelijk oog hebben voor dat internationale perspectief als ze terecht Europese critici kapittelen over hun onterechte kritiek dat Google Books vooral toch een Anglo-Amerikaanse bias zou hebben. Ik heb ook zelf overzichten gezien waaruit duidelijk blijkt dat meer dan de helft van het Google Books-corpus uit niet-Engelstalige publicaties bestaat.


Helden

Vanwege hun netwerk in de Amerikaanse bibliotheekwereld hebben Marcum en Schonfeld kunnen beschikken over interne documenten (maar jammer genoeg niet van Google) en hebben ze uitvoerige interviews gehouden met bibliothecarissen van de betrokken bibliotheken en provosts van betrokken universiteiten (maar, afgezien van Dan Clancey, niet met Googlers). Dat draagt vooral bij aan een beter begrip van de afwegingen die bibliotheken maakten op het moment dat de oorspronkelijke vijf bibliotheken door Google werden benaderd (dat wisten ze niet van elkaar) en, nadat ze tot de overtuiging waren gekomen dat dit een once in a lifetime opportunity was om de digitalisering van de eigen bibliotheekcollecties écht van de grond te krijgen, op welke voorwaarden ze bereid waren met Google in zee te gaan.

Als er al helden in Along Came Google aan te wijzen zijn, dan zijn dat zonder twijfel Paul Courant en John Price Wilkin, beiden van de University of Michigan. Als enige van de initieel betrokken bibliotheken kwamen zij met Google overeen dat de volledige collectie van Michigan (7 miljoen banden) gedigitaliseerd zou worden. De andere vier partners kozen nadrukkelijk voor de veiliger route om Google alleen boeken te laten digitaliseren die zich al in het publieke domein bevonden.


Basis voor HathiTrust

Daarnaast zorgden Courant en Price Wilkin ervoor dat in hun overeenkomst met Google (een van de weinige die vanaf het begin publiek toegankelijk is geweest) werd vastgelegd dat Michigan van elk boek dat uit haar collectie gedigitaliseerd zou worden, van Google een exemplaar van de digitale scan zou krijgen. En dat Michigan die niet alleen binnen de eigen instelling beschikbaar zou mogen stellen, maar ook in samenwerkingsverbanden met gelijkgestemde instellingen. Daarmee zou later de basis worden gelegd voor de HathiTrust, de organisatie die in de Verenigde Staten zo veel mogelijk gedigitaliseerd materiaal (dus niet alleen Google-scans) verzamelt, preserveert en beschikbaar stelt voor zowel de wetenschap als het grote, maar dan toch vooral Amerikaanse, publiek.


Kritisch

Zijn Marcum en Schonfeld nu optimistisch over het uiteindelijk toch realiseren van die echte universele bibliotheek? Eigenlijk niet. In de aanloop naar het initiatief van Google uit 2004 staan ze uitvoerig stil bij alle andere initiatieven tot samenwerking, ook op het gebied van digitalisering, die zich in de Amerikaanse bibliotheekwereld voltrokken en die – tot Google met de geldbuidel ging rammelen – vaak maar beperkt succesvol waren. Ze zijn kritisch over de bibliotheken en hun moederorganisaties, de universiteiten, omdat die vaak aan lokale en regionale overwegingen een groter belang hechten dan aan het nationale belang. Ze zijn kritisch over de rol van de Library of Congress, die te weinig leiderschap heeft getoond en dat ook onder de nieuwe leiding van Carla Hayden op dit vlak niet lijkt te willen grijpen. En ze zijn kritisch over de rol van financiers (zoals de Mellon Foundation) en belangenorganisaties (zoals de Digital Library Federation en het Institute of Museum and Library Services) omdat zij er niet in slagen een meer gecoördineerde aanpak af te dwingen.


Doorbraak door corona

Gaat corona dan ook hier voor een doorbraak zorgen? Marcum en Schonfeld memoreren in hun slothoofdstuk terecht dat door de pandemie het belang van digitale toegang tot informatie (óók toegang tot gedigitaliseerde boeken) nog eens wordt onderstreept. Terwijl fysieke bibliotheken gedwongen hun poorten moesten sluiten, opende de HathiTrust haar Emergency Temporary Access Service waardoor haar gehele corpus (inmiddels zo’n 17,5 miljoen banden) voor deelnemende bibliotheken beschikbaar kwam en zette Brewster Kahle zijn National Emergency Library, onderdeel van het Internet Archive, voor een beperkte periode onbeperkt open voor het brede publiek. 

Desondanks zijn de auteurs er niet van overtuigd, althans niet voor de Verenigde Staten, dat bij gebrek aan nationaal leiderschap en de noodzaak van landelijke financiering er nu een doorbraak is gerealiseerd. Volgens hen is Google zijn strategische interesse in de digitalisering van boeken door het definitief mislukken van de Google settlement in 2015 inmiddels verloren. Ze zeggen het nergens expliciet, maar tussen de regels door lees je het eigenlijk wel: misschien moet zich opnieuw een internetgigant melden wil de echte doorbraak plaatsvinden. Meta? De naam heeft het in ieder geval al mee.    <

IP | vakblad voor informatieprofessionals | 09/ 2021

Toen Google Books het levenslicht zag, was de hoop groot dat dit zou leiden tot een ‘universele digitale bibliotheek’. Helaas kwam die niet van de grond, zo constateren de auteurs van Along Came Google. In hun boek blikken ze kritisch terug en dromen ze verder over zo’n allesomvattende digitale bibliotheek. Bert Zeeman nam het onder de loep.