Early Dutch Books Online is er (maar is er nog niet)

Vandaag was ik, met een paar Utrechtse collega’s en een oud-collega, bij de presentatie van Early Dutch Books Online (EDBO). Tienduizend gedigitaliseerde boeken uit de periode 1780-1800 online raadpleegbaar en full-text doorzoekbaar. Wijnand Mijnhardt van ons eigen Descartes Centrum hield voorafgaand aan de lancering een lezing over de kloof tussen Alfa en Beta en hoe EDBO zou kunnen helpen die kloof te dichten. Overbodig om te melden dat die man wel enig redenaarstalent heeft.

Op weg naar een onderzoekslaboratorium voor de Geesteswetenschappen, ronkt het bijgaande persbericht. Voorafgaand aan de lancering hield de Werkgroep 18e eeuw een symposium over de mogelijkheden die EDBO biedt voor onderzoek in de Geesteswetenschappen. Kort samengevat hebben we een stapje in de goede richting gezet, maar zijn we er nog lang niet. Groot struikelblok blijft de full-text doorzoekbaarheid van het corpus. De scans zijn met OCR-software omgezet naar tekst, maar de resultaten zijn nog zo slecht dat onderzoek op woordniveau lijkt op scherpschieten met hagel. De stoomcursus slim zoeken met operatoren, Booleaanse tekens etc. van Ewoud Sanders helpt hierbij een beetje. Maar om de kloof tussen de alfa’s en beta’s te dichten, zoals Mijnhardt wenst, zijn onderzoeksdata met een accuratesse van 80 a 90% niet voldoende. De Digitale Bibliotheek voor de Nederlandse Letteren (DBNL) werd hierbij als voorbeeld genoemd. Zij presteren het om zowel een hoge productie te halen als inhoudelijk goede tekstversies te presenteren, door deze over te laten typen in een exotisch land.

Mocht de kwaliteit van de teksten verbeteren, dan ligt er een mooie toekomst voor de Geesteswetenschappen in het verschiet. Onderzoek naar emoties of ironie in teksten, beter en eenvoudiger wetenschappelijke tekstedities maken en presenteren, onderzoek naar netwerken van auteurs of wetenschappers en daarbij hun discussies nauwkeurig in kaart brengen. Maar vooral, hypotheses kunnen getoetst worden en onderzoek gereproduceerd.

De bibliotheken werden vaak genoemd deze dag. Het bieden van een goede infrastructuur, beschikbaar stellen van metadata, verbetering van OCR, vindbaar maken van al die teksten op al die verschillende plekken. De wetenschappers kijken voor al deze zaken naar ons. Het werd mij duidelijk dat wij ons als bibliotheek heel erg richten op het tonen van gedigitaliseerde oude werken, maar nog weinig aandacht hebben voor wat de onderzoekers er eigenlijk mee willen doen. Dat is meer dan alleen maar lezen.

Dit bericht werd geplaatst in I&M2.0. Bookmark de permalink .

Geef een reactie

Vul je gegevens in of klik op een icoon om in te loggen.

WordPress.com logo

Je reageert onder je WordPress.com account. Log uit / Bijwerken )

Twitter-afbeelding

Je reageert onder je Twitter account. Log uit / Bijwerken )

Facebook foto

Je reageert onder je Facebook account. Log uit / Bijwerken )

Google+ photo

Je reageert onder je Google+ account. Log uit / Bijwerken )

Verbinden met %s