Wikipedia:GLAM/Koninklijke Bibliotheek en Nationaal Archief/Data/OpenDataKB/EDBO
Nieuws | Over onze samenwerking met Wikimedia | Projecten | Evenementen & bijeenkomsten | KPIs | Archief (2013-2014) | Alle pagina's |
Early Dutch Books Online (open dataset)
[bewerken | brontekst bewerken]Tienduizend full-text boeken uit het Nederlandse taalgebied uit de periode 1781-1800.
Inhoud van de set
[bewerken | brontekst bewerken]Early Dutch Books Online (EDBO) bevat meer dan twee miljoen gedigitaliseerde bladzijden uit boeken gedrukt in de jaren 1781-1800 in het Nederlandse taalgebied. De set telt 11.240 boeken (9.710 titels), met onder meer:
- Beroemde werken uit de Nederlandse geschiedenis, zoals de briefroman Sara Burgerhart van Betje Wolff en Aagje Deken, de verhandeling over de elektriseermachine van Deiman en het verslag van de veldtochten van generaal Pichegru.
- Naast veel theologie en politiek, zijn er ook boeken over planten, dieren, kookboeken, mode, atlassen, almanakken.
- Populair drukwerk, zoals griezelromans, toneelstukken, liedbundels, erotische romans, politieke teksten en wetenschappelijke verhandelingen.
De set bestaat uit scans van de gedrukte pagina’s voorzien van OCR (voor verbetering vatbaar) en woordcoördinaten. Van elk boek is een doorzoekbare PDF beschikbaar. Er is zowel beschrijvende als structurele metadata voorhanden. 2.465 titels bevatten één of meerdere afbeeldingen. Een complete titellijst is te vinden via boeken.delpher.nl (laat zoekveld zoals het is en klik op de zoekknop, je krijft 11.240 resultaten)
De set is een samenwerkingsproject van de Koninklijke Bibliotheek en de universiteitsbibliotheken van Amsterdam en Leiden. Ieder van deze bibliotheken bezit ongeveer 1/3 van de gedrukte werken. Met behulp van het veld <dc:identifier xsi:type=”shelfmark”> is te bepalen uit welke bibliotheek een boek afkomstig is.
Bestanden
[bewerken | brontekst bewerken]Voor elk van de boektitels (een boektitel kan meerdere fysieke boekbanden of -delen omvatten) zijn de volgende bestanden beschikbaar:
- beschrijvende metadata (Dublin Core in XML)
- structurele metadata (MPEG21-DIDL)
- document (PDF)
Voor elk van de ongeveer 2 miljoen gescande pagina’s zijn de volgende bestanden beschikbaar:
- de afbeelding in hoge resolutie (JPEG 2000)
- de afbeelding in middelhoge resolutie (JPEG)
- de tekst (OCR in XML)
- de coördinaten van elk woord op een pagina (ALTO)
De metadata en digitale objecten in de set beslaan zo’n 1,2 TB.
Techniek
[bewerken | brontekst bewerken]Technische uitleg over en voorbeelden van de:
- beschrijvende metadata (Dublin Core)
- structurele metadata (MPEG21-DIDL)
- full text-objecten (PDF, OCR, ALTO, JPEG)
- metadata-harvest-API op basis van OAI-PMH
- zoek-API op basis van SRU
vindt u in de:
Voorwaarden hergebruik & bronvermelding
[bewerken | brontekst bewerken]Op de website van EDBO staan de algemene gebruiksvoorwaarden vermeld. Samengevat: individuele items en niet-substantiële delen van de gehele website zijn vrij, het databankrecht wordt voorbehouden voor substantiële delen of de gehele website.
Daarnaast gelden de volgende bepalingen:
- De metadata van de EDBO-set zijn beschikbaar onder een CC0-licentie.
- Individuele items en niet-substantiële delen van deze set zijn te gebruiken onder een Public Domain Mark;
Voor de gehele set full text items of substantiële delen ervan geldt:
- voor niet-commerciële doelen mag alles worden hergebruikt.
- voor commerciële doelen mogen de gehele deelcollecties van de Universiteitsbibliotheek Amsterdam en de KB worden gebruikt;
- de Leidse deelcollectie of substantiële delen daarvan mogen alleen voor niet-commerciële doelen worden hergebruikt.
Bronvermelding is wenselijk. Vermeld bij gebruik van de hele set, of substantiële delen daarvan, de naam “Early Dutch Books Online”, gevolgd door de namen van de deelnemende bibliotheken.
Ook wordt het op prijs gesteld als de naam van de bibliotheek waar het object uit afkomstig is, vermeld wordt (metadata: <dc:identifier xsi:type=”shelfmark”>:
- Amsterdam, Universiteitsbibliotheek
- Den Haag, Koninklijke Bibliotheek
- Leiden, Universiteitsbibliotheek
Contact & feedback
[bewerken | brontekst bewerken]We zijn zeer benieuwd door wie en hoe de Early Dutch Books Online-data wordt gebruikt. Wij verzoeken u dan ook een mail met uw contactgegevens en een korte uitleg over wat u met de data doet naar dataserviceskb.nl te sturen. Feedback op onze data en API’s is uiteraard ook zeer welkom. Het verstrekken van uw gegevens geeft ons ook de mogelijkheid om u op de hoogte te houden van relevante ontwikkelingen, zoals wijzigingen in de dataset of het vrijkomen van nieuwe datasets.
Zie ook
[bewerken | brontekst bewerken]- Delpher boeken (Early Dutch Books Online]
- Deze open dataset is ook beschikbaar op de 'master'-site van de Koninklijke Bibliotheek: kb.nl/dataservices. De beschrijving is daar het meest up-to-date
|}