Wikipedia:GLAM/Koninklijke Bibliotheek en Nationaal Archief/Data/OpenDataKB/ANP
Nieuws | Over onze samenwerking met Wikimedia | Projecten | Evenementen & bijeenkomsten | KPIs | Archief (2013-2014) | Alle pagina's |
ANP Radiobulletins Digitaal (semi open dataset)[bewerken | brontekst bewerken]
1,5 miljoen typoscripten van nieuwsbulletins van het Algemeen Nederlands Persbureau (ANP) uit de periode 1937-1984.
Inhoud van de set[bewerken | brontekst bewerken]
Het doel van de nieuwsbulletins was het verstrekken van objectief nieuws uit binnen- en buitenland over de radio. De teksten dateren van 1937, het jaar waarin de bulletins voor het eerst op de Nederlandse radio te beluisteren waren, tot 1989, het jaar waarin de bulletins voor het eerst digitaal werden opgesteld. Geluidsopnamen van de uitzendingen van de radionieuwsdienst zijn slechts sporadisch bewaard gebleven. De typoscripten zijn daarom de primaire bron voor het Nederlandse radionieuws in de periode 1937-1984.
Het latere materiaal is nagenoeg compleet, de jaren 1937-1950 vertonen echter grote lacunes. Zo ontbreken de oorlogsjaren. De berichtgeving is over het algemeen zeer feitelijk en gedetailleerd, bij overname uit de Staatscourant soms zelfs opsommerig.
De set bestaat uit scans van de 1.474.379 typoscripten voorzien van OCR (voor verbetering vatbaar) en woordcoördinaten. Er is zowel beschrijvende als structurele metadata voorhanden (deze zijn onderdeel van hetzelfde XML-bestand).
De set is mede mogelijk gemaakt door het Algemeen Nederlands Persbureau. De website waarop dit materiaal doorzocht kan worden is http://radiobulletins.delpher.nl Hier is ook meer http://radiobulletins.delpher.nl/nl/pages/over+radiobulletins achtergrondinformatie] over het materiaal te vinden.
Bestanden[bewerken | brontekst bewerken]
Voor elk van de typoscripten zijn de volgende bestanden beschikbaar:
- de afbeelding in hoge resolutie (JPEG 2000)
- de tekst (OCR in XML)
- de coördinaten van elk woord op een pagina (ALTO in XML)
- beschrijvende en structurele metadata (MPEG21-DIDL)
De metadata en digitale objecten in de set beslaan ongeveer 1 TB.
Techniek[bewerken | brontekst bewerken]
Technische uitleg over en voorbeelden van de:
- beschrijvende en structurele metadata (MPEG21-DIDL),
- full text-objecten (OCR, ALTO, JPEG),
- metadata-harvest-API op basis van OAI-PMH,
- zoek-API op basis van SRU,
vindt u in de:
- uitgebreide technische uitleg over de set (PDF),
- kortere snelstart (PDF, in het Engels).
Voorwaarden hergebruik & licenties[bewerken | brontekst bewerken]
- De Koninklijke Bibliotheek heeft afstand gedaan van het auteursrecht op de metadata. Deze bestanden zijn derhalve beschikbaar onder de CC0 1.0 Universal verklaring.
- De objecten in deze set (JPG, OCR, ALTO) zijn beschikbaar onder een CC-BY-NC-ND 3.0-licentie. Gebruik bij bron-, naams- en licentievermelding de volgende formulering:
Algemeen Nederlands Persbureau (ANP) & Koninklijke Bibliotheek (KB). Bron: radiobulletins.delpher.nl – [link naar object] – CC-BY-NC-ND
Contact & feedback[bewerken | brontekst bewerken]
We zijn zeer benieuwd door wie en hoe de ANP-data wordt gebruikt. Wij verzoeken u dan ook een mail met uw contactgegevens en een korte uitleg over wat u met de data doet naar dataserviceskb.nl te sturen. Feedback op onze data en API’s is uiteraard ook zeer welkom. Het verstrekken van uw gegevens geeft ons ook de mogelijkheid om u op de hoogte te houden van relevante ontwikkelingen, zoals wijzigingen in de dataset of het vrijkomen van nieuwe datasets.
Zie ook[bewerken | brontekst bewerken]
Deze open dataset is ook beschikbaar op de 'master'-site van de Koninklijke Bibliotheek: kb.nl/dataservices. De beschrijving is daar het meest up-to-date |}