PDF/A

Uit Wikipedia, de vrije encyclopedie
Ga naar: navigatie, zoeken

PDF/A (Portable Document Format Archivable), ook bekend als ISO 19005-1, is een speciale variant van het gewone PDF-formaat die specifiek ontwikkeld is voor archivering. PDF/A is daarom geschikt voor het opslaan van digitale documenten.

Achtergrond[bewerken]

De PDF/A-1 beoogt een statische paginacontent aangezien men op lange termijn meer gebaat is met een correcte weergave dan met allerlei toeters en bellen. In de Verenigde Staten startte in 2002 een werkgroep waarin, naast vertegenwoordigers van de technische committees van ISO, diverse vertegenwoordigers van bibliotheken, archivarissen, PDFsoftwareontwikkelaars, vertegenwoordigers van de overheid, grafische experts en anderen samenwerkten om de standaard PDF/A-1 te definiëren. De standaard werd wereldwijd aangenomen in juni 2005. PDF/A-1 is een subset van Adobe’s PDF 1.4.

Eigenschappen van PDF/A-1[bewerken]

Kleuren worden apparaatonafhankelijk gecodeerd. Dit doet men meestal aan de hand van ICC-profielen. De metadata wordt bij voorkeur in het XMP-formaat gecodeerd. Daarnaast zijn ook functies zoals bijlagen, versleuteling en referenties naar andere bestanden verboden, omdat het document daarmee afhankelijk wordt van apparatuur. Referenties zijn wel toegestaan als de referentie (URI) waarnaar ze verwijzen alleen wordt getoond, en er niet actief naar wordt gelinkt.

Idealiter worden alleen verliesvrije (lossless) compressiealgoritmes gebruikt. Het gebruik van LZW-compressie is verboden, het gebruik van ZIP-compressie wordt aanbevolen. Een digitale handtekening is mogelijk maar heeft beperkingen, bijvoorbeeld als de bijbehorende een authenticatiecertificaat verloopt.

Functies zoals formulieren, JavaScript-code en multimediafuncties zijn niet opgenomen in PDF/A-1. Deze functies zouden in de toekomst namelijk een correcte weergave van het document kunnen verhinderen.[1]

Soorten[bewerken]

Er zijn twee versies van PDF/A-1:

PDF/A-1b (basic)[bewerken]

Deze versie beperkt zich tot correcte visuele weergave van document het op lange termijn. Dit formaat voldoet aan de basisspecificaties van de ISO 19005-specificatie en wordt gebruikt als analoge (papieren) documenten en afbeeldingen worden gedigitaliseerd door middel van scanning, of als bestaande digitale documenten niet correct over te zetten zijn naar PDF/A-1a. Dat kan het geval zijn als ze gemaakt zijn met oude software, als er legacy fonts in zijn opgenomen, of omdat er bijvoorbeeld wiskundige vergelijkingen in staan.[1]

PDF/A-1a (accessibility)[bewerken]

Dit is een uitgebreidere versie van het formaat PDF/A-1 waarbij ook logische documentstructuren (koppen, alinea’s, etc.) weergegeven kunnen worden. Deze versie is bedoeld voor documenten die digitaal ontstaan zijn. Het voldoet aan alle specificaties van de ISO 19005-specificatie. Gebruikte lettertypes worden ingebed in het bestand. Hiervoor wordt Unicode gebruikt. Unicode is een internationale standaard voor de identificatie van grafische tekens en symbolen. Op deze manier kan men er zeker van zijn dat het lettertype later nog beschikbaar is. Het maakt deze documenten ook doorzoekbaar. De versie PDF/A-1a bewaart alle structurele en semantische eigenschappen van het document. Het maakt gebruik van zogenaamde ‘Tagged PDF’ (ook wel bekend als gelabelde PDF). Deze labels beschrijven de natuurlijke leesvolgorde van het PDF-document. Zowel ‘Tagged PDF’ als Unicode zorgen ervoor dat de logische structuur en inhoud van de tekst in de natuurlijke leesvolgorde wordt behouden.[1]

Voordelen[bewerken]

  • PDF/A is een van de weinige documenttypes die op lange termijn eenzelfde weergave van het document kunnen garanderen. Documenttypes zoals .doc (van Microsoft Word) zijn vaak zelfs niet in staat gedurende één softwaregeneratie dezelfde weergave te garanderen.
  • De XMP-structuur levert vaak betere resultaten dan bijvoorbeeld XML. XML garandeert namelijk geen visuele weergave.
  • PDF/A is als een standaard gedefinieerd. Dit is bijvoorbeeld niet het geval bij TIFF (een ander archiveringsformaat voor o.a. foto’s) waardoor er heel wat productspecifieke TIFF-varianten bestaan.

Nadelen en kritiek[bewerken]

  • Het is niet ideaal om een standaard zonder bijbehorende referentie-implementatie te gebruiken.
  • De richtlijnen voor het opslaan van klantspecifieke metadata in XMP-extension-schemata waren aanvankelijk onvoldoende gespecificeerd.
  • In ieder bestand wordt het gebruikte lettertype opgeslagen. Hierdoor zijn de bestanden groter dan een equivalent standaard PDF-bestand. Wanneer een groot aantal documenten wordt opgeslagen waarbij al de documenten allemaal eenzelfde lettertype gebruiken, is het niet efficiënt om in elk bestand het lettertype op te slaan.

Uitbreidingen en de toekomst[bewerken]

Om de wereld kennis te laten maken met de PDF/A hebben vijf Duitse en Zwitserse softwarebedrijven in 2006 het Competence Center (www.pdfa.org) opgericht. Via deze instantie kunnen de gebruikers en producenten hun ervaringen uitwisselen. Er kwamen dan ook al snel enkele fouten aan het licht. In 2007 werd een uitgebreide standaard uitgebracht die deze fouten de wereld uit hielp. Deze uitbreiding staat bekend als Technical Corrigendum 1. Om de PDF/A-standaard nog verder te preciseren is momenteel Technical Corrigendum 2 in de maak.

Daarnaast werkt men ook aan een nieuwe versie van de PDF/A: de PDF/A-2. Dit is geen echte opvolger maar eerder een verdere ontwikkeling aangezien het anders in tegenspraak zou zijn met het feit dat de PDF/A-1 lang zou moeten blijven bestaan. In de PDF/A-2 moet het mogelijk worden om de modernere functies van de normale PDF te gebruiken.

Het aanmaken van een PDF/A-bestand[bewerken]

Om een PDF/A-bestand te maken, is het eerst en vooral belangrijk dat men zich aan de voorwaarden houdt waar een PDF/A-bestand aan moet voldoen. Daarna zijn er twee mogelijkheden:

  1. In sommige programma’s is het mogelijk om een bestand rechtstreeks op te slaan als PDF/A-document. Onder meer OpenOffice.org, LibreOffice en Word (vanaf versie 2007) ondersteunen exporteren naar PDF-formaat.
  2. Je kan een bestaand document met afzonderlijke software converteren naar een PDF/A-bestand. Een voorbeeld van dergelijke software is PDF Creator.

Wanneer men nadien een PDF/A-document wil openen, is het belangrijk dat het programma het PDF/A-formaat ondersteunt. Een voorbeeld van zo een programma is Adobe Reader.

Externe links[bewerken]

  • Thomas Merz, 2010, Pdf’jes als archief, C’t magazine voor computertechniek, januari/februari 2010
  • Olaf Drümmer and Alexandra Oettler and Dietrich von Seggern, 2007, PDF/A in a nutshell: long term archiving with pdf, Berlijn, callas software
  • Livnara Consulting, 2009, PDF-autoriteit
  • Avas Systemen, PDF/A, http://www.avas.nl/home.php?nodeid=118, (geraadpleegd op 6 april 2013)

Referenties[bewerken]

  1. a b c Colin van Oosterhout. Op weg naar duurzame archivering, White paper over archivering in PDF pagina's 11-12. Adobe Systems Benelux B.V. (2009)