Ingebedde bestandsbijlages in PDF-documenten (1)

Het PDF-bestandsformaat is feitelijk een container. Een kenmerk van een container is dat je er dingen in kunt stoppen. Via Adobe Acrobat kunnen we zogenaamde ingebedde bestandsbijlages in een PDF-document stoppen. Een paar voorbeelden: ik kan een CAD-tekening omzetten naar PDF maar tegelijkertijd aan die PDF het oorspronkelijke brondocument (een DWG-bestand) toevoegen. In zo’n geval is het PDF-document altijd te openen voor iedereen die de gratis Adobe Reader heeft en niet over een CAD-viewer beschikt. De PDF geeft de exacte, finale en niet aan te passen representatie van het CAD-document weer. Mocht iemand het oorspronkelijke bestand willen aanpassen, dan kan diegene de bijlage uit de PDF halen en in een andere applicatie zoals bijvoorbeeld Bentley Microstation verder bewerken. Adobe Acrobat biedt dus de mogelijkheid om zowel het niet-reviseerbare als het wel-reviseerbare document in één enkele PDF-container te distribueren. Hetzelfde kan gedaan worden met Microsoft-Office documenten of met Open Office documenten. In dit laatste geval spreken we over een hybride PDF. Zo’n hybride PDF voldoet uitermate goed aan de plannen en richtlijnen waar de Nederlandse overheid aan werkt. Interoperabiliteit is hierbij het toverwoord.
Er is een tweede reden waarom ingebedde bestandbijlages in een PDF-document nuttig zijn. Veel documentformaten zijn op zich zelf helemaal niet goed te beveiligen. Door een niet-beveiligd bronbestand in een PDF document te stoppen en deze vervolgens te beveiligen met wachtwoorden of encryptie, wordt de beveiliging gewaarborgd. Een PDF-document is vrijwel autonoom. Dat wil zeggen dat elementen als lettertypes, validaties en calculaties (in het geval van PDF-formulieren) en ook beveiliging altijd opgesloten zitten binnen de PDF-container. Dit gegeven maakt een PDF-document onafhankelijk van een netwerk of distributiemechanisme. Meer concreet: iemand kan een PDF-formulier offline invullen en alle berekeningen en validaties blijven nog steeds werken. Datzelfde geldt voor beveiliging. Ook als een PDF-document buiten de firewall van een organisatie wordt gedistribueerd (en bijvoorbeeld op een USB-stick op de achterbank van een lease auto van een justiemedewerker blijft slingeren) blijft de beveiliging van kracht. Diezelfde autonomiteit van PDF is ook bruikbaar voor de langdurige bewaring van elektronische documenten. Sterker nog: het is de reden waarom PDF/A een ISO-standaard voor archivering is.
Niet ieder bestandstype kan worden ingebed in een PDF-document. Scripts, executables en zelfs ZIP-bestanden zouden mogelijk malafide inhoud kunnen bevatten en schade (door bijvoorbeeld virussen) kunnen aanrichten. Om die reden zit er in Acrobat en in de Adobe Reader een zogenaamde trustmanager die onder andere het doel heeft om niet-vertrouwde inhoud uit PDF-documenten te weren.
In mijn volgende blog zal ik laten zien hoe je een bijlage aan een PDF-document kunt toevoegen en hoe hyperlinks naar ingebedde bijlages kunnen worden gebruikt.