PDF wird 20 Jahre alt
Mein Glückwunsch!
Vielfalt kann verwirrend sein: docx, odt, pages, indd – so lauten nur einige der Datei-Endungen digitaler Textdokumente und jede von ihnen verlangt eine ganz bestimmte Software. Ohne das passende Programm lässt sich das Dokument nicht öffnen. Als Einheitsformat bietet sich das „Portable Document Format“ (PDF) an, das in diesem Monat 20 Jahre alt wird […]
Vielfalt kann verwirrend sein, und dank PDF gibt es noch ein (zum glück inzwischen standardisiertes) format mehr, dass eine bemerkenswert fette anwendung braucht, um einfach nur gelesen oder gedruckt werden zu können. Natürlich ist „Adobe“ (englisch für „ungebrannter lehmziegel“) der meinung, dass das…
[…] und nach Angaben seines Erfinders das meistgenutzte Dateiformat der Welt ist.
…das meistgenutzte dateiformat der welt ist, was heise in seiner reklamebeflissenheit auch gleich anmerkungslos so wiedergibt. Es ist nicht gerade so, dass ich wenig PDFs habe, es sind… moment…
$ find ~ -name '*.pdf' | wc -l
856
…immerhin 856 dateien. Allerdings habe ich in meinem persönlichen verzeichnis…
$ find ~ -iname '*.jpg' | wc -l
39556
…doch immer noch mehr JPEG-bilder. Und…
$ find ~ -iname '*.html' | wc -l
10982
…HTML-dateien. Ich bitte um beachtung dafür, dass ich mit meiner schnellen suche einige HTML-dateien (mit der verbreiteten namenserweiterung .htm
) und einige JPEG-bilder (mit der erweiterung .jpeg
) noch nicht einmal mitgezählt habe. Dennoch ist klar, dass es zumindest auf meiner festplatte ein paar dateiformate gibt, die wesentlich verbreiteter sind als das moppelige dateiformat PDF — und damit ist auch klar, dass der blah vom „meistgenutzten dateiformat“ eben einfach nur der blah eines dummen und verdummenden reklameheinis ist.
„Der Traum vom papierlosen Büro ist leider immer noch nicht wahr geworden“, sagt Ulrich Isermeyer, Münchener Manager bei Adobe, dem kalifornischen Software-Unternehmen, wo PDF vor zwei Jahrzehnten entwickelt wurde. Mit seinen umfassenden Möglichkeiten könne PDF diese Vision aber umsetzen.
Wer visjonen hat, sollte besser zum arzt gehen. Der „traum“ vom papierlosen büro lässt sich auch mit textdateien umsetzen — und wenn etwas mehr semantische auszeichnung für die effizjente verarbeitung erforderlich ist, dann bietet sich altmodisches SGML oder moderneres XML an. (Natürlich mit einer anwendergerechten benutzerschnittstelle erstellt.) Ein format wie PDF, das kaum erweiterungen um strukturierte, automatisch verarbeitbare semantische auszeichnungen unterstützt (wenn wir einmal von einer schlichten verschlagwortung absehen), aber dafür eigens dazu ersonnen wurde, eine druckvorstufe zu sein und darin PostScript abzulösen, ist für die prozesse in einem papierlosen büro eher als hemmschuh zu betrachten. Außer natürlich, die „papierlosen“ dokumente werden ausgedruckt… 
Adobe-Gründer John Warnock begann das Projekt 1990 mit dem Ziel, eine universelle Sprache für den Austausch von Dokumenten zu schaffen: Diese sollten beim Empfänger genauso aussehen, wie sie der Absender gestaltet hat, mit denselben Schriftarten und identischem Layout über alle Betriebssysteme und Geräte hinweg.
Der zweck dieses formates, das eben noch für das „papierlose büro“ dienen sollte, war es also, einen nachfolger für PostScript zu entwickeln. Für alle situazjonen, in denen die gestaltung wichtiger als der inhalt ist.
Als dann am 15. Juni 1993 die Software Acrobat 1.0 erschien, stieß dieses erste PDF-Programm auf keine große Begeisterung. Das Paket bestand aus einem Werkzeug für das Erstellen von PDFs, aus dem Reader für das Lesen von PDFs und aus dem „Distiller“ für die Umwandlung von Dateien in dem damals für die Druckindustrie wichtigen Technikstandard Postscript in PDF. Denn PDF sollte auch die so genannte Druckvorstufe unterstützen, als digitales Layout für den Druck von Broschüren oder Büchern.
Als das erste programm erschien, mit dem man PDFs erzeugen und lesen konnte, stieß das auf keine so große begeisterung, weil das davon gelöste problem bereits mit vorhandenen formaten gelöst werden konnte. Kein wunder, dass niemand lust dazu verspürte, für eine objektiv sinnlose softwäjhr weiteres geld zu verbrennen. Deshalb wurde es erforderlich…
Der Siegeszug von PDF begann erst, als sich Adobe 1994 entschloss, den Reader kostenlos bereitzustellen. Damit wurde die Voraussetzung geschaffen, das neue Format auf Millionen von Computern und mobilen Geräten nutzen zu können. Seit 1995 gibt es den Reader als Erweiterung für den Web-Browser, so dass PDF-Dokumente auch im Internet eine wachsende Verbreitung fanden.
…das leseprogramm für PDF-dokumente kostenlos anzubieten. Seitdem haben sich menschen langsam daran gewöhnt, dass sie handbücher und vergleichbare dokumente in form von PDFs erhalten. Damit PDF besser ins web passt, wurde es ferner um lustige funkzjonen erweitert, zum beispiel um JavaScript, eingebettete animazjonen und 3D-modelle sowie einem ersatz für HTML-formulare. Dass in folge dieser bestrebung das brauser-plackin von „Adobe“ wegen seiner diversen sicherheitsprobleme zu einem lieblingsspielzeug der internetz-kriminellen geworden ist, spielt in diesem reklametext keine rolle.
Seit 2008 ist PDF ein ISO-Standard. „Damit gehört PDF nicht mehr der Firma Adobe, wir haben das an die ISO übergeben“, sagt Isermeyer. Demnächst steht eine Überarbeitung des Standards an, rund 500 verschiedene Unternehmen sind daran beteiligt. Neben Adobe bieten inzwischen auch viele andere Software-Unternehmen Computer-Programme und Smartphone-Apps an, mit denen sich PDF-Dokumente erzeugen, bearbeiten und anschauen lassen.
Erfreulicherweise ist PDF seit 2008 ein „freies“ format, was HTML schon 1992 war — und seine technische grundlage, SGML, sogar schon 1986. Das ist vermutlich auch der tiefere grund dafür, dass sehr zum bedauern von „Adobe“ die startseite einer webpräsenz immer noch index.html
heißt und nicht etwa index.pdf
. Es wird gehofft, dass sich dieser zustand mit den wischofonen demnächst ändert, denn wenn das internetz im händi ist, dann ists gehirn im arsch.
Für bestimmte Einsatzzwecke gibt es inzwischen Varianten wie PDF/E zur Einbindung von interaktiven 3D-Modellen oder PDF/A für die Langzeitarchivierung. „Auch in 50 Jahren ist ein als PDF/A gespeichertes Dokument noch lesbar“, sagt Adobe-Manager Isermeyer.
Bei „Adobe“ gibt es ganz große hellseher, die genau wissen, dass ihr dokumentformat in 50 jahren noch irgendwie lesbar sein wird. Diese beachtliche präkognitive aussage wird nur unwesentlich dadurch geschmälert, dass das gleiche für reine ASCII-texte und für typische „Markup“-sprachen wie XML, SGML und HTML ebenfalls gilt, nur dass der beim programmieren erforderliche aufwand beim extrahieren des textes aus den meta- und formatierungsinformazjonen wesentlich geringer ist.
Skeptischer ist da der Langzeitarchivierungsexperte der Deutschen Nationalbibliothek in Frankfurt am Main, Tobias Steinke: „Wir sind der Meinung, dass man nicht seriös vorhersagen kann, wie lange ein Dateiformat gültig ist, kein Dateiformat ist für die Ewigkeit.“ Für ihren gesetzlichen Auftrag, neben Büchern auch alle digitalen Publikationen aufzubewahren, erstellt die Bibliothek daher Metadaten zu jedem Dokument, um rechtzeitig zu erkennen, welche Art von Dokumenten in ein aktuelleres Format konvertiert werden sollte. Aus Sicht des Experten sind offene und standardisierte Formate grundsätzlich besser für die Archivierung geeignet als nur von bestimmten Firmen gepflegte Formate. „PDF/A ist da für uns schon eine Erleichterung, wir waren auch an der ISO-Standardisierung beteiligt.“
Immerhin kommt da auch mal ein keck eingeschobenes, skeptisches wort in den reklametext — das hätte ich nach dieser reinen reklamewüste gar nicht mehr erwartet. Aber gerade bei Heise sollten die leute doch wissen, was von langfristigen prognosen in sachen kompjutertechnik zu halten ist.
Negative Schlagzeilen hat die 20 Jahre alte Technik immer wieder mit Sicherheitslücken gemacht. „PDF ist eine komplizierte Bestie, ein Format mit so vielen Funktionen, dass jede von bösen Jungs als Angriffsfläche missbraucht werden kann“, sagt Marc Rogers, Sicherheitschef der Hackerkonferenz Defcon und Malware-Forscher beim Software-Spezialisten Lookout. In 20 Jahren habe es aber auch einiges an Verbesserungen in dieser Hinsicht gegeben, etwa die Absicherung in einer Sandbox-Struktur und mehr Transparenz. Wichtig ist aber auch, dass die Anwender stets die aktuellste Version der Reader-Software installiert haben und Sicherheits-Updates nicht als lästige Unterbrechung wegklicken.
Eventuelle sicherheitsprobleme, die mit der komplexität des inzwischen sehr aufgedunsenen PDF-formates zwangsläufig einhergehen — komplexität in der softwäjhr ist immer das genaue gegenteil von sicherheit — führen nur zu einer erhöhten verantwortung des anwenders, immer aktuelle softwäjhr zu benutzen. Dass sie eine alternative zum leseprogramm von „Adobe“ benutzen könnten, die in den meisten fällen völlig ausreicht — ich verwende seit jahren „evince“ zu diesem zweck — und die zudem schneller startet, sich leichter bedient und alles das nicht kann, was in kaum einem dokument benutzt wird, aber immer wieder für angriffe von kriminellen idjoten missbraucht wird, bedarf ebenfalls keiner weiteren erwähnung. Wäre ja schade, wenn die leute beim öffnen eines dokumentes nicht mehr die firmierung „Adobe“ in einem frech aufpoppenden scheißfenster sehen würden, das ihnen die wartezeit für den start des programmes ein bisschen vertreiben soll. Wir brauchen alle mehr reklame auf unseren desktops!
Das neue Format sei inzwischen im Wesentlichen fertig entwickelt, sagt Isermeyer. Beim Dateiumfang oder der Geschwindigkeit gebe es aber noch Möglichkeiten zur Optimierung, ebenso bei der Unterstützung von Spezialfunktionen. Die Version 12 von Adobe Acrobat dürfte im nächsten Jahr erscheinen – offizielle Informationen gibt es dazu noch nicht. Der Acrobat soll weiterhin auch als Einzelpaket verkauft werden, während Adobe bei Photoshop und anderen Kreativwerkzeugen jetzt auf Software as a Service setzt. Gut vorbereitet sei PDF auf die Zukunft des Webs, sagt Isermeyer: „HTML5 und PDF ergänzen sich wie Ebony und Ivory.“
Natürlich ist PDF gut vorbereitet für die zukunft der kriminalität im web. Es wird genau so viele angriffsvektoren bieten wie das zu einer laufzeitumgebung verkommene HTML5, das kaum noch zur semantischen auszeichnung von textueller informazjon dienen soll. Insofern ergänzen sich HTML5 und PDF wie pest und cholera.
(Peter Zschunke, dpa) / (bsc)
Welcher teil von der DPA ist, zeigt sich beim lesen. DPA = aus der PResseerklärung direkt in den redakzjonellen teil vieler druckwerke, reklame für alle!
Unfassbar mies, Heise!