Autoren-Tipp: Buch und eBook aus einem Guss mit Pandoc (Gastbeitrag)

Das-Zen-von-Pandoc

›Pan‹ ist eine griechische Vorsilbe. Sie bedeutet so viel wie ‘alles’, ‘ganz‹ oder ‘gesamt‹. Im Pantheismus gibt es beispielsweise die Vorstellung, dass Gott eins mit ‘allem‹ sei, folglich also die ‘ganze‹ Welt Gott sei. Das Pantheon ist ein antikes Heiligtum, das ‘allen’ Göttern geweiht war. Und bei den Panamerikanischen Spielen nehmen Athleten aus ‘ganz’ Amerika teil. Der Name des Programms Pandoc steht für ‘Alle Dokumente’. Pandoc ist ein Universalkonverter, ein mächtiges Werkzeug, das seinem Besitzer die Macht über alle Dokumentenformate gibt. Denn mit Pandoc kann man alle möglichen Dokumentenformate ineinander umwandeln. Oder, um es ein wenig präziser zu formulieren: Pandoc kann 18 Ausgangsformate in 36 Zielformate umwandeln.

Man kann also beispielsweise ein Word-Dokument in HTML, eine LaTeX-Datei in EPUB oder eine HTML-Seite in ein OpenOffice-Dokument verwandeln. Das an sich ist schon eine phantastische Sache, die jeder zu schätzen weiß, der schon einmal einen Text aus einem Format in ein anderes umwandeln wollte. Doch seine eigentliche Macht entfaltet Pandoc, wenn man es zum zentralen Baustein einer Schreib- und Produktionsumgebung im Rahmen eines Single-Source-Publishingsystems macht.

Beim ›Single-Source-Publishing‹ möchte man sämtliche Inhalte in einer einzigen Quelle pflegen und daraus die jeweils benötigten Ausgabemedien erstellen. Das hat den Vorteil, dass die Inhalte nur an einer Stelle gespeichert werden und man folglich auch alle Änderungen nur in einer Datei vornehmen muss.

Beim Thema Self-Publishing sind vor allem die Ausgabemedien Buch und E-Book interessant. Um ein Buch herzustellen, benötigt man eine druckfähige PDF-Datei, die man an die Druckerei oder einen Print-On-Demand-Dienstleister weitergeben kann. Für die E-Book-Distribution braucht man mindestens eine Datei im EPUB-Format. Dieses Format wird von vielen E-Book-Readern angezeigt und sogar von Amazon auf seiner Kindle-Direct-Plattform akzeptiert. Nach dem Hochladen konvertiert Amazon die EPUB-Datei automatisch in sein proprietäres Format.

Mit Pandoc kann man druckfähige PDF-Dateien und E-Book-Dateien in den Formaten EPUB2, EPUB3 und FB2 erstellen. Pandoc unterscheidet sich dabei in vieler Hinsicht von anderen Lösungen, die ähnliches versprechen. So nutzt Pandoc beispielsweise das typografisch hervorragende Satzsystems LaTeX bei der Herstellung der Druckvorlagen. Damit steht dem Self-Publisher die ganze Macht von TeX zur Verfügung, ohne dass er die teilweise recht umständlichen und kryptischen Formatierungsbefehle von LaTeX erlernen muss. Denn idealerweise verwirklicht man ein solches Single-Source-Publishing, indem man Markdown als Ausgangsformat benutzt.

Markdown ist eine sehr einfache Auszeichnungssprache. Man verwendet sie, um Texte in einem einfachen Texteditor schreiben und auszuzeichnen zu können. Ein Texteditor ist kein WYSIWYG-Programm wie Word oder LibreOffice, sondern ein Werkzeug, mit dem man Plain-Text-Dateien erstellt. Plain-Text-Dateien haben den Vorteil, dass sie ganz gewiss noch in 100 Jahren in einem Computersystem problemlos lesbar sein werden.

Es gibt Texteditoren für alle Betriebssysteme. Unter Windows kann man zu Notepad greifen. In Mac OS X heißt ein ähnliches Programm TextEdit. Unter Linux gibt es GEdit oder Kate. Viele Texteditoren laufen auf allen Betriebssystemen. Bekannte Beispiele sind Emacs, Vim, Sublime Text oder der Atom Editor.

Mit Markdown kann man Texte semantisch auszeichnen, also nach ihrer Bedeutung. Überschriften sind also nicht an grafischen Merkmalen wie einer größeren oder fetteren Schrift erkennbar, sondern aufgrund einer Markierung, mit der eine bestimmte Textstelle als Überschrift markiert wird. Markdown hat den Anspruch, dass diese Markierungen den Lesefluss nicht stören dürfen. Sie sollen, wie die Markierung für Überschriften, möglichst unauffällig sein. In Markdown werden Überschriften mit dem Rautesymbol markiert. Überschriften der obersten Ebene mit einer Raute, der zweiten Ebene mit zwei Rauten und so weiter.

# Dies ist die Hauptüberschrift

## Dies ist eine Zusatzüberschrift

Dies ist einfacher Fließtext.

Wie Überschriften und Fließtext später im gedruckten Buch oder im E-Book erscheinen, wird erst bei der Konvertierung mit Pandoc entschieden. Um mit Pandoc eine Markdown-Datei in ein druckfähiges PDF sowie ein EPUB zu verwandeln, ruft man das Programm in der Kommandozeile auf. So ein Aufruf sieht zum Beispiel so aus:

$ pandoc text.md -o text.pdf
$ pandoc text.md -o text.epub

Der landläufige PC- oder Apple-Benutzer wird nun ein langes Gesicht machen und sich fragen, was eine Kommandozeile ist und welche Vorteile sie ihm bringt. Die Kommandozeile ist eine andere Art und Weise, ein Programm aufzurufen. Während man sich bei einer grafischen Oberfläche durch diverse Menü klicken muss, bis man ein spezielles Programm gefunden und aufgerufen hat, schreibt man in der Kommandozeile einfach den Namen des Programms und drückt die Enter-Taste – und schon startet das Programm.

Doch das ist natürlich nicht alles. Grafische Benutzeroberflächen wurden bereits Anfang der 80er Jahre des letzten Jahrhunderts erfunden. Wenn man also heute im 21. Jahrhundert noch mit der Kommandozeile arbeitet, dann muss das einen guten Grund haben. Und das ist auch der Fall. Die wahre Macht des Computer beginnt erst auf der Kommandozeile. Man kann zum Beispiel ein Kommandozeilen-Programm sehr viel leichter mit anderen Programmen kombinieren. Kommandozeilenprogramme sind skriptfähig, das heißt man kann alle Konfigurationsparameter, die man benötigt, in einem Skript zusammenfassen. Später muss man nur noch das Skript aufrufen und kann gewiss sein, dass alle gewünschten Parameter richtig eingestellt sind. In einem Programm mit grafischer Oberfläche muss man dagegen unter Umständen jedesmal in diversen Menüs bestimmte Einstellungen vornehmen, bevor man das gewünschte Ergebnis erhält.

Mit Kommandozeilenprogrammen lassen sich komplexe Abläufe sehr einfach automatisieren. Mit Pandoc kann man die reproduzierbare Konfiguration von einem Dutzend Parameter sowie die Erstellung der PDF-Druckvorlage und des entsprechenden E-Books soweit automatisieren, dass man nur noch vier Buchstaben in die Kommandozeile tippen muss:

$ make

Alles andere geschieht dann skriptgesteuert mit absolut reproduzierbaren Ergebnissen von allein. Nutze die Macht, um ohne Kampf zu siegen! Das ist das ZEN von Pandoc.

Wie man Pandoc einsetzt und eine Produktionsumgebung für Bücher und E-Books aufbaut, wird Schritt für Schritt in ›Das ZEN von Pandoc‹ erklärt. Das Buch enthält eine umfassende Einführung in Markdown, erklärt die Nutzung von Pandoc und gibt detaillierte Tipps zur Automatisierung des Produktionsprozesses.

Jan-Ulrich Hasecke