Automatische Erzeugung von HTML, EPUB und PDF aus einem OpenOffice-/LibreOffice-Dokument

Automatische Erzeugung von HTML, EPUB und PDF aus einem OpenOffice-/LibreOffice-Dokument


Ja, und wieder geht es um die
Automatisierung des digitalen Publizierens mit frei lizenzierter Software. In diesem Video sollen aus einem
OpenOffice-/LibreOffice-Dokument verschiedene Ausgabe-Formate automatisch
erzeugt werden, namentlich HTML, PDF und EPUB. Und um dies zu tun, werde ich jetzt
erstmal die aktuelle Version der Software runterladen, an der ich
arbeite, und zwar kommt die ihn vorgefertigter Form, also in einem
Package, das schon entsprechend für die
Ausführung vorbereitet ist, und zwar auf meiner Webseite gibt es die für mich – also, für meine JavaVM 1.6
passende Version für mein GNU-Betriebssystem, welche ich hier jetzt auch schon
runtergeladen habe – das machen wir mal hier weg… und welches ich jetzt dann
gleich entpacken werde… Hier entpacken. So, und in diesem Ordner, da befinden sich eine Reihe von Tools, die flexibel und beliebig kombiniert werden
können, was auch ein Hauptanliegen und ein
Hauptziel der Software ist, dass solche automatisierten
Aufbereitungs- Prozesse, dass die eben, ja, aus verschiedenen
Bausteinen individuell zusammengesetzt werden können und dass man da halt eine große Flexibilität dadurch erreicht, dass die Schnittstellen zwischen diesen Tools eben immer XML-basierte
Dateien sind, sodass quasi über viele bereits
existierende Programme und auch über die Programmierschnittstellen, die es
in den diversen Programmiersprachen zur XML-Verarbeitung gibt, dass die alle genutzt werden können und
kombiniert werden können, denn XML ist ja dafür
konzipiert, Dateien maschinenlesbar zu machen, anstatt – dass man halt Texte parsen muss und eben da auch Strukturinformationen
beispielsweise nicht in einem vergleichbaren
Detaillierungsgrad integriert werden können, wie es
bei XML der Fall ist. Und was ich jetzt als erstes mache:
es gibt hier einen Ordner „odt2html“, das ist also das Tool, das eine ODT – also ein OpenOffice-/LibreOffice-Dokument – zu HTML konvertieren kann, es
gibt hier aber auch einen Ordner „templates“, und diese Templates, die spielen an der
Stelle eine ganz wichtige Rolle, weil dieses Template hier, dieses „template1“, das ist eine Dokumenten-Vorlage für das OpenOffice- oder LibreOffice- Dokument, welches ich schreiben und
aufbereiten will. Und diese, diese…ja, also, dass überhaupt so eine Dokumenten-Vorlage zum Einsatz kommt: die hat ganz einfach den Hintergrund, dass in dem Template Stilvorlagen vordefiniert sind und letztendlich nur die Stile in der Aufbereitung berücksichtigt
werden, die in dem Template vorgegeben sind,
also für die automatisierte Verarbeitung ist das ein ganz großer
Vorteil nämlich, denn dadurch stellt diese
Dokumentenvorlage eine Art Übereinkunft dar, die zwischen demjenigen,
der das Dokument entweder schreibt und/oder auch formatiert, und demjenigen, der dann die Aufbereitung
macht – in dem Fall hier diese automatisierte Software, indem nämlich
die zu verwendenden Strukturierungselemente,
Gestaltungselemente durch die Vorlage vorgegeben sind und entsprechend die Verarbeitungssoftware darauf
reagieren kann wenn man sich daran hält. Und was
passiert, wenn ich das hier öffne? Also, in dem Fall geht jetzt hier mein
vorinstalliertes OpenOffice auf, und die Besonderheit bei den
OpenOffice- oder LibreOffice-Dokumentenvorlagen, die besteht eben
darin, dass quasi jetzt alle… Also, der Inhalt der Vorlage, der
wird dann halt wie ein normales Dokument hier auch geladen, und man sieht auch, dass diese
Datei hier noch nicht gespeichert ist, dieses
Dokument, weil ich das jetzt nämlich zunächst einmal speichern muss, um aus der Vorlage ein konkretes Dokument werden zu lassen. Und man sieht
eben auch, dass mir hier schon vorgelegt wird, es als ein
konkretes Dokument zu speichern und nicht mehr als eine Vorlage, das bedeutet,
die Vorlage wird automatisch in ein Dokument übersetzt und ich
arbeite dann – also, es wird mir automatisch ein
Dokument aus der Vorlage generiert, und deswegen werde ich das jetzt hier erstmal abspeichern und dann auch noch eben hier etwas zu
dem OpenOffice oder LibreOffice sagen, welches in dem Fall jetzt als ein
Front-End dient, also als ein „What You See Is What You Get“- Editor für den Text, der aber auch semantisch funktionieren soll und funktionieren muss, denn semantisches Markup ist für die
automatisierte Aufbereitung ein ganz großer Vorteil, weil dann nämlich eben keine komplexe Layout-Interpretation vorgenommen
werden muss oder eine Layout- Übersetzung, weil man wird dann sehen, dass
eben halt aufgrund der semantischen Auszeichnung eine
Übersetzung stattfindet und darauf die Aufbereitung basiert. Und ich werde jetzt erstmal folgendes
machen: ich werde hier auf diesen Knopf drücken, da bekomme ich dann nämlich die
die vordefinierten Stile angezeigt als hier so ein
extra Fenster, und idealerweise werde
ich mir das hier gleich mal einrichten auf der linken Seite als einen Seitenbereich, und dann stelle ich auch noch um, dass ich
jetzt hier nicht die automatisch im Dokument immer vorhandenen Stile
sehen will. Also, man kann hier verschiedene Dinge
auswählen: es gibt Stile, die für Textblöcke gedacht sind, für Buchstaben- Auszeichnung, für strukturelle Auszeichnung wie
beispielsweise Überschriften, und was ich hier aber mache, machen werde, ist, auf die „Custom Styles“ stellen, weil diese „Custom Styles“, das sind
diejenigen, die ich mir selber angelegt habe, die habe ich jetzt aber gar nicht
selber angelegt, sondern die hat mir die Dokumenten-Vorlage
hier automatisch hereingeladen, und das sind auch diejenigen, die ich alleinig nur verwenden darf. Also, wenn ich
andere verwende, dann werden die einfach ignoriert, da kommt am Ende dann
nur der rohe Text dabei heraus. Also, das hier sind quasi von diesem „template1“ die Stile, die mir zur
Verfügung stehen, um meinen Text zu strukturieren und auszuzeichnen. Und dann werde ich auch noch etwas Weiteres tun, nämlich mal
in den „Toolbars“ werde ich hier diese Direktformatierungs-Leiste, die werde ich ausblenden, weil Direkt- formatierung ist hier ganz ohne Effekt, und es macht eigentlich eh keinen Sinn, das zu verwenden, wenn ich jetzt nicht
gerade ein Dokument von nur 1-2 Seiten erstelle oder wenn ich zum Beispiel DTP-, also Desktop-Publishing-Aufgaben wahrnehmen möchte. Aber bei allen
längeren Texten macht es halt keinen Sinn, so Direktformatierung zu haben, sondern sich auf diese, ja, sich auf eine, an eine semantische Auszeichnung des Textes zu gewöhnen. Jetzt sehe ich aber gerade, dass ich
ungünstigerweise nicht mehr sehe, was der aktuelle
Stil ist. Ich weiß gar nicht, ob in der neueren LibreOffice-Version, ob – wenn ich hier bei „View“ → „Toolbars“ → „Formatting“ ausschalte, ob dann nur hier die Direktformatierung weggeht oder auch hier diese Stil-Ansicht, weil die ist ja
weiterhin wichtig oder zumindest brauche ich die jetzt im Moment, um nämlich zu
zeigen, dass, wenn ich hier reingehe bei „Title“, dass das ausgezeichnet ist mit dem Stil „title“ und ebenso auch „Chapter“, das hat ein „chapter_heading“, und dann habe ich hier „paragraph_first“ und „paragraph“ – was in dem Fall keine
weitere Bewandnis hat, das wird bei der Aufbereitung im Moment ignoriert, nur ist das halt für mein WYSIWYG, dass ich halt hier sehe, dass das hier hübsch aussieht mit der Einrückung der neuen Absätze. Und heutzutage ist es eigentlich
relativ gebräuchlich, dass der erste Absatz nicht eingerückt wird, und man
sieht, also, hier gibt es weitere Elemente wie „section_headings“, also – Überschriften von Abschnitten und Unterabschnitte und Absätze. Und so ist dann hier alles ausgezeichnet, und man kann auch hier sehen, dass hier keine manuellen Umbrüche vorhanden sind, sondern hier, also, hier werden ja die
nicht druckbaren Zeichen, die unsichtbaren Zeichen angezeigt. Dieses „P“ hier, das zeigt also: hier ist
quasi ein Enter drin, was dann aber, also, wenn ich Enter drücke, hat das
hier in dem Fall die Auswirkung, dass ich eben einen neuen Absatz beginne, Leerzeilen werden auf die Weise nicht erzeugt, also, das sollte man sich generell abgewöhnen, Leerzeilen
erzeugt man nicht durch das drücken von Enter, und ich werde jetzt auch noch mal gerade Folgendes machen: ich werde das Template nochmal ein
zweites Mal öffnen, um ein neues Dokument zu beginnen, und werde jetzt mal alles rauslöschen, und dann auch mal kurz aufzeigen, was
passiert, wenn ich das komplett neu schreibe, also ich stehe jetzt hier
am Anfang mit „title“ und drücke jetzt Enter, und was dann passiert, ist, dass mir dieser
Abstand hier automatisch, nämlich semantisch über die Stil-… also, die konfigurierte Darstellung des Stils „title“ wird mir automatisch dieser Abstand
reingemacht. Letztendlich ist die Darstellung hier
im ODT-Dokument für die spätere Aufbereitung irrelevant, aber das ist halt, um hier einen gewissen visuellen Komfort
beim Schreiben zu bieten und man sieht auch, dass dieser „title“ so eingerichtet ist, dass, wenn ich Enter drücke, dass ich dann
anschließend zu dem nächsten Stil springe, weil wenn ich mit dem „title“ fertig bin
und Enter drücke, dann ist es so, dass halt ich wohl
offenbar etwas Neues anfangen möchte und nach dem Titel kommt in dem Fall hier ein Kapitel. Und jetzt bin ich gerade
dabei, den Kapitel- Titel einzugeben: „Einleitung“ zum Beispiel, und wenn ich jetzt
Enter drücke, dann springt das automatisch um auf den
ersten Absatz, auf die Stilvorlage des ersten Absatzes, und da werde ich jetzt hier mal einigen Text hier erzeugen, und jetzt drücke ich ein weiteres Mal Enter, und dann lande ich im nächsten Absatz, so geht das also hier weiter… Naja, das macht natürlich hier nicht zu viel Sinn, das von Hand
schreiben zu wollen, und so läuft hier die Gestaltung. Hier ist jetzt irgendwie gerade etwas schief gegangen, jetzt hat er hier… ist er hier umgesprungen auf
„paragraph_first“… Naja, das ist eigentlich irrelevant, weil
es eh nicht beachtet dann bei der Aufbereitung, allerdings kann ich auf diese Weise hier die Strukturierung des Textes vornehmen. Jetzt bin ich hier wieder – also, habe ich
wieder eine Kapitelüberschrift eingefügt, ich drücke Enter, und dann geht der Text eben weiter. Und insofern geht es eigentlich darum,
OpenOffice oder LibreOffice zu verwenden als Formatierungswerkzeug, weil das Schreiben an sich ist
eigentlich ja immer nur auf rohen Text begrenzt, also, das heißt: der auf Vorgang des Schreibens, der sollte so wenig wie
möglich mit Schriftsatz zu tun haben, sollte zu wenig wie möglich mit
Formatierung zu tun haben, denn alles das ist nachher eine Frage der Aufbereitung
und würde ja auch den Schreibfluss hemmen, wenn man da immer damit
beschäftigt ist, hier den Text zurecht zu ziehen. Was man aber durchaus machen kann, wenn
man das gleich beim Schreiben möchte, ist eben, strukturelle Informationen über den
aktuellen Abschnitt zu hinterlegen, zum Beispiel, wenn eine Hinweis-Box kommt oder
ein Zitat, das besonders eingerückt werden soll, dann kann man das eben mit solchen Stilen machen, und das ist dann eben auch semantisch, dass man das Aussehen über die Definition des Stils jederzeit dann nochmal ändern kann. Hier – jetzt sind die ersten… die ersten Absätze sind fett, was gar keine Bewandnis dann hat für
die Aufbereitung, aber, also, das ist in jedem Fall eben ein viel besseres
Konzept, wenn man viele 100 Seiten am Ende hat und dann etwas
anpassen muss, dass man das nicht an jeder Stelle einzeln von Hand machen
muss, vor allem, wenn das über mehrere
Seiten umbricht. Weil, wenn man nämlich jetzt überlegt,
ich würde hier in dieser ersten… auf dieser ersten Seite würde ich die Kapitelüberschrift auf 60 stellen, dann
würde das bedeuten, dass hier unten am Ende der Seite alles ein Stück nach unten rutscht, weil oben ja mehr Platz gebraucht wird, das bedeutet, alles verschiebt sich, und wenn ich halt hergegangen bin und habe meine Bilder, meine Texte von Hand
platziert, also durch Einrückungen von Enter oder so, dann kann ich natürlich
das ganze Dokument nochmal komplett überarbeiten und am Ende ist das Ergebnis eh so, dass es unbrauchbar ist für die E-Book-Erzeugung, also, in dem Fall EPUB, und für die PDF-Erzeugung ganz genauso, außer, ich will halt hier das direkt als PDF exportieren, allerdings habe ich da
eben dann auch keinen Einfluss darauf über die optische Auszeichnung, die ich hier von
Hand vorgenommen habe, hinaus. OK, aber dieses Dokument werde ich jetzt hier schließen, das hat ja jetzt nur zur kurzen Demonstration der Funktionsweise oder der Nutzungsmöglichkeiten von
OpenOffice oder LibreOffice als Front-End gedient, und wenn ich
jetzt hier quasi mein „Lorem ipsum“- Blindtext geschrieben habe, dann bin ich ja eigentlich auch soweit
fertig. Hier unten gibt es einen Text… Der Urheberrechtsvermerk, der ist nicht formatiert mit einem der hier definierten Stile und der wird am Ende
eben komplett wegfallen bei der Aufbereitung. Also, man sieht, hier hat er „Default“ genommen, dieser „Default“- Stil, der ist aus der Gruppe „Automatic“, und der fällt dann also weg, dieser Text. Na, wo ist jetzt wieder „custom“? „Custom Styles“. So, also dieses „dokument.odt“, das habe ich ja mir hier auf dem
Desktop abgespeichert, und jetzt werde ich die automatisierte
Aufbereitung anwerfen. Dazu muss ich erstmal und einmalig nur folgendes
machen: ein kleines Setup ausführen. Das lädt jetzt aus dem Internet mal ein paar
Dateien runter, die gebraucht werden, um XML zu
verarbeiten. Der Download ist künstlich
verzögert, weil nämlich relativ viele Anfragen an diese Seite gehen und das deswegen ausgebremst wurde. Dieser Setup-Schritt, der ist im Moment noch notwendig, aber der wird in Zukunft wohl entfallen, weil ich nämlich
die Dateien, die der hier gerade runterlädt, die werde ich womöglich dank der „W3C Document License“ mit in das Package aufnehmen können und dann wird
das schon alles halt von vornherein in dem Download
enthalten sein, sodass der hier nichts mehr runterladen muss, was vor allem auch den Vorteil hat, dass
keine Internetverbindung gebraucht wird. Aber in dem Fall hier muss das jetzt eben leider erstmal noch passieren und wie man auch sieht, in dem hier, ist, dass es hier zwei Shell-Scripts gibt, um einmal – um das OpenOffice-/LibreOffice-Dokument zu EPUB zu generieren und einmal zu PDF. Dabei ist es so, dass in
beiden Fällen das *.odt, also, dieses – ah, jetzt ist das Setup fertig – also, diese Eingabe-Datei „dokument.odt“, dass das in beiden Fällen erstmal zu HTML konvertiert wird und diesen Teil könnten sich
eigentlich beide Scripts teilen, und dann könnte man auch ein gemeinsames Script schreiben, das aus einer einzelnen Eingabe-Datei, also, aus einer *.odt, sowohl das EPUB als auch das PDF
automatisch erzeugt. Ich habe das jetzt erstmal noch nicht zusammengefasst, in
Zukunft könnte das vielleicht gemacht werden. Und jetzt werde ich halt mal beide
Programme von Hand ausführen müssen noch, also, gesondert ausführen müssen, und jetzt läuft das hier quasi gleich durch. Jetzt wähle ich das Dokument aus, was
ich aufbereiten möchte zu EPUB, und man sieht hier, also, dass hier halt die
verschiedenen Programme durchlaufen und hier in dem Fall bekomme ich jetzt hier diesen Dialog, wo ich mir das EPUB
konfigurieren kann. Also, ich habe dann hier eine einzelne – hier eine Eingabe-Datei, also eine HTML-Eingabedatei, die der schon erzeugt hat. Das ist
nämlich in dem Fall hier auch der gesamte Text
des Kapitels. Was ich hier reinschreibe auf dieser rechten Seite von der Zeile, das ist die Überschrift oder der
Eintrag, der Name, den das Kapitel bekommt im
Inhaltsverzeichnis des EPUBs, also ich gebe hier mal jetzt von Hand was anderes ein, nämlich „Kapitel 1“. Ich könnte jetzt auch hier weitere
zusätzliche HTML-Dateien mit dazufügen, zum Beispiel ein Cover, ja, aber an sich passt das hier ja jetzt eigentlich auch schon alles
und ich habe das mal gespeichert und drücke dann „Exit“, sodass der nächste Schritt kommt. Hier kann ich die Meta-Daten hinterlegen, anpassen. So, und ansonsten… ja, also, auf jeden Fall muss ich einen Identifier vergeben, der das Dokument weltweit eindeutig
identifiziert und auch eine Sprache, in dem Fall „Lorem ipsum“, jetzt weiß ich natürlich nicht, was hier gemäß RFC 3066 das Kürzel für Latein ist, aber ich werde hier
einfach mal dann sagen „deutsch“. So, gespeichert und „Exit“ und jetzt
läuft hier noch der Rest kurz durch, sodass ich
jetzt in dem frisch erstellten Ordner „temp“, also,
da habe ich jetzt hier lauter Zeugs, aber auch einen „epub“-Ordner, und in dem „epub“ habe ich hier „out.epub“. Das ist jetzt das Ergebnis der Aufbereitung, das werde ich jetzt mal gerade hier in den IceCat-Browser ziehen und das hier ist jetzt mein EPUB, und man kann halt auch sehen hier, das
Inhaltsverzeichnis und so weiter. Und natürlich ist das relativ
wenig, weil ja auch das Dokument relativ wenig enthalten hat, und der Urheberrechts-Vermerk, der nicht formatiert ist, der ist unten weggefallen, aber diese – die Überschriften und der Text und so weiter, der wurde stilistisch, sage
ich mal, so übersetzt in das E-Book, in das EPUB, wie das eben für das Template 1, also, für diese
Dokumenten-Vorlage in diesem speziellen Aufbereitungsprozess konfiguriert war. Und jetzt werde ich nochmal auch das PDF daraus erzeugen… In dem Fall per „odt2pdf1“. Dafür brauche ich ein
installiertes LaTeX, weil hier „pdflatex“ aufgerufen wird, da wird es womöglich noch andere PDF-Aufbereitungs-Backends in Zukunft geben, die unterstützt werden könnten. Und jetzt habe ich quasi auch
hier unter „latex“, habe ich hier aus derselben Datei, aus demselben ODT-Dokument, habe ich hier ein PDF erzeugt, wo dann auch so
Dinge wie das automatische Inhaltsverzeichnis und so weiter, das wird alles automatisiert eben hier eingefügt, und es ist auch so,
dass man hier sieht: hier gibt’s zum Beispiel eine leere Seite,
die Seite 4, was einfach damit zusammenhängt, dass neue Abschnitte, neue Buch-Bereiche, sage ich mal, das die immer auf ungeraden Seiten anfangen, nämlich, wenn man ein Buch aufschlägt, ist die erste Seite, die man ja sieht,
die Seite 1, das heißt, die Rückseite der Seite 1,
des Titels, dieser Titelseite, das sollte dann idealerweise leer sein, weil sonst muss man ja auf der linken Buchseite – findet man etwas zu lesen, was eigentlich, ja, den Beginn von etwas Neuem markieren soll und da ist
natürlich – wenn man ein Buch frisch aufgeschlagen
hat, ist der Buchblock, der ist dann auf der rechten Seite
und in der linken Hand hat man dann vielleicht den Buchdeckel, den vorderen Buchdeckel und halt
vielleicht noch die Titelseite, und in der rechten Hand hat man im aufgeschlagenen Buch dann den ganzen dicken Buchblock, deswegen, also, neue Sachen fangen
natürlich rechts an, weil das ist das, wo man draufschaut, und der Deckel, Deckel und Titelseite beispielsweise, also – diese Leerseiten, die werden hier automatisch mit eingefügt. Das ist zum Beispiel auch etwas, was man – also, erstmal nicht bekommt, wenn man das ODT direkt nach PDF exportiert. Klar kann man sich das
bestimmt auch einrichten, da habe ich gar kein Zweifel daran, allerdings ist es so, dass ich durch die Automatisierung, die ich hier habe, mit lauter flexiblen Aufbereitungsbausteinen, dass ich
dort die Möglichkeit habe, auch einzelne Bausteine und
Komponenten dazwischenzuschalten, die halt noch irgendwelche Aufgaben wahrnehmen,
die meinetwegen irgendwelche Ersetzungen oder Einfügungen vornehmen oder Transformationen vornehmen, Ergänzungen aus einer Datenbank oder Ähnliches, das sind halt Möglichkeiten, die mir
hier dann geboten sind und die ich bei einem direkten PDF-Export eben nicht habe. So, und was ist da noch das zukünftige Ziel eben jetzt? Nachdem also aus einer Quelldatei hier schon verschiedene Ausgabeformate erzeugt werden können – da fällt mir gerade ein, ich habe ja anfangs gesagt, dass auch HTML erzeugt werden soll. Das ist ja
offensichtlich, dass HTML als eine konkretere Form von
XML hier stark beteiligt ist und in
dem Fall habe ich das – also, war das natürlich die Ausgangsbasis
für hier: die Aufbereitungs-Schritte, indem ich halt hier beispielsweise – ja, oder, ich mach’s nochmal auf. Hier habe ich jetzt eine HTML-Seite aus dem ODT quasi auch bekommen, weil das nämlich dann die Grundlage war
für die weiteren Schritte, das heißt, das wird automatisch miterzeugt. Und was die zukünftigen – die zukünftigen Features sind, die hier wünschenswerterweise noch unterstützt werden sollten: also, im
Moment ist es ja offensichtlich so, dass eben die Aufbereitungsprozesse, dass die mit Shell-Scripts aneinandergeklebt sind, miteinander verbunden
werden über Shell-Scripts, um die Automatisierung zu
bewerkstelligen, und das soll idealerweise in nächster Zeit ersetzt werden durch eine komplett javabasierte Aufruf-Möglichkeit, sodass quasi auch die Aufrufe,
dass die nicht betriebssystem- und plattformabhängig sind, sondern eben Java – eine installierte Java-VM völlig ausreicht, um eben zu dem selben Ergebnis zu kommen, weil im Moment ist es so, wie man hier ja sieht, ich habe
hier verschiedene vorbereitete Packages jeweils für GNU-basierte
Betriebssysteme, GNU-ähnliche – also, unixoide Betriebssysteme mit Linux-Kernel, die eben mit den Shell-Scripts
sehr wohl und sehr gut zurechtkommen, und dann habe ich halt
hier noch Windows-Packages, die haben die Automatisierung
über solche Scripts nicht. Also, dort muss man alle die Tools im Prinzip von Hand bedienen,
und es macht nicht wirklich viel Spaß, weswegen es eben vielleicht in
Zukunft so sein soll, dass alle diese Bausteine über eine integrierte
Verwaltung, über ein Aufbereitungsprozess-Management verwaltet werden können, sodass das dann eben auch plattformunabhängig
möglich ist und das vor allem auch der Benutzer die Möglichkeit hat, die einzelnen
Bausteine individuell zu konfigurieren. Zum Beispiel, um halt zum Beispiel das Layout individuell anzupassen, das
dann für die PDF-Erzeugung oder für die E-Book-, EPUB-Erzeugung zugrunde gelegt werden soll. Damit das alles möglich ist, ist eben so
eine Verwaltung ganz gut. Auch, um das
System insgesamt zu konfigurieren und einzurichten, um den Status von dem System zu
überprüfen, also, ob es auch im Moment funktionstüchtig ist, und es wäre natürlich auch gut, eine Projektverwaltung zu haben, dass man seine Buchprojekte, die man dadrin hat, seine Textprojekte, dass man die darin einrichten und verwalten kann
und dass man die auch erneut generieren kann, ohne jedes Mal alles – also, ohne eben, dass die – dass immer die Konfigurationen und die
Einrichtung neu vorgenommen werden muss, sondern, dass man einfach nur eine neue Eingabe-Datei hat, also – oder eine modifizierte,
veränderte, aktualisierte Eingabe-Datei hat, die Konfiguration bleibt aber
die alte, und dann wird quasi die Konfiguration nur noch mal neu angewendet, und
die Ausgabeformate werden neu erzeugt. Auch: ein weiteres mögliches Ziel
in der Zukunft ist, das Ganze auf einen Server zu tun und eine, ja, eine Webseite zu
basteln, sodass quasi, ja, dass man das als Dienst benutzen
kann, falls man das nicht auf dem eigenen Rechner betreiben möchte oder nicht kann. Ja, also, ich meine, das ist zwar dank Java
relativ unrealistisch, aber gut, ich meine, es kann ja schon mal sein,
dass halt Leute da lieber einen Service betreiben wollen, und vor allem ist es auch so, dass der Bedarf für solche
Aufbereitungs-Systeme, automatisierte vor allem, dass der ja allgemein vorhanden ist bei den neu
aufkommenden Self-Publishern, also den Selbstpublizisten sozusagen, aber auch in den Verlagen ohnehin,
also in den traditionellen Verlagen die eben, ja, die eben ihre Aufbereitungsprozesse noch nicht hinreichend automatisiert haben, oder, ja, wo eben der digitale Anteil
noch relativ klein ist, weil eben von einem Autor ungünstigerweise nur ein
handgeschriebenes Manuskript vielleicht eingereicht wird, was ja dann – oder maschinengeschriebenes, also, auf der Schreibmaschine sozusagen, also, das ist natürlich dann relativ
schlecht, weil dann muss man ja von Hand erstmal digitalisieren
überhaupt, und dann muss man auch noch formatieren, und wenn man nur für Print-Aufbereitung formatiert, dann ist das in
der Regel wertlos für die E-Book-Erzeugung, und wenn man nur für E-Book formatiert, ist das in der Regel – vor allem, also, wenn man das manuell
macht, ist das, per Direktformatierung, ist das
unbrauchbar für die PDF-Erzeugung in der Regel oder zumindest
eben nicht von guter Qualität, und deswegen: wie das in Zukunft
idealerweise aussehen sollte, ist nämlich, dass halt der Autor schon von sich aus eben ein Manuskript
einreicht in digitaler Form, das wird ja heute auch schon relativ üblich sein, in einem OpenOffice- oder LibreOffice-Dokument, und entweder enthält es gar keine
Formatierungen und nur rohen Text, sodass ein Formatierer eben mit den Stilen, die in der Vorlage
vordefiniert sind, die aber auch in bereits bestehende Dokumente
natürlich ohne Weiteres integriert werden können, dass ein Formatierer diese Stile auf
dieses Manuskript, auf die Manuskript-Datei anwendet und dann automatisch und und ohne weitere manuelle
Anpassung da sowohl ein PDF als auch ein
EPUB daraus erzeugt werden kann, aber auch andererseits ein Verlag, der
mit einem Autor jetzt zusammenarbeitet, regelmäßig zusammenarbeitet,
oder wenn es sich zum Beispiel um eine Organisation oder Institution
handelt, die regelmäßig gewisse Publikationen veröffentlicht, dort besteht halt die Möglichkeit,
den schreibenden Leuten einfach dieses Template hier quasi zukommen zu lassen, so dass die
dann ihre Dokumente auf Basis von dem Template eben schreiben, und auf diese Weise dann
sichergestellt ist, dass eben gewisse Stile eingehalten werden,
verwendet werden, denn die Alternative dazu ist eben, dass halt nicht
ausgezeichneter Text eben, oder falsch ausgezeichneter Text,
dass der dann im Ergebnis nicht auftaucht oder ohne jedwede Auszeichnung, so dass dann quasi, also, eine, ja, eine spezifische Art und Weise der
Auszeichnung vom Verlag, vom Herausgeber, von demjenigen, der die Aufbereitung macht, vorgegeben werden
kann. Also, insofern ist das LibreOffice, OpenOffice,
ist einerseits ein Front-End für die Autoren selbst, zu dem Grad, zu dem, also, zu weit wie möglich, andererseits kann man sich
ja aber auch darauf beschränken, eben LibreOffice als Front-End für die Formatierung zu benutzen, also,
derjenige, der dann die Formatierung macht, der dann wohl wahrscheinlich auch
gleich noch die Aufbereitung mit anstößt, für den kann es dann sich natürlich auch
als ein entsprechendes Werkzeug jetzt hier erweisen. Und gut, dann ist es natürlich so, dass bis jetzt diese Aufbereitungen noch
vergleichsweise primitiv sind, aber die können ja dann weiter ergänzt
werden, es können neue Bausteine integriert werden, es können neue
Richtungen hinzugefügt werden, also, man kann ja gerne auch von EPUB zurück nach HTML gehen, zurück nach ODT, also nach LibreOffice/OpenOffice
gehen, sodass quasi bestehende E-Books in LibreOffice editiert
werden können, um dann wieder rückwärts zu PDF zu kommen
beispielsweise, ja, oder von einem, aus einem EPUB dann PDF zu erzeugen, das sind
natürlich Szenarien, wo dann halt, also, die sehr viel Sinn machen, die auch wünschenswert sind und je
nachdem, wie die Zeit es eben erlaubt, werde ich mich dann eben auch
damit weiter noch befassen, und das ist jetzt aber eben halt der
aktuelle Stand der Version 45. Die Versionsangabe hier, die bezieht sich immer auf den aktuellen Check-In hier in dem öffentlichen GitHub-Repository, und ich will noch mal am Schluss dazusagen und erwähnen, dass eben es sich hier um frei lizenzierte Software handelt. Das bedeutet, die Lizenz
erlaubt also den freien, uneingeschränkten Einsatz der Software
durch jedermann, sofern dadurch nicht die digitalen Freiheiten anderer Nutzer beeinträchtigt werden, was ein ganz zentrales Anliegen eben überhaupt für die Erstellung von
solcher frei lizenzierter Software ist, denn letztendlich ist es so, dass
wir alle ständig irgendwelche Software anderer Leute verwenden, und es gibt da gewisse digitale Grundrechte sage ich mal, die einem Nutzer von Haus aus zustehen müssen, die heute einem aber oftmals
vorenthalten werden – beispielsweise die Möglichkeit, Programme für den
eigenen Bedarf individuell anzupassen, oder auch das Programm weiterzuverteilen, kommerziell oder nichtkommerziell an jeden, den man möchte, das sind Dinge, die, also, technisch ohne Weiteres möglich
sind und dementsprechend ist es auch so, dass eben diese, also, die frei lizenzierte Software darauf ausgelegt ist, eben, ja, einen großen Pool an Programmen zu haben, die der – die am Ende jedermann gehören, die
der Community gehören, die jeder benutzen darf, die auch von
vielen Leuten ständig verbessert und erweitert werden, und insofern dann eben ein,
also, ja, ein gemeinsamer Fortschritt erreicht werden kann, aber
auch halt Probleme man nicht nur für sich
selbst löst, sondern die sind dann eben für alle Leute gelöst, weil jeder
diese Software uneingeschränkt verwenden kann. So.

Be the first to comment

Leave a Reply

Your email address will not be published.


*