OpenOffice: Falsche Sonderzeichen im Druck

PMc

Well-Known Member
Eigentlich dachte ich ja, nachdem man sich nun auf UTF-8 geeinigt hat, sind die Probleme mit den Umlauten usw. Vergangenheit. Aber denkste.
Ich hab ein Dokument mit diesen Zeichen: üäö „ß“
Gedruckt werden stattdessen diese Zeichen: üäö ¹ûª

In einem PDF-Export sind auch die falschen Zeichen (es liegt also offenbar nicht an CUPS oder ghostscript).
Lustig dabei: wenn ich aus dem pdf-reader mit cut&paste hier in den Foren-Editor kopiere, dann verwandeln sich dabei die falschen Zeichen auf magische Weise wieder in die richtigen!

Auch ist das ganze vom gewählten Font abhängig - es tritt nicht mit allen auf.

Weiß vielleicht jemand, wie man ein PDF auseinanderschraubt, um zu sehen was genau drin ist?
 
Zuletzt bearbeitet:
Hi PMc,
Auch ist das ganze vom gewählten Font abhängig - es tritt nicht mit allen auf.
Schau die betreffenden Fonts doch mal mit einem Fonteditor an. Es kann schon sein, dass in der Fontdatei die Kodierung nicht korrekt ist oder nicht UTF-8.

Gruß juedan
 
Schau die betreffenden Fonts doch mal mit einem Fonteditor an. Es kann schon sein, dass in der Fontdatei die Kodierung nicht korrekt ist oder nicht UTF-8.

Danke, guter Punkt. Dafür spricht, dass wenn ich die OpenDocument Datei irgendwo im Web in PDF konvertieren lasse, der Fehler dann nicht auftritt und ein korrektes PDF zurückgeliefert wird.

Man muss freilich den richtigen Font im Dateisystem erstmal findet.
Im konkreten Fall ist es "Bitstream Charter", der (aus irgendeinem Grund) als Default gesetzt ist und der -ebenso wie einige andere- diese komische Zeichenvertauschung produziert.
Ich vermute, dass das /usr/local/share/fonts/Type1/c0648bt_.pfb ist (font-bitstream-type1), der läßt sich mit print/fontforge anschauen und sieht soweit in ordnung aus.

Ich hab auch einen Weg gefunden, wie man das PDF "auseinanderschrauben" kann: mit pdftops -level1 kommt etwas heraus, was so einigermaßen ansatzweise lesbar ist. Dann stellt sich heraus, erstens: der Font wird im PDF mit eingepackt! Es liegt also nicht daran, dass der PDF-Viewer eine andere Fontdatei mit anderer Reihenfolge nutzen täte.
Zweitens: die Zeichentabellen im mit eingepackten Font sind verwurschtelt und entsprechen nicht denen im originalen Font. Das ist wohl auch notwendig, weil diese Tabellen nur \377 (oktal) Zeichen enthalten - der Font ist aber umfangreicher. Und bei dieser Umsortiererei scheint etwas schief zu gehen, denn drittens: die im Fließtext oktal angegebenen Buchstaben (wenn man sie mal in dem Postscript findet) zeigen tatsächlich auf die falschen Zeichen, auf genau jene falschen Zeichen, die eben falsch dargestellt werden (ucircumflex statt germandbls, ordfeminine statt quotedblleft, etc).
Der Fehler liegt also im Openoffice beim erstellen des PDF - vielleicht auch verbunden damit dass dieser vorhandene Font nicht so ganz standard ist oder irgendwie ungewöhnlich oder das halt nicht getestet wurde.

Testweise hab ich mal libreoffice dazu installiert - das macht es sich einfach und bietet diese betroffenen Fonts gar nicht zur Auswahl an!
 
Moin PMc,
Ich hab auch einen Weg gefunden, wie man das PDF "auseinanderschrauben" kann: mit pdftops -level1 kommt etwas heraus, was so einigermaßen ansatzweise lesbar ist. Dann stellt sich heraus, erstens: der Font wird im PDF mit eingepackt! Es liegt also nicht daran, dass der PDF-Viewer eine andere Fontdatei mit anderer Reihenfolge nutzen täte.
Bist Du dir ganz sicher? Für gewöhlich bringen PDF-Viewer Fontpakete mit bzw. nutzen bereits installierte Fonts.
So wie Du es deiner ausführlichen Beschreibung darstellst, gehe ich davon aus, dass entweder die Fontdatei nicht für UTF-8 ausgelegt ist oder einfach für eine andere Codepage entwickelt wurde.
 
aus solchen Gründen schleppe ich meine Fonts von System zu System mit und lege sie mir nach ~/.fonts
Dann weiß ich erstens, wo sie sind und zweitens, dass sie auch schon mal funktioniert hatten.
So viele sind das ja nicht, die man wirklich braucht.
 
Zurück
Oben