ee vs utf-8, bin leicht verwirrt.

pit234a

Well-Known Member
Nachdem ich von ISO8859-15 auf UTF-8 umgestellt habe, will mein lieber ee nicht mehr Deutsch mit mir reden. Das ist nicht weiter schlimm, aber heute dachte ich, geh mal hin und bring dem vielleicht UTF bei.

ee ist an und für sich ein guter Kandidat für solche Spielereien, denn er nutzt eigene nls-Dateien. Deshalb cvs-te ich mir die Quellen, nahm das angebotene de_DE.ISO8859-1/ee.msg und wandelte mittels iconv in UTF-8. Dann passte ich das Makefile an und ließ mein neues ee bauen.
Das lief gut.
Meine neue nls wurde in /usr/share/nls/de_DE.UTF-8 gelegt, wenn ich sie ansehe, enthält sie den richtigen Text und wenn ich nun ee aufrufe, kommt der wieder in Deutsch, aber:
die Umlaute werden hyroglyphisch dargestellt. Mist.

Weil mir nun klar ist, wie ee sich seine nls besorgt, könnte ich zwar einfach die Datei zu de_DE.ISO8859-1 verlinken und dann sollten alle Ausdrücke auch wieder Umlaute darstellen können. Trotzdem kann damit ee noch lange nicht UTF Zeichen im Text nutzen.
Zum Vergleich installierte ich editors/nano und der kann UTF-8 und alles klappt prima.

Nun frage ich mich, worin eigentlich das Problem besteht. Weshalb kann der eine Editor, was der andere nicht schaft?
Dass ee mit einer angepassten nls noch kein UTF-8 kann, verwunderte mich nicht. Dass aber ee gar nicht mal diesen Text nehmen und richtig darstellen kann, verwirrte mich schon ein wenig. Das bedeutet, dass ee irgendwie direkt Zeichensätze des Systems verwendet, oder? Und wenn ich da nachsehe, also in /usr/share/syscons/fonts/ dann gibt es da nur ISOxxx Fonts.
Ist das des Rätsels Lösung?
Wäre es dann nicht relativ einfach, UTF-8 Fonts zu erzeugen? Wie ?
 
Hallo pit234a,

nach einem schnellen Blick in den Source-Code vermutet ich, dass ee per se nicht mit UTF-8 umgehen kann. Ich habe nirgends entdecken können, dass er die passenden C-Header einbindet.

Juedan
 
Oi, das bedeutet, dass ein Programm nicht nur einfach irgendwelche anderen (UTF) Zeichensätze benutzt und deshalb schon UTF kann, sondern dass es UTF regelrecht verstehen muss?
Das habe ich nicht gewusst.
 
Das Problem ist, daß viele alten Programme, u. a. auch mein Lieblingseditor Nedit, knallhart und ganz tief hineincodiert haben, daß ein Byte gleich ein Zeichen ist. Davon weichen sie nicht ab. Das anzupassen erfordert u. U. massive Änderungen am Quellcode.

Übrigens, der Frage von pit234a schließe ich mich an: Wenn jemand weiß, wie man einfach aus einer Schriftdatei mit ISO8859-1 eine gleichwertige UTF-8-kodierte erzeugt, wäre ich ihm sehr verbunden. So manche schöne Schrift ist unter UTF-8 heute nicht mehr nutzbar.

Schönen Sonntag,
Tronar
 
Hallo Tronar,

Übrigens, der Frage von pit234a schließe ich mich an: Wenn jemand weiß, wie man einfach aus einer Schriftdatei mit ISO8859-1 eine gleichwertige UTF-8-kodierte erzeugt, wäre ich ihm sehr verbunden. So manche schöne Schrift ist unter UTF-8 heute nicht mehr nutzbar.
Das geht doch prima in Open/Libre-Office.
Ich verwende seit Jahren meine "alten" Adobe-Type-1-Fonts, die NICHT UTF-8 sind, ohne Probleme mit den UTF-8-Fonts in einem Dokument. Auch die Schrift für die Icons des Gnome-Desktop ist auf Century-Schoolbook Adobe-Type-1 gestellt. Keine Probleme mit Umlauten oder solche Dinge.

JueDan
 
Stimmt, ich vergaß zu erwähnen, daß dies vor allem Programme mit serverseitigen Fonts betrifft. Dagegen scheint xft die Konversion zu beherrschen - oder sind Programme, die xft unterstützen, einfach besser gemacht? xft sträubt sich aber auch manchmal: Wenn ich z. B. "terminal:foundry=bitstream" wünsche, kriege ich das nicht ums Verrecken, weil xft immer auf "Bitstream Vera" ausweicht. Dagegen liefert "terminal:foundry=dec" das Gewünschte.

xterm ist mit serverseitigen ISO8859-1-Fonts mit einiger Mühe zur Mitarbeit unter UTF-8 zu bewegen, andere Programme wollen nicht. Eigentlich läßt sich ja jeder 8-bit-Zeichensatz auf UTF-8 abbilden, und ein solches Mapping ließe sich auch in die Font-Engine von Xorg einbauen. Bisher hat sich halt keiner die Mühe gemacht, vor allem weil der heutige Trend ja hin zu Client-seitigen Schriften geht.

Mit Google habe ich eine Dokumentation des PCF-Formats gefunden. Damit sollte sich ein Konvertierungsskript für PCF-Dateien machen lassen. Mal sehen, wann ich Zeit habe ...
 
Zurück
Oben