#228 ---> 'ä'

mschnell · Beitrag von **mschnell** » Mi 1. Apr 2015, 10:49

theo hat geschrieben:Der Code von Mathias funktioniert unter Liniux nicht.

Stimmt. Linux kennt die gewünschte ANSI Code Page ja nicht. Müsste man irgendwie angeben können .... (Bei Windows verwendet das Programm vermutlich die default ANSI Code Page des OS.)

(Dem OP scheint aber auch nicht klar zu sein, dass das Ergebnis von der ANSI Code-Page abhängt....)

-Michael

Bernd82 · Beitrag von **Bernd82** » Mi 1. Apr 2015, 16:01

Hallo mschnell,

doch, doch, mittlerweile hab' ich's gerafft. Aber ich kann leider nicht vorhersehen, mit welcher Codepage welcher User meiner Software arbeitet(e). Ich habe eine deutsche, eine englische und eine französische Version. Die User tauschen z.B. innerhalb ihrer Konzerne auch unter verschiedenen Sprachversionen ihre Dokumente aus. Am aller kompatibelsten scheint mir dazu die CP1252 zu sein. Wir überlegen uns, in Zukunft ggf. Lazarus statt Delphi einzusetzen. Insbesondere auch im Hinblick darauf, eine native Linux-Version zu erzeugen.

Gruß Bernd

wp_xyz · Beitrag von **wp_xyz** » Mi 1. Apr 2015, 16:48

In der Unit lconvencoding gibt es eine Funktion "GuessEncoding", der man ein Sample des zu konvertierenden Strings mitgibt und die daraus die betreffende CodePage ermittelt. Die ermittelte CodePage kannst du dann in "ConvertEncoding" eintragen. Also:

Code: Alles auswählen

 
var
  codepage: String;
begin
  codepage := GuessEncoding(TextProbe);
  utf8Text := ConvertEncoding(MeinGanzerText, codepage, 'utf8');

Hat bei mir bei den wenigen Malen, in denen ich das brauchte, funktionert.

theo · Beitrag von **theo** » Mi 1. Apr 2015, 17:00

wp_xyz hat geschrieben:In der Unit lconvencoding gibt es eine Funktion "GuessEncoding", der man ein Sample des zu konvertierenden Strings mitgibt und die daraus die betreffende CodePage ermittelt. Die ermittelte CodePage kannst du dann in "ConvertEncoding" eintragen. Also:
Code: Alles auswählen
 
var
  codepage: String;
begin
  codepage := GuessEncoding(TextProbe);
  utf8Text := ConvertEncoding(MeinGanzerText, codepage, 'utf8');
 
Hat bei mir bei den wenigen Malen, in denen ich das brauchte, funktionert.

GuessEncoding kann nicht versch. ANSI Codepages unterscheiden, bzw. nur wenn der Stream einen Header in der Form {%encoding blah hat, was normalerweise nicht der Fall ist. Ansonsten unterscheidet es nur UTF-8 von UCS-2 von ANSI und macht noch Annahmen über den Systemstandard.
Hilft also eig. nicht viel für ANSI CodePages, weil das auch kaum möglich ist.
Woran willst du erkennen, ob eine Folge von einzelnen Bytes Kyrillisch oder Lateinisch oder Griechisch etc. meint?
Das ginge höchstens mit Wörterbüchern u.ä.

mschnell · Beitrag von **mschnell** » Mi 1. Apr 2015, 17:17

Bernd82 hat geschrieben:Am aller kompatibelsten scheint mir dazu die CP1252 zu sein.

Am kompatibelsten ist Unicode. Das ist genau für diesen Zweck erfunden worden.

Michael

Bernd82 · Beitrag von **Bernd82** » Fr 3. Apr 2015, 12:16

mschnell hat geschrieben:Am kompatibelsten ist Unicode.

Das ist klar. Nach Unicode will ich ja hin. Ich komme aber von einer leider unbekannten CodePage. Ich meine daher, dass ich die wenigsten Probleme erzeuge, wenn ich davon ausgehe, dass die User (englisch (GB, US, etc.), deutsch (DE,AT,CH), französisch (F,CH etc.)) die CP1252 verwendet hätten. Damit sind die Sonderzeichen dieser Kulturkreise abgedeckt.

Danke nochmal allen für die schnelle Hilfe!

Deutsches Lazarusforum

#228 ---> 'ä'

Re: #228 ---> 'ä'

Re: #228 ---> 'ä'

Re: #228 ---> 'ä'

Re: #228 ---> 'ä'

Re: #228 ---> 'ä'

Re: #228 ---> 'ä'