Umlaute aus Textdatei in TStringList

Für Fragen zur Programmiersprache auf welcher Lazarus aufbaut
Antworten
Benutzeravatar
theo
Beiträge: 10890
Registriert: Mo 11. Sep 2006, 19:01

Re: Umlaute aus Textdatei in TStringList

Beitrag von theo »

mschnell hat geschrieben:
theo hat geschrieben:Stimmt nur leider nicht. Was machst du mit Decomposed Characters, Bidi Markers etc pp. ?
Nicht verwenden, genauso wie alt-Ägyptisch :) .
-Michael
Ich finde dieser Thread wird langsam etwas doof.

mse
Beiträge: 2013
Registriert: Do 16. Okt 2008, 10:22
OS, Lazarus, FPC: Linux,Windows,FreeBSD,(MSEide+MSEgui 4.6,git master FPC 3.0.4,fixes_3_0)
CPU-Target: x86,x64,ARM

Re: Umlaute aus Textdatei in TStringList

Beitrag von mse »

theo hat geschrieben: Stimmt nur leider nicht. Was machst du mit Decomposed Characters, Bidi Markers etc pp. ?
Woher sollen denn in unseren bestehenden und zukünftigen Programmen denn plötzlich decomposed characters und BiDi markers kommen, nur weil wir statt ansistring widestring verwenden?

mschnell
Beiträge: 3444
Registriert: Mo 11. Sep 2006, 10:24
OS, Lazarus, FPC: svn (Window32, Linux x64, Linux ARM (QNAP) (cross+nativ)
CPU-Target: X32 / X64 / ARMv5
Wohnort: Krefeld

Re: Umlaute aus Textdatei in TStringList

Beitrag von mschnell »

theo hat geschrieben:Ich finde dieser Thread wird langsam etwas doof.
Verstehe ich nicht. Beschreibe 'mal ein einfaches Beispiel wo man Decomposed Characters, Bidi Markers etc verwenden muss.
-Michael

Benutzeravatar
theo
Beiträge: 10890
Registriert: Mo 11. Sep 2006, 19:01

Re: Umlaute aus Textdatei in TStringList

Beitrag von theo »

mschnell hat geschrieben:Verstehe ich nicht. Beschreibe 'mal ein einfaches Beispiel wo man Decomposed Characters, Bidi Markers etc verwenden muss.
Man muss nicht, aber sie können in einer Datei stehen die man lädt.

mse
Beiträge: 2013
Registriert: Do 16. Okt 2008, 10:22
OS, Lazarus, FPC: Linux,Windows,FreeBSD,(MSEide+MSEgui 4.6,git master FPC 3.0.4,fixes_3_0)
CPU-Target: x86,x64,ARM

Re: Umlaute aus Textdatei in TStringList

Beitrag von mse »

theo hat geschrieben: Man muss nicht, aber sie können in einer Datei stehen die man lädt.
Nicht in den Dateien und Datenbanken welche meine Programme benützen. 'Ä','Ü','ä','ü','К','Б','Ц','Σ','β','ψ','ε','н','л','ш' kommen dort aber schon vor.

Benutzeravatar
theo
Beiträge: 10890
Registriert: Mo 11. Sep 2006, 19:01

Re: Umlaute aus Textdatei in TStringList

Beitrag von theo »

mse hat geschrieben: Nicht in den Dateien und Datenbanken welche meine Programme benützen. 'Ä','Ü','ä','ü','К','Б','Ц','Σ','β','ψ','ε','н','л','ш' kommen dort aber schon vor.
Und?

mse
Beiträge: 2013
Registriert: Do 16. Okt 2008, 10:22
OS, Lazarus, FPC: Linux,Windows,FreeBSD,(MSEide+MSEgui 4.6,git master FPC 3.0.4,fixes_3_0)
CPU-Target: x86,x64,ARM

Re: Umlaute aus Textdatei in TStringList

Beitrag von mse »

theo hat geschrieben: Und?
Einfaches Arbeiten geht mit WideString, mit UTF8String nicht.

Benutzeravatar
theo
Beiträge: 10890
Registriert: Mo 11. Sep 2006, 19:01

Re: Umlaute aus Textdatei in TStringList

Beitrag von theo »

mse hat geschrieben: Einfaches Arbeiten geht mit WideString, mit UTF8String nicht.
Memo1.lines.add(Edit1.text);

Geht doch auch mit UTF-8 ;-)

Darüber hinaus stösst man mit beiden Ansätzen auf Probleme.

mse
Beiträge: 2013
Registriert: Do 16. Okt 2008, 10:22
OS, Lazarus, FPC: Linux,Windows,FreeBSD,(MSEide+MSEgui 4.6,git master FPC 3.0.4,fixes_3_0)
CPU-Target: x86,x64,ARM

Re: Umlaute aus Textdatei in TStringList

Beitrag von mse »

theo hat geschrieben: Darüber hinaus stösst man mit beiden Ansätzen auf Probleme.
Hrrmm...
Ob man mit 'Ä' auf Schwierigkeiten stösst oder mit dem alt-ägyptischen Wörterbuch ist doch wohl ein Unterschied.

Benutzeravatar
af0815
Lazarusforum e. V.
Beiträge: 6795
Registriert: So 7. Jan 2007, 10:20
OS, Lazarus, FPC: FPC fixes Lazarus fixes per fpcupdeluxe (win,linux,raspi)
CPU-Target: 32Bit (64Bit)
Wohnort: Burgenland
Kontaktdaten:

Re: Umlaute aus Textdatei in TStringList

Beitrag von af0815 »

mse hat geschrieben:
theo hat geschrieben: Darüber hinaus stösst man mit beiden Ansätzen auf Probleme.
Hrrmm...
Ob man mit 'Ä' auf Schwierigkeiten stösst oder mit dem alt-ägyptischen Wörterbuch ist doch wohl ein Unterschied.
Nicht so wirklich.

Denn die englischsprachigen können ja genauso sagen: "Wozu die Aufregung, das brauchern wir ja auch nicht, bzw. ist für uns keine besondere EInschränkung, Wir können damit gut leben".

Eine Prinzipsache und Betrachtungswinkel eben.
Blöd kann man ruhig sein, nur zu Helfen muss man sich wissen (oder nachsehen in LazInfos/LazSnippets).

mse
Beiträge: 2013
Registriert: Do 16. Okt 2008, 10:22
OS, Lazarus, FPC: Linux,Windows,FreeBSD,(MSEide+MSEgui 4.6,git master FPC 3.0.4,fixes_3_0)
CPU-Target: x86,x64,ARM

Re: Umlaute aus Textdatei in TStringList

Beitrag von mse »

af0815 hat geschrieben: Denn die englischsprachigen können ja genauso sagen: "Wozu die Aufregung, das brauchern wir ja auch nicht, bzw. ist für uns keine besondere EInschränkung, Wir können damit gut leben".
Mir scheint da liegt ein Irrtum vor. Mit WideString und UTF8String kann man mit dem entsprechenden Wissen ein alt-ägyptisches Wörterbuch-Programm schreiben. Mit UTF8String braucht man das entsprechende Wissen um ein Programm zu schreiben, worin 'Ä' vorkommen. Dies ist sowohl für Einsteiger ein unnötiges Hindernis als auch für Profis eine unnötige Verminderung der Produktivität.

Martin

Benutzeravatar
theo
Beiträge: 10890
Registriert: Mo 11. Sep 2006, 19:01

Re: Umlaute aus Textdatei in TStringList

Beitrag von theo »

af0815 hat geschrieben: Denn die englischsprachigen können ja genauso sagen: "Wozu die Aufregung, das brauchern wir ja auch nicht, bzw. ist für uns keine besondere EInschränkung, Wir können damit gut leben".
Eine Prinzipsache und Betrachtungswinkel eben.
Sehe ich auch so.
mse hat geschrieben: Mit UTF8String braucht man das entsprechende Wissen um ein Programm zu schreiben, worin 'Ä' vorkommen.
Wie kommst du denn darauf?
Für eine typische DB Anwendung z.B. ist das doch völlig unerheblich. Da kommt's doch nur darauf an, dass die DB Kodierung richtig umgesetzt wird, und das geht bei UTF-8 DB ohne Konvertierung bei Lazarus.

mse
Beiträge: 2013
Registriert: Do 16. Okt 2008, 10:22
OS, Lazarus, FPC: Linux,Windows,FreeBSD,(MSEide+MSEgui 4.6,git master FPC 3.0.4,fixes_3_0)
CPU-Target: x86,x64,ARM

Re: Umlaute aus Textdatei in TStringList

Beitrag von mse »

theo hat geschrieben: Für eine typische DB Anwendung z.B. ist das doch völlig unerheblich. Da kommt's doch nur darauf an, dass die DB Kodierung richtig umgesetzt wird, und das geht bei UTF-8 DB ohne Konvertierung bei Lazarus.
Dümmer ist's mit einer DB in Lokaler Codierung. FPC widestring hätte damit keine Probleme, da der widestring manager die Konvertierung übernimmt. Wie war das mit "charvar:= stringvar[n];"? Und da gibt es noch das Problem von VARCHAR(n). Sind das nun n Bytes oder n Zeichen?
Es schleckt keine Geiss weg, es war eine kurzsichtige Entscheidung, für Lazarus aus entwicklungstechnischen Gründen UTF8String statt WideString zu bevorzugen. Basta.

Benutzeravatar
theo
Beiträge: 10890
Registriert: Mo 11. Sep 2006, 19:01

Re: Umlaute aus Textdatei in TStringList

Beitrag von theo »

mse hat geschrieben: Basta.
Basta find ich gut. Ich teile deine Meinung zwar nicht, aber wird drehen uns im Kreis.
Also: Basta! ;-)

mschnell
Beiträge: 3444
Registriert: Mo 11. Sep 2006, 10:24
OS, Lazarus, FPC: svn (Window32, Linux x64, Linux ARM (QNAP) (cross+nativ)
CPU-Target: X32 / X64 / ARMv5
Wohnort: Krefeld

Re: Umlaute aus Textdatei in TStringList

Beitrag von mschnell »

theo hat geschrieben:[Man muss nicht, aber sie können in einer Datei stehen die man lädt.
Zählt nicht. "Legacy" Programme und Programme, die jemand schreibt, der von Unicode nichts wissen will, dürfen keine solchen Unicode Dateien laden. Das sind (zumindest momentan bestimmt 99% aller Programme.

Wer so was tut muss natürlich wissen was er da macht.

-Michael

Antworten