Gesuchtes Wort in Memo markieren UTF-Codierung

Für Fragen zur Programmiersprache auf welcher Lazarus aufbaut
mschnell
Beiträge: 3444
Registriert: Mo 11. Sep 2006, 10:24
OS, Lazarus, FPC: svn (Window32, Linux x64, Linux ARM (QNAP) (cross+nativ)
CPU-Target: X32 / X64 / ARMv5
Wohnort: Krefeld

Re: Gesuchtes Wort in Memo markieren UTF-Codierung

Beitrag von mschnell »

Socke hat geschrieben:
Namos hat geschrieben:Danke für die Antwort, wie macht man denn eine Unicode-Normalisierung ?
Für die meisten Anwendungen ist das vollkommen egal; von daher wird das auch nur selten durchgeführt
Eigentlich müsste eine Sprache, die mit Unicode-Texten arbeitet mindestens zwei Vergleichs-Operatoren haben: gleicher Code und "Äquivalenz" (=gleicher Drucker-Output) (dazu kommen natürlich noch die bekannten Sachen wie Groß/Kleinschreinbung und Länder-typische Umschrift wie ä = ae).

-Michael

Socke
Lazarusforum e. V.
Beiträge: 3178
Registriert: Di 22. Jul 2008, 19:27
OS, Lazarus, FPC: Lazarus: SVN; FPC: svn; Win 10/Linux/Raspbian/openSUSE
CPU-Target: 32bit x86 armhf
Wohnort: Köln
Kontaktdaten:

Re: Gesuchtes Wort in Memo markieren UTF-Codierung

Beitrag von Socke »

mschnell hat geschrieben:Eigentlich müsste eine Sprache, die mit Unicode-Texten arbeitet mindestens zwei Vergleichs-Operatoren haben: gleicher Code und "Äquivalenz" (=gleicher Drucker-Output).
Ein Äquivalenz-Operator für Strings wäre schon sinnvoll, nur würde den wohl kaum jemand beachten. Ich könnte mir vorstellen, dass es Funktionen wie AnsiCompareText/AnsiCompareString für Unicode umgeschrieben werden und dort solche Dinge beachtet werden.
mschnell hat geschrieben:dazu kommen natürlich noch die bekannten Sachen wie Groß/Kleinschreinbung und Länder-typische Umschrift wie ä = ae
Besser nicht. Unicode ist genau dafür da, dass solche Transkriptionen nicht mehr notwendig sind. Bei solchen Dingen ist die Äquivalenz abhängig von der Aufgabe. ß und ss sind äquivalent, wenn ich kein ß zur Verfügung habe. Sobald ich es aber habe, sind die Zeichen(-kombinationen) nicht mehr äquivalent.
Ein Beispiel von Access: Der Textvergleich arbeitet immer Case-Insensitve; dabei werden auch deutsch "Sonder"zeichen zu US-ASCII normalisiert. ß ist in Vergleichen mit ss/SS gleichwertig -- in Tabellen-Primärschlüsseln aber nicht! Hat man also zwei Benutzernamen, die sich nur durch ß und ss unterscheiden, könnte beiden Benutzern die gleichen Berechtigungen zugeteilt werden ...
MfG Socke
Ein Gedicht braucht keinen Reim//Ich pack’ hier trotzdem einen rein

Antworten