Ver(schlimm)bessertung für String-Handling (Unicode etc)

mschnell · Beitrag von **mschnell** » Mi 5. Okt 2011, 14:02

theo hat geschrieben:Das ist aber mit dem Multikulti String nicht automatisch behoben.
Das wäre ein Compiler Feature, dass er WideString Zuweisungen in UTF-8 Quellen automatisch umwandelt.

Bei MultiKultiStrings braucht man keine Widestrings mehr, da UCS2 auch als Kodierung für NewDelphiStrings angefordert werden kann.

Wenn es Widestring als expliziten Typ noch geben sollte und definiert ist, dass da immer die UCS-2 Kodierung verwendet wird, kann bei einer Zuweisung etc. automatisch konvertiert werden.

Eine Konstante muss ja auch nicht UTF-8 kodiert sein. wenn die Konstante als MultiKultiString behandelt wird, ist die Kodierung egal.

-Michael

mschnell · Beitrag von **mschnell** » Mi 5. Okt 2011, 14:06

Socke hat geschrieben:Es gibt einen Compilerschalter, mit dem die Quelltextcodierung eingestellt werden kann.

So ist es. Dass die Kodierung des Qelltextes für Konstanten übernommen wird, wäre bei MultiKultiStrings unproblematisch, bei den momentan nicht sauber definierten StringTypen kann es aber zu den besagten Problemen führen.

-Michael

mse · Beitrag von **mse** » Mi 5. Okt 2011, 14:38

theo hat geschrieben:
mschnell hat geschrieben:Leider funktioniert dabei noch nicht einmal
MyWideString := 'Das ist eine Konstante äöü';

Das ist aber mit dem Multikulti String nicht automatisch behoben.
Das wäre ein Compiler Feature, dass er WideString Zuweisungen in UTF-8 Quellen automatisch umwandelt.

Dieses Feature gibt es schon längst. Es wird mit -Fcutf8 oder {$codepage utf8} aktiviert.

theo · Beitrag von **theo** » Mi 5. Okt 2011, 14:58

mse hat geschrieben:Dieses Feature gibt es schon längst. Es wird mit -Fcutf8 oder {$codepage utf8} aktiviert.

Stimmt, hatte ich auch so im Hinterkopf.
Ich war mir nur nicht mehr sicher, weil es bei Laz offenbar nicht standardmässig eingeschaltet ist.
Was war noch gleich der Grund dafür?

Website · Beitrag von **Socke** » Mi 5. Okt 2011, 15:09

theo hat geschrieben:Ich war mir nur nicht mehr sicher, weil es bei Laz offenbar nicht standardmässig eingeschaltet ist.
Was war noch gleich der Grund dafür?

Vermutlich, weil man die Codepage jederzeit ändern kann.

Die Dokumentation dazu: http://www.freepascal.org/docs-html/prog/progsu81.html
Heißt das, der Quelltext muss in US-ASCII geschrieben sein (dort sind ja nur diese Zeichen zugelassen) und Zeichenketten können jede beliebige Kodierung haben? Demnach wäre es also nicht möglich seinen Quelltext in UTF-16 abzulegen.

mse · Beitrag von **mse** » Mi 5. Okt 2011, 16:35

theo hat geschrieben:
mse hat geschrieben:Dieses Feature gibt es schon längst. Es wird mit -Fcutf8 oder {$codepage utf8} aktiviert.

Stimmt, hatte ich auch so im Hinterkopf.
Ich war mir nur nicht mehr sicher, weil es bei Laz offenbar nicht standardmässig eingeschaltet ist.
Was war noch gleich der Grund dafür?

Theo, nimmst du mich jetzt auf den Arm?

Martin

theo · Beitrag von **theo** » Mi 5. Okt 2011, 19:56

mse hat geschrieben:
theo hat geschrieben:Was war noch gleich der Grund dafür?

Theo, nimmst du mich jetzt auf den Arm?

Nö. Mir ist schon klar, dass darüber auch schon gesprochen wurde, deshalb schreibe ich "noch gleich" oder "nochmal".
Habe mich nur länger nicht damit befasst, und deshalb hatte ich's nicht gleich auf dem Radar.
Es gab ja mehrere Threads zu dem Thema, z.B. viewtopic.php?f=9&t=3368&start=0&hilit=codepage+utf8

Deutsches Lazarusforum

Ver(schlimm)bessertung für String-Handling (Unicode etc)

Re: Ver(schlimm)bessertung für String-Handling (Unicode etc)

Re: Ver(schlimm)bessertung für String-Handling (Unicode etc)

Re: Ver(schlimm)bessertung für String-Handling (Unicode etc)

Re: Ver(schlimm)bessertung für String-Handling (Unicode etc)

Re: Ver(schlimm)bessertung für String-Handling (Unicode etc)

Re: Ver(schlimm)bessertung für String-Handling (Unicode etc)

Re: Ver(schlimm)bessertung für String-Handling (Unicode etc)