UTF8

Für Fragen von Einsteigern und Programmieranfängern...
Benutzeravatar
juelin
Beiträge: 296
Registriert: Sa 24. Jul 2021, 18:03
OS, Lazarus, FPC: Linux Ubuntu 22. Windows 10 Delphi 11.3 (L 0.9.xy FPC 2.2.z)
CPU-Target: 64Bit
Wohnort: Mannheim

Re: UTF8

Beitrag von juelin »

Hallo kirchfritz ,
danke für deinen Post.
Aber Du scheinst etwas falsch verstanden zu haben.
Ich suche nicht den Quelltexteditor sondern den Codeeditor.
Damit ich den Zeichencode auf UTF8 ändern kann.
Gruß
Jürgen

Benutzeravatar
theo
Beiträge: 10922
Registriert: Mo 11. Sep 2006, 19:01

Re: UTF8

Beitrag von theo »

Warf hat geschrieben: Sa 12. Okt 2024, 13:04 Elitismus und gatekeeping hilft hier niemand. Pascal stirbt aus, und ich persönlich finde das schade.
Pascal stirbt schon seit 25 Jahren aus (genau wie Email). Diese Sprüche haben mich noch nie interessiert. :wink:
So lange das System Lazarus für mich Vorteile hat, so lange verwende ich es. Die Sprache an sich ist für mich nicht mehr so zentral (egal welche).
Ich mach auch Python etc. wenn ein Problem damit einfacher zu lösen ist.
Wenn etwas Besseres kommt, dann ist es halt so.

Aber vielleicht sollte man langsam einen neuen Thread aufmachen?
Das hat mit Juelins UTF-8 Frage nicht mehr so viel zu tun.

Benutzeravatar
theo
Beiträge: 10922
Registriert: Mo 11. Sep 2006, 19:01

Re: UTF8

Beitrag von theo »

juelin hat geschrieben: Sa 12. Okt 2024, 13:18 Ich suche nicht den Quelltexteditor sondern den Codeeditor.
Damit ich den Zeichencode auf UTF8 ändern kann.
Quelltexteditor und Codeeditor sind Synonyme.
Du suchst "Rechtsklick auf dem Quelltexteditor" -> "Dateieinstellungen" -> "Zeichencodierung".
Aber wie gesagt, standardmäßig ist schon UTF8 eingestellt.

Warf
Beiträge: 2142
Registriert: Di 23. Sep 2014, 17:46
OS, Lazarus, FPC: Win10 | Linux
CPU-Target: x86_64

Re: UTF8

Beitrag von Warf »

juelin hat geschrieben: Sa 12. Okt 2024, 13:18 Hallo kirchfritz ,
danke für deinen Post.
Aber Du scheinst etwas falsch verstanden zu haben.
Ich suche nicht den Quelltexteditor sondern den Codeeditor.
Damit ich den Zeichencode auf UTF8 ändern kann.
Gruß
Jürgen
Im Quelltext editor irgendwo im code rechtsklick -> Dateieinstellungen -> Zeichenkodierung -> UTF-8

Warf
Beiträge: 2142
Registriert: Di 23. Sep 2014, 17:46
OS, Lazarus, FPC: Win10 | Linux
CPU-Target: x86_64

Re: UTF8

Beitrag von Warf »

theo hat geschrieben: Sa 12. Okt 2024, 13:22 Pascal stirbt schon seit 25 Jahren aus (genau wie Email). Diese Sprüche haben mich noch nie interessiert. :wink:
Pascal war mal die Beliebteste Programmiersprache, natürlich braucht das lang zum Sterben. Und E-Mail ist nie gestorben, weil es nie eine Alternative gab. Es gab immer mal wieder Leute die Vorhergesagt haben das E-Mail stirbt, aber die Nutzung von E-Mail gegenüber anderen Diensten ist nie Signifikant runter gegangen. Pascal im gegensatz ist von der Beliebtesten Sprache zu einer Nieschensprache gefallen und Außerhalb von Europa einfach gar nicht existent.

Ich empfehle wirklich mal die seite PyPL, die haben relativ Detailierte Grafiken. In Deutschland ist z.B. Pascal beliebtheit (gemessen an Suchanfragen nach der Sprache, Tutorials, etc.) von 5% auf 1.5% gefallen aber hält sich da relativ Stabil. Weltweit ist die Sprache allerdings in den selben 20 Jahren von 3% auf seit 2 Jahren nicht mehr messbar gefallen. In indien war die Sprache vor 15-20 Jahren bei 0.5%-1% aber seit 2010 rum so wenig nicht mehr wirklich messbar.

Die absoluten Zahlen sind hierbei eher irrelevant, da verschiedene Metriken dir verschiedene sachen sagen, der Relative abfall ist aber relevant. Was aber interessant ist das selbst hier in Deutschland, was die Hochburg für Pascal entwickler ist, die Popularität um 75% gefallen ist in 20 Jahren. Zwar wird dieser Tiefstand seit etwa 10 Jahren gehalten, aber nach oben gehts nicht. Und überall sonst siehts noch schlimmer aus.

Und vielleicht, wenn Pascal seit Jahrzehnten am sterben ist und die Beliebtheit weiter und weiter in den Keller fällt, sollte man statt sich hinzustellen und zu sagen: Das geht so langsam das interessiert mich nicht... evtl mal drüber nachdenken ob man nicht vielleicht was ändern sollte

Benutzeravatar
juelin
Beiträge: 296
Registriert: Sa 24. Jul 2021, 18:03
OS, Lazarus, FPC: Linux Ubuntu 22. Windows 10 Delphi 11.3 (L 0.9.xy FPC 2.2.z)
CPU-Target: 64Bit
Wohnort: Mannheim

Re: UTF8

Beitrag von juelin »

Danke theo,
genau das wollte ich wissen.
Aber noch eine Frage an die Communuty.
Auf dem Stuttgarter Treffen wurde behauptet, das UTF8 auch Sonderzeichen könnte.
Bei mir ist zwar der Dateicode auf UTF8 eingestellt, aber Sonderzeichen zeigt er als Fragezeichen an (im Label).
Ich muss das Sonderzeichen mit UTF8Encode(#169) ausgeben.
Warum ist das so?
Gruß
Jürgen

Benutzeravatar
theo
Beiträge: 10922
Registriert: Mo 11. Sep 2006, 19:01

Re: UTF8

Beitrag von theo »

juelin hat geschrieben: Sa 12. Okt 2024, 14:21 Auf dem Stuttgarter Treffen wurde behauptet, das UTF8 auch Sonderzeichen könnte.
Bei mir ist zwar der Dateicode auf UTF8 eingestellt, aber Sonderzeichen zeigt er als Fragezeichen an (im Label).
Ich muss das Sonderzeichen mit UTF8Encode(#169) ausgeben.
Warum ist das so?
UTF-8 kann alle Zeichen, die der Unicode Standard hergibt, ist aber nur bis Zeichen 128 kompatibel mit ASCII/ANSI. #169 fällt raus, das Zeichen ist aber anderswo zu finden.
Hast du die Zeichentabelle installiert?
Dort kannst du sehen, was es alles gibt und das Zeichen direkt in den Quelltexteditor einfügen oder die Code Points auslesen. Ändere auch den "Bereich".
Mit UTF-8/Unicode muss man ein paar Gewohnheiten und Denkweisen über Bord werfen. Sträube dich nicht dagegen, es bringt nichts. :wink:

zeichentabelle.png
zeichentabelle.png (174.79 KiB) 1094 mal betrachtet

Benutzeravatar
theo
Beiträge: 10922
Registriert: Mo 11. Sep 2006, 19:01

Re: UTF8

Beitrag von theo »

Warf hat geschrieben: Sa 12. Okt 2024, 13:41 ...evtl mal drüber nachdenken ob man nicht vielleicht was ändern sollte
Ich kann das nicht ändern und die Unicode Identifier ändern das auch nicht.
Das sind ja immer Hypes, dafür ist Pascal schon zu lange da und es ist halt nirgends "verankert", wie z.B. Java in Android / Unternehmenssoftware etc.

PascalDragon
Beiträge: 963
Registriert: Mi 3. Jun 2020, 07:18
OS, Lazarus, FPC: L 2.0.8, FPC Trunk, OS Win/Linux
CPU-Target: Aarch64 bis Z80 ;)
Wohnort: München

Re: UTF8

Beitrag von PascalDragon »

theo hat geschrieben: Fr 11. Okt 2024, 19:03
Warf hat geschrieben: Fr 11. Okt 2024, 18:43 Und das Beispiel was du gebracht hast hilft mir nicht das stimmt, aber nur weil ich kein Arabisch kann. Für Araber die grade neu am Programmieren lernen sind, ist das vermutlich sehr hilfreich.
Nein, weil es auch nicht wirklich arabisch (oder hebräisch etc.) ist, deshalb hatte ich ja RTL (Right-To-Left Schreibrichtung) erwähnt.
Im Arabischen wäre das Ganze rechts angeschlagen.
Der Mix von RTL und LTR ist immer ein Durcheinander.
Versuche mal oben in dem Beispiel etwas zu markieren.
Nutzer mit RTL Sprachen werden das gewohnt sein. Sie können ja schließlich auch ihre Kommentare in ihrer eigenen Sprache schreiben und dann haben sie bereits jetzt das von dir erwähnte „Problem”.
af0815 hat geschrieben: Sa 12. Okt 2024, 09:01 Es gibt zu dem Thema nur einen Satz, den ich schon öfters von den Entwicklern gehört habe: "won't fix". Und da haben sie sogar, meiner Meinung nach recht.
Das wird definitiv kein „won't fix”. Siehe hier.
Warf hat geschrieben: Sa 12. Okt 2024, 00:19 Es gab (technische) Gründe warum in der Vergangenheit Programmiersprachen nur ANSI bezeichner zugelassen haben. Aber heute haben wir nicht nur mit dem Unicode Standard das Codepage Problem gelöst, das Unicode Konsortium schreibt auch Spezifikationen für programmiersprachen, z.B. was für charaktere für Bezeichner verwendet werden können, Normalformen um gleichheit von Bezeichnern zu zeigen, etc. auf basis von über 20 Jahren erfahrung mit Internationalisierung von Programmiersprachen, die genau zum Ziel haben die Sprachbarriere für Programmierung möglichst zu senken und die daraus resultierenden Technischen Schwierigkeiten zu lösen.
Um den entsprechenden Standard noch zu referenzieren: UAX #31: Unicode Identifiers and Syntax.
FPC Compiler Entwickler

Mathias
Beiträge: 6956
Registriert: Do 2. Jan 2014, 17:21
OS, Lazarus, FPC: Linux (die neusten Trunk)
CPU-Target: 64Bit
Wohnort: Schweiz

Re: UTF8

Beitrag von Mathias »

Pascal war mal die Beliebteste Programmiersprache, natürlich braucht das lang zum Sterben. Und E-Mail ist nie gestorben, weil es nie eine Alternative gab. Es gab immer mal wieder Leute die Vorhergesagt haben das E-Mail stirbt, aber die Nutzung von E-Mail gegenüber anderen Diensten ist nie Signifikant runter gegangen. Pascal im gegensatz ist von der Beliebtesten Sprache zu einer Nieschensprache gefallen und Außerhalb von Europa einfach gar nicht existent.
Was ich vermute, mit C/C++ sieht es bald auch nicht mehr besser aus.
Im deutschen C/C++ -Forum läuft weniger als im Lazarus Forum.
Und erst JavaScribt, genau ein Beitrag seit Juli.
Bei Java sieht es noch recht gut aus, fast im Niveau von Lazarus.

Ich vermute FPC und Lazarus wird es noch lange geben, wen es gut gepflegt wird..
Was ein Wermutstropfen ist, das Lazarus sich nicht vom Totgesagten GTK2 trennen will, Momentan wäre GTK4 aktuell. GTK2 wird NICHT mehr gepflegt.
Mit Lazarus sehe ich grün
Mit Java und C/C++ sehe ich rot

Warf
Beiträge: 2142
Registriert: Di 23. Sep 2014, 17:46
OS, Lazarus, FPC: Win10 | Linux
CPU-Target: x86_64

Re: UTF8

Beitrag von Warf »

Mathias hat geschrieben: Sa 12. Okt 2024, 20:02 Ich vermute FPC und Lazarus wird es noch lange geben, wen es gut gepflegt wird..
Was ein Wermutstropfen ist, das Lazarus sich nicht vom Totgesagten GTK2 trennen will, Momentan wäre GTK4 aktuell. GTK2 wird NICHT mehr gepflegt.
Ja man muss halt leider sagen das FPC und Lazarus aufgrund der geringen Entwicklerzahl an einigen stellen etwas hinter her hinken. Nicht nur Feature mäßig mit sowas wie GTK, was soweit ich weiß vor allem daran liegt das GTK und QT interface von der selben Person gemacht werden, und während QT recht ähnloche Strukturen mit jeder version hat hat GTK seit version 3 sich angewöhnt alles über den Haufen zu werfen, und sich mit neuen major versionen intern komplett umzustrukturieren.

Aber auch beim FPC, ich muss halt ganz ehrlich sagen, ich hab bei keinem Anderen Compiler das ich überhaupt, geschweige denn Regelmäßig in Interne Errors, Exceptions, Segfaults oder andere Crashes laufe, beim FPC hab ich allein in den letzten Wochen schon wieder mehrere solcher Probleme gefunden.
Das ist mir in meiner ganzen Zeit mit C++, Python, Haskell, Swift, Java, JavaScript und den ganzen anderen Sprachen die ich benutzt habe nie passiert.

Antworten