Ich war meine schnellen Hacks zur HTML-Konvertierung leid.
Ich hab keine hinreichende Quelle zu diesem Thema gefunden - das Package fpc-xml ist recht dürftig in dieser Hinsicht.
Also hab ich selber die Strafarbeit gemacht, und die Konvertierungsliste für ca. 620 HTML Enties erstellt.
Das Interface ist trivial :
Code: Alles auswählen
function HTMLtoUTF8 (HTML: string): string;
procedure HTML2UTF8 (var s: String);
procedure UTF2HTML (var s : string);
function UTFtoHTML (utf8: string) : string;
Es kann also in beide Richtungen zwischen HTML und UTF8 konvertiert werden.
Folgende Gruppen von Sonderzeichen sind erfasst:
* Sonderzeichen von Latin1 von Skandinavien bis Spanien
* Währungssymbole
* Interpunktion
* Verschiedenes (Copyright, Telefon, Trademark ..)
* Brüche
* Mathematische Sonderzeichen
* Griechisches Alphabet
Falls es jemand gebrauchen kann
Ciao
Winni