Difference between revisions of "String Encoding/de"
(Created page with "Die unterschiedlichen Kodierungen dienen dazu ein einzelnes darstellbares Zeichen zu codieren. Bei Sprachen die mehr als 256 darstellbare Zeichen haben reicht die UTF-8 kodier...") |
(No difference)
|
Revision as of 19:03, 7 September 2012
Die unterschiedlichen Kodierungen dienen dazu ein einzelnes darstellbares Zeichen zu codieren. Bei Sprachen die mehr als 256 darstellbare Zeichen haben reicht die UTF-8 kodierung nicht aus. Um dieses Problem zu beheben gibt es Kodierungen, die ein darstellbares mit mehr als einem Byte codieren können.
Der AnsiString entspricht der UTF-8 Kodierung.
Bei Windows und Linux entspricht der WideString der UTF-16 Kodierung.
Der UniCodeString entspricht der UCS2 Kodierung.
Bei einigen UNIX und evtl. auch bei einigen speziellen Systemen entspricht der WideString der UTF-32 bzw. UCS4 Kodierung.
Derzeit entsprechen sich die Kodierungen von UTF und UCS weitgehend. Eine Vereinheitlichung beider Kodierungen wird von den Gremien angestrebt.
Kodierung: Anzahl der Bits um ein darstellbares Zeichen zu codieren:
UTF-8 8
UTF-16 16
UTF-32 32
UCS2 16
UCS4 32
Beispiele für Betriebsystem und die von ihnen unterstützten Stringkodierungen:
Windows unterstützt UTF-8 und UTF-16 Strings.
Linux unterstützt UTF-16 Strings.
(Details und Sonderfälle bei den Kodierungen werden hier wegen der Übersichtlichkeit und des leichteren Verständnisses nicht behandelt.)