Difference between revisions of "String Encoding/de"

Revision as of 19:03, 7 September 2012

Die unterschiedlichen Kodierungen dienen dazu ein einzelnes darstellbares Zeichen zu codieren. Bei Sprachen die mehr als 256 darstellbare Zeichen haben reicht die UTF-8 kodierung nicht aus. Um dieses Problem zu beheben gibt es Kodierungen, die ein darstellbares mit mehr als einem Byte codieren können.

Der AnsiString entspricht der UTF-8 Kodierung.
Bei Windows und Linux entspricht der WideString der UTF-16 Kodierung.
Der UniCodeString entspricht der UCS2 Kodierung.
Bei einigen UNIX und evtl. auch bei einigen speziellen Systemen entspricht der WideString der UTF-32 bzw. UCS4 Kodierung.

Derzeit entsprechen sich die Kodierungen von UTF und UCS weitgehend. Eine Vereinheitlichung beider Kodierungen wird von den Gremien angestrebt.

Kodierung: Anzahl der Bits um ein darstellbares Zeichen zu codieren:
UTF-8 8
UTF-16 16
UTF-32 32
UCS2 16
UCS4 32

Beispiele für Betriebsystem und die von ihnen unterstützten Stringkodierungen:
Windows unterstützt UTF-8 und UTF-16 Strings.
Linux unterstützt UTF-16 Strings.

(Details und Sonderfälle bei den Kodierungen werden hier wegen der Übersichtlichkeit und des leichteren Verständnisses nicht behandelt.)

Difference between revisions of "String Encoding/de"

Revision as of 19:03, 7 September 2012

Navigation menu

Page actions

Page actions

Personal tools

Navigation

Tools

Search