Difference between revisions of "String Encoding/de"
Line 20: | Line 20: | ||
<br> | <br> | ||
(Details und Sonderfälle bei den Kodierungen werden hier wegen der Übersichtlichkeit und des leichteren Verständnisses nicht behandelt.) | (Details und Sonderfälle bei den Kodierungen werden hier wegen der Übersichtlichkeit und des leichteren Verständnisses nicht behandelt.) | ||
+ | <br> | ||
+ | <br> | ||
+ | --[[User:Olaf|Olaf]] 17:08, 7 September 2012 (UTC) | ||
+ | [[Category:Pascal]] |
Revision as of 19:08, 7 September 2012
Die unterschiedlichen Kodierungen dienen dazu ein einzelnes darstellbares Zeichen zu codieren. Bei Sprachen die mehr als 256 darstellbare Zeichen haben reicht die UTF-8 kodierung nicht aus. Um dieses Problem zu beheben gibt es Kodierungen, die ein darstellbares mit mehr als einem Byte codieren können.
Der AnsiString entspricht der UTF-8 Kodierung.
Bei Windows und Linux entspricht der WideString der UTF-16 Kodierung.
Der UniCodeString entspricht der UCS2 Kodierung.
Bei einigen UNIX und evtl. auch bei einigen speziellen Systemen entspricht der WideString der UTF-32 bzw. UCS4 Kodierung.
Derzeit entsprechen sich die Kodierungen von UTF und UCS weitgehend. Eine Vereinheitlichung beider Kodierungen wird von den Gremien angestrebt.
Kodierung: Anzahl der Bits um ein darstellbares Zeichen zu codieren:
- UTF-8 -> 8 Bit
- UTF-16 -> 16 Bit
- UTF-32 -> 32 Bit
- UCS2 -> 16 Bit
- UCS4 -> 32 Bit
Beispiele für Betriebsystem und die von ihnen unterstützten Stringkodierungen:
Windows unterstützt UTF-8 und UTF-16 Strings.
Linux unterstützt UTF-16 Strings.
(Details und Sonderfälle bei den Kodierungen werden hier wegen der Übersichtlichkeit und des leichteren Verständnisses nicht behandelt.)
--Olaf 17:08, 7 September 2012 (UTC)