Difference between revisions of "String Encoding/de"

From Free Pascal wiki
Jump to navigationJump to search
Line 20: Line 20:
 
<br>
 
<br>
 
(Details und Sonderfälle bei den Kodierungen werden hier wegen der Übersichtlichkeit und des leichteren Verständnisses nicht behandelt.)
 
(Details und Sonderfälle bei den Kodierungen werden hier wegen der Übersichtlichkeit und des leichteren Verständnisses nicht behandelt.)
 +
<br>
 +
<br>
 +
--[[User:Olaf|Olaf]] 17:08, 7 September 2012 (UTC)
 +
[[Category:Pascal]]

Revision as of 19:08, 7 September 2012

Die unterschiedlichen Kodierungen dienen dazu ein einzelnes darstellbares Zeichen zu codieren. Bei Sprachen die mehr als 256 darstellbare Zeichen haben reicht die UTF-8 kodierung nicht aus. Um dieses Problem zu beheben gibt es Kodierungen, die ein darstellbares mit mehr als einem Byte codieren können.

Der AnsiString entspricht der UTF-8 Kodierung.
Bei Windows und Linux entspricht der WideString der UTF-16 Kodierung.
Der UniCodeString entspricht der UCS2 Kodierung.
Bei einigen UNIX und evtl. auch bei einigen speziellen Systemen entspricht der WideString der UTF-32 bzw. UCS4 Kodierung.


Derzeit entsprechen sich die Kodierungen von UTF und UCS weitgehend. Eine Vereinheitlichung beider Kodierungen wird von den Gremien angestrebt.

Kodierung: Anzahl der Bits um ein darstellbares Zeichen zu codieren:

  • UTF-8 -> 8 Bit
  • UTF-16 -> 16 Bit
  • UTF-32 -> 32 Bit
  • UCS2 -> 16 Bit
  • UCS4 -> 32 Bit


Beispiele für Betriebsystem und die von ihnen unterstützten Stringkodierungen:
Windows unterstützt UTF-8 und UTF-16 Strings.
Linux unterstützt UTF-16 Strings.

(Details und Sonderfälle bei den Kodierungen werden hier wegen der Übersichtlichkeit und des leichteren Verständnisses nicht behandelt.)

--Olaf 17:08, 7 September 2012 (UTC)