Writing portable code regarding the processor architecture/id

From Lazarus wiki
Jump to: navigation, search

English (en) Bahasa Indonesia (id) русский (ru)

Ada beberapa isu utama saat menulis kode yang portabel sehubungan dengan arsitektur prosesor: endianness dan prosesor 32 vs. 64 bit.

Endianness

Endianness adalah cara bagaimana nilai lebih besar dari sebuah byte (misalnya 16/32/64-bit integers) disimpan oleh prosesor.

Free Pascal mendukung prosesor dengan dua jenis endianness:

  1. Menyimpan nilai terendah pada alamat terendah; longint(4) dienkode sebagai 04 00 00 00 (little endian)
  2. Menyimpan nilai tertingi pada alamat terendah; longint(4) dienkode sebagai 00 00 00 04 (big endian)

catatan samping:

Endian tengah, juga disebut endian campuran, prosesor jarang sekarang. Yang terkenal, tapi sekarang menjadi historis, prosesor endian menengah adalah PDP-11 dari DEC.

Endianness adalah pilihan umum yang diberikan per keluarga prosesor, tapi beberapa keluar prosesor dapat berupa endian besar atau endian kecil pada mainboard yang disertakannya (ARM, PPC).

Prosesor endian kecil yang paling terkenal adalah keluarga x86, keluar prosesor yang digunakan dalam PC, dan yang terbarunya x86-64. Prosesor umum endian besar adalah PPC (biasanya, lihat catatan di atas), dan m68k, banyak sistem lebih lama seperti misalnya HP3000 minikomputer, dan mainframes seperti IBM 370 (seri Z).

Karena TCP/IP menetapkan bahwa semua struktur header protokol yag bejalan di atas kawat harus endian besar, maka notasi ini kadang-kadang dirujuk sebagai urutan jaringan.

Endianness adalah penting

  1. ketika bertukar data antara arsitektur yang bebeda
  2. ketika mengakses data kadang-kadang sebagai (sebuah array dari) tipe lebih besar, seperti integer, dan kadangkala sebagai (sebuah array dari) byte.

Contoh yang terakhir:

Type
     Q = RECORD
         case boolean of
             true: (i:integer);
             false: (p:array[1..4] of byte)
     END;
Var x:^Q ;
begin
     new(x);
     x^.i:=5;
     if x^.p[1]=5 then
         writeln(x^.p[1],' Your machine is Little Endian')
     else
         if x^.p[4]=5 then
             writeln(x^.p[1],' Your machine is Big Endian')
         else
             writeln(x^.p[1],' ',x^.p[2],' ',x^.p[3],' ',x^.p[4],' Your machine''s endianness is indeterminate; please report the results to the compiler development team');
     writeln;
    {Make it wait so we can see the results }
     write('Press enter when you finish reading this ');
     readln;
end.

Pada mesin endian kecil (PCs), kode di atas akan menulis 5 (karena longint(5) disimpan sebagai 05 00 00 00 dalam memori), sementara pada mesin endian besar (contohnya Powermacs) ia akan menulis 0 (karena longint(5) disimpan sebagai 00 00 00 05 dalam memori). (Jika anda mendapatkan laporan mesin anda adalah menengah, silahkan laporkan pada halaman wiki ini apa yang tidak didapatkan dan didapatkan prosesor ini!)

Untuk menentukan endianness dari sebuah prosesor, gunakan ENDIAN_BIG atau ENDIAN_LITTLE (atau FPC_LITTLE_ENDIAN dan FPC_BIG_ENDIAN mulai dari versi 1.9) mendefinisikan bahwa didefinisikan oleh freepascal secara otomatis tergantung pada prosesor.

Penjajaran

Beberapa prosesor akan membolehkan penjajaran data yang tidak benar dengan mengurangi efisiensi (IBM 370/zSeries). Beberapa prosesor membuat eksepsi prosesor hardware saat data dijajarkan dengan buruk (misalnya Alpha atau ARM). Adakalanya eksepsi hardware ditangkap dan dibetulkan menggunakan emulasi oleh OS, tapi ini sangat lambat, dan harus dihindari. Ini juga bisa menyebabkan records harus mempunyai ukuran berbeda, maka selalu gunakan sizeof(recordtype); sebagai ukuran record. Jika anda mendefinisikan packed record, coba untuk memastikan bahwa data dijajarkan secara alami, bila memungkinkan. Beberapa prosesor hanya menjajarkan persyaratan untuk tipe data tertentu, seperti floating point (misalnya PowerPC lama).

Untuk memeriksa apakah CPU memerlukan penjajaran yang benar, periksa definisi FPC_REQUIRES_PROPER_ALIGNMENT (versi 1.9 dan lebih tinggi). Pada CPU 32 Bit ini biasanya berarti bahwa data sampai ukuran 4 harus dijajarkan secara alami. Jika anda ingin mengakses data unaligned, gunakan prosedur move untuk memindahkannya ke lokasi aligned sebelum memprosesnya. Prosedur move memelihara data unaligned dan menanganinya dengan benar.

Ada multipel strategi untuk penjajaran:

  • jajarkan setiap field pada multipel nilai tertentu (biasanya pangkat dua, 1,2,4,8. 1 sama dengan "packed")
  • padatkan sebelum setiap field yang dijajarkan pada multipel ukurannya (maka longint pada 4, int64 pada 8 bytes dll). Ini biasanya dikerjakan oleh kompilator C, yang mengapa FPC memanggilnya {$packrecords C}.

(Untuk array atau nested record, ukuran sub unit terbesarnya yang digunakan)

Mac OS X {$packrecords C} nampaknya memadatkan seluruh record di akhir guna memastikan ukuran tertentu. Ini masih diinvestigasi, dan mungkin akan dibetulkan dalam kompilator.

32 Bit vs. 64 Bit

Untuk mencapai kompatibilitas maksimum dengan kode lebih lama, FPC tidak mengubah ukuran tipe data yang sudah didefinisikan seperti integer, longint atau word ketika mengubah dari 32 ke 64 Bit. Akan tetapi, ukuran pointer adalah 8 byte pada arsitektur 64 bit maka membentuk seperti longint(pointer(p)) pasti rusak pada arsitektur 64 bit. Untuk membolehkan anda menulis kode portabel, unit system FPC memperkenalkan tipe PtrInt dan PtrUInt yang adalah tipe data integer signed dan unsigned dengan ukuran yang sama sebagai sebuah pointer.

Harap diingat bahwa perubahan ukuran dari tipe "pointer" juga mempengaruhi ukuran record. Jika anda mengalokasikan records dengan ukuran tetap, dan tidak dengan new atau dengan getmem (<x>,sizeof(<x>)), ini harus dibetulkan.

Ini adalah baris dengan platform Unix paling terbuka. Dalam dunia komersial, ada beberapa kekecualian seperti Tru64, yang adalah ILP64

Konvensi pemanggilan

  • Untuk IBM 370 dan zSeries, lihat halaman ZSeries untuk diskusi lebih jauh.

Secara umum, hindari ketergantungan pada pengetahuan internal, seperti jika dikirimkan oleh const pada stack atau dengan value.

x86

ARM

68K


navigation bar: data types
simple data types

boolean byte cardinal char currency extended int64 integer longint pointer real shortint smallint word

complex data types

array class object record set string shortstring