Bantuan Pencarian :   
Home arrow Artikel arrow Web Programming arrow HTML Basic arrow HTML Character Sets
HTML Character Sets PDF Cetak E-mail
(4 votes)
Ditulis Oleh oscorp   
Wednesday, 28 January 2009
Untuk menampilkan halaman HTML dengan benar, browser harus tahu apa-set karakter yang akan digunakan. Karakter-set awal untuk world wide web adalah ASCII.  ASCII mendukung angka 0-9, dengan huruf besar dan huruf kecil abjad Inggris, dan beberapa karakter khusus.

ASCII referensi lengkap.

Karena banyak negara yang menggunakan karakter yang bukan merupakan bagian dari ASCII, standar-karakter yang sudah ditetapkan untuk browser modern adalah ISO-8859-1.

Referensi Lengkap ISO-8859-1

Jika halaman web menggunakan karakter yang berbeda-menetapkan dari ISO-8859-1, harus ditentukan dalam <meta> tag.

Try it yourself Coba sendiri


ISO Character Sets

Itu Organisasi Standar Internasional (ISO) yang menentukan standar-set karakter yang berbeda untuk alphabets / bahasa. Karakter yang berbeda-set yang digunakan di seluruh dunia tercantum di bawah ini:

  Karakter yang Anda gunakan Keterangan Meliputi
ISO-8859-1 Latin bagian 1 Amerika Utara, Eropa Barat, Amerika Latin, Karibia, Kanada, Afrika
ISO-8859-2 Latin bagian 2 Eropa Timur
ISO-8859-3 Latin bagian 3 SE Europe, Esperanto, miscellaneous others SE Eropa, Esperanto, miscellaneous lain
ISO-8859-4 Latin bagian 4 Skandinavia / Baltics (dan lain-lain tidak dalam ISO-8859-1)
ISO-8859-5 Latin / Cyrillic alphabet bagian 5 Bahasa yang menggunakan alfabet Cyrillic seperti Bulgaria, Belarusia, Rusia dan Makedonia
ISO-8859-6 Latin / abjad Arab bagian 6 Bahasa yang menggunakan alfabet Arab
ISO-8859-7 Latin / Yunani abjad bagian 7 Bahasa Yunani modern serta simbol matematika berasal dari Yunani
ISO-8859-8 Latin / 8 bagian abjad Ibrani Bahasa yang menggunakan abjad Ibrani
ISO-8859-9 Latin alphabet 5 bagian 9 Dengan bahasa Turki. Sama seperti ISO-8859-1 Turki kecuali karakter yang menggantikan Islandia
ISO-8859-10 6 Lappish Latin, Nordik, Eskimo Yang bahasa Nordik
ISO-8859-15 Latin 9 (alias Latin 0) serupa tetapi beberapa kurang umum menggantikan simbol dengan tanda euro dan beberapa lainnya hilang karakter
ISO-2022-JP Latin / Jepang abjad bagian 1 Bahasa Jepang
ISO-2022-JP-2 Latin / Jepang abjad bagian 2 Bahasa Jepang
ISO-2022-KR Latin / Korea abjad bagian 1 Bahasa Korea


Unicode Standard

Karena karakter-set yang tercantum di atas hanya terbatas pada ukuran, dan tidak kompatibel dalam multibahasa lingkungan, yang Unicode Consortium mengembangkan standar Unicode. Unicode standar yang mencakup semua karakter, punctuations, dan simbol di dunia.

  Unicode memungkinkan pemrosesan, dan penyimpanan data interchange teks tidak peduli apa yang menjadi platform, apapun program, tidak peduli apa bahasa.


Unicode Consortium

  Unicode Consortium mengembangkan standar Unicode. Tujuan mereka adalah untuk mengganti karakter yang ada dengan menetapkan standar Unicode Transformation Format (UTF).  Unicode standar yang telah menjadi sukses dan diimplementasikan dalam XML, Java, ECMAScript (JavaScript), LDAP, CORBA 3.0, WML, dll standar Unicode yang juga didukung oleh banyak sistem operasi dan semua browser modern.

   Unicode Konsorsium yang bekerja sama dengan yang standar pengembangan organisasi, seperti ISO, W3C, dan ECMA. Unicode dapat diterapkan oleh berbagai karakter-set. The most commonly used encodings are UTF-8 and UTF-16: Yang paling umum digunakan adalah encodings UTF-8 dan UTF-16:

Character-set  Keterangan
UTF-8 karakter dalam UTF8 dapat 1-4 byte panjang. UTF-8 bisa mewakili setiap karakter dalam standar Unicode. UTF-8 yang kompatibel dengan ASCII.  UTF-8 encoding adalah pilihan untuk e-mail dan halaman web
UTF-16 16-bit Unicode Transformation Format adalah variabel-panjang karakter untuk Unicode, mampu encoding Unicode seluruh repertoar. UTF-16 digunakan dalam sistem operasi utama dan lingkungan, seperti Microsoft Windows dan 2000/XP/2003/Vista/CE Java dan. NET byte kode lingkungan

Tip: 256 karakter pertama dari Unicode karakter-set sesuai dengan 256 karakter ISO-8859-1.

Tips: Semua HTML 4 prosesor sudah mendukung UTF-8, dan semua XHTML dan XML prosesor dukungan UTF-8 dan UTF-16!

» No Comments
There are no comments up to now.
» Post Comment
Email (will not be published)
Name
Title
Comment
Pemutakhiran Terakhir ( Wednesday, 28 January 2009 )
 
< Sebelumnya   Berikutnya >

Donate Via Paypal

Enter Amount:

Online

Saat ini ada 3 tamu online
mod_vvisit_countermod_vvisit_countermod_vvisit_countermod_vvisit_countermod_vvisit_countermod_vvisit_countermod_vvisit_counter
mod_vvisit_counterToday185
mod_vvisit_counterYesterday255
mod_vvisit_counterThis week1025
mod_vvisit_counterThis month2281
mod_vvisit_counterAll111012

Page Rank


PageRank
Add to Google
Computer Blogs - BlogCatalog Blog Directory