ชุดอักษร HTML

เพื่อแสดงหน้าเว็บ HTML ตามที่เห็นได้ โปรแกรมนอนรับต้องทราบชุดอักษร (การเข้ารหัส):

ตัวอย่าง

<meta charset="UTF-8">

ชุดอักษร HTML

มาตราฐาน HTML5 สนับสนุนให้นักพัฒนาเว็บใช้ชุดอักษร UTF-8!

แต่ไม่ได้เป็นเช่นนั้นตลอดเวลา ในช่วงต้นของ Web ระบบการเข้ารหัสตัวอักษรคือ ASCII

หลังจากนั้น จาก HTML 2.0 ถึง HTML 4.01 ISO-8859-1 ถือเป็นชุดอักษรมาตรฐาน

ด้วย XML และ HTML5 UTF-8 ก็ปรากฏขึ้นและแก้ปัญหาการเข้ารหัสตัวอักษรหลายอย่าง

ตอนแรก: ASCII

ข้อมูลคอมพิวเตอร์ถูกเก็บเป็นรหัสบิต (01000101) ในอุปกรณ์อิเล็กทรอนิกส์

เพื่อทำให้การเก็บข้อมูลของข้อความมีมาตรฐาน ได้มีการสร้าง American Standard Code for Information Interchange (ASCII) มาตรฐานสำหรับการแลกเปลี่ยนข้อมูลสหรัฐ ซึ่งกำหนดค่าบิตเดียวกันสำหรับแต่ละตัวอักษรที่สามารถเก็บได้ โดยรวมถึงตัวเลข 0-9 ตัวอักษรใหญ่และเล็ก (a-z, A-Z) และตัวอักษรพิเศษ (เช่น ! $ + - ( ) @ < > ,)

เนื่องจาก ASCII ใช้ตัวอักษร 7 บิต ดังนั้นมันสามารถแสดงความหมายตัวอักษร 128 ตัว

ข้อบกพร่องหลักของ ASCII คือมันที่เลือกปฏิบัติตัวอักษรที่ไม่ใช่ตัวอักษรอังกฤษ

ในปัจจุบัน ASCII ยังคงถูกใช้งาน โดยเฉพาะในระบบคอมพิวเตอร์เฮฟท์วี้ร์

ถ้าต้องการศึกษาลึกลงมากขึ้น โปรดเข้าชม คู่มือเต็ม ASCII.

ใน Windows: Windows-1252

Windows-1252 คือชุดอักษรที่ใช้งานไปทั่วไปใน Windows (จนถึง Windows 95)

มันคือการขยาย ASCII โดยเพิ่มตัวอักษรนานาชาติ

มันใช้แบบบิตเตอร์นิยมสมบูรณ์ (8 บิต) ที่แสดงความหมายตัวอักษร 256 ตัว

เนื่องจาก Windows-1252 คือการตั้งค่าเริ่มต้นใน Windows ดังนั้น ทุกเครื่องนอนรับสนอง

ถ้าต้องการศึกษาลึกลงมากขึ้น โปรดเข้าชม คู่มือเต็ม Windows-1252.

ใน HTML 4: ISO-8859-1

ISO-8859-1 คือชุดอักษรที่ใช้งานไปทั่วไปใน HTML 4

ISO-8859-1 คือการขยาย ASCII โดยเพิ่มตัวอักษรนานาชาติ

ตัวอย่าง

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">

ใน HTML 4 สามารถกำหนดชุดอักษรที่ต่างจาก ISO-8859-1 ในแท็ก <meta> ได้

ตัวอย่าง

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-8">

ทุกตัวบริการ HTML 4 มีการสนับสนุน UTF-8 ด้วย

ตัวอย่าง

<meta http-equiv="Content-Type" content="text/html;charset=UTF-8">

คำเตือน:เมื่อเบราซเรอร์ตรวจสอบความมีตาม ISO-8859-1 มันจะใช้ Windows-1252 โดยมาตรฐาน เพราะ Windows-1252 มีอักษรนานาชาติ 32 ตัว

ถ้าต้องการศึกษาลึกลงมากขึ้น โปรดเข้าชม คู่มืออ้างอิง ISO-8859-1 ทั้งหมด.

ใน HTML5: Unicode UTF-8

มาตราฐาน HTML5 สนับสนุนให้นักพัฒนาเว็บไซต์ใช้ชุดอักษร UTF-8

ตัวอย่าง

<meta charset="UTF-8">

สามารถกำหนดชุดอักษรที่ต่างจาก UTF-8 ในแท็ก <meta> ได้

ตัวอย่าง

<meta charset="ISO-8859-1">

สหภาพ Unicode ได้พัฒนามาตราฐาน UTF-8 และ UTF-16 ตามกลุ่มตัวเลขเพราะตัวเลข ISO-8859 มีขอบเขตจำกัดและไม่สามารถปรับตัวได้กับสภาพแวดล้อมที่มีหลายภาษา

มาตราฐาน Unicode (เกือบ) ครอบคลุมข้อความ จุดสัญญาณ และสัญลักษณ์ของโลกทั้งหมด

คำเตือน:ทุกตัวบริการ HTML5 และ XML ประมงค้างบันทึกตรวจสอบสนับสนุน UTF-8、UTF-16、Windows-1252 และ ISO-8859

ถ้าต้องการศึกษาลึกลงมากขึ้น โปรดเข้าชม คู่มืออ้างอิง Unicode ทั้งหมด.