ชุดอักษร HTML
- หน้าก่อนหน้า ชุดอักษร HTML
- หน้าต่อไป HTML ASCII
เพื่อแสดงหน้าเว็บ HTML ตามที่เห็นได้ โปรแกรมนอนรับต้องทราบชุดอักษร (การเข้ารหัส):
ตัวอย่าง
<meta charset="UTF-8">
ชุดอักษร HTML
มาตราฐาน HTML5 สนับสนุนให้นักพัฒนาเว็บใช้ชุดอักษร UTF-8!
แต่ไม่ได้เป็นเช่นนั้นตลอดเวลา ในช่วงต้นของ Web ระบบการเข้ารหัสตัวอักษรคือ ASCII
หลังจากนั้น จาก HTML 2.0 ถึง HTML 4.01 ISO-8859-1 ถือเป็นชุดอักษรมาตรฐาน
ด้วย XML และ HTML5 UTF-8 ก็ปรากฏขึ้นและแก้ปัญหาการเข้ารหัสตัวอักษรหลายอย่าง
ตอนแรก: ASCII
ข้อมูลคอมพิวเตอร์ถูกเก็บเป็นรหัสบิต (01000101) ในอุปกรณ์อิเล็กทรอนิกส์
เพื่อทำให้การเก็บข้อมูลของข้อความมีมาตรฐาน ได้มีการสร้าง American Standard Code for Information Interchange (ASCII) มาตรฐานสำหรับการแลกเปลี่ยนข้อมูลสหรัฐ ซึ่งกำหนดค่าบิตเดียวกันสำหรับแต่ละตัวอักษรที่สามารถเก็บได้ โดยรวมถึงตัวเลข 0-9 ตัวอักษรใหญ่และเล็ก (a-z, A-Z) และตัวอักษรพิเศษ (เช่น ! $ + - ( ) @ < > ,)
เนื่องจาก ASCII ใช้ตัวอักษร 7 บิต ดังนั้นมันสามารถแสดงความหมายตัวอักษร 128 ตัว
ข้อบกพร่องหลักของ ASCII คือมันที่เลือกปฏิบัติตัวอักษรที่ไม่ใช่ตัวอักษรอังกฤษ
ในปัจจุบัน ASCII ยังคงถูกใช้งาน โดยเฉพาะในระบบคอมพิวเตอร์เฮฟท์วี้ร์
ถ้าต้องการศึกษาลึกลงมากขึ้น โปรดเข้าชม คู่มือเต็ม ASCII.
ใน Windows: Windows-1252
Windows-1252 คือชุดอักษรที่ใช้งานไปทั่วไปใน Windows (จนถึง Windows 95)
มันคือการขยาย ASCII โดยเพิ่มตัวอักษรนานาชาติ
มันใช้แบบบิตเตอร์นิยมสมบูรณ์ (8 บิต) ที่แสดงความหมายตัวอักษร 256 ตัว
เนื่องจาก Windows-1252 คือการตั้งค่าเริ่มต้นใน Windows ดังนั้น ทุกเครื่องนอนรับสนอง
ถ้าต้องการศึกษาลึกลงมากขึ้น โปรดเข้าชม คู่มือเต็ม Windows-1252.
ใน HTML 4: ISO-8859-1
ISO-8859-1 คือชุดอักษรที่ใช้งานไปทั่วไปใน HTML 4
ISO-8859-1 คือการขยาย ASCII โดยเพิ่มตัวอักษรนานาชาติ
ตัวอย่าง
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">
ใน HTML 4 สามารถกำหนดชุดอักษรที่ต่างจาก ISO-8859-1 ในแท็ก <meta> ได้
ตัวอย่าง
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-8">
ทุกตัวบริการ HTML 4 มีการสนับสนุน UTF-8 ด้วย
ตัวอย่าง
<meta http-equiv="Content-Type" content="text/html;charset=UTF-8">
คำเตือน:เมื่อเบราซเรอร์ตรวจสอบความมีตาม ISO-8859-1 มันจะใช้ Windows-1252 โดยมาตรฐาน เพราะ Windows-1252 มีอักษรนานาชาติ 32 ตัว
ถ้าต้องการศึกษาลึกลงมากขึ้น โปรดเข้าชม คู่มืออ้างอิง ISO-8859-1 ทั้งหมด.
ใน HTML5: Unicode UTF-8
มาตราฐาน HTML5 สนับสนุนให้นักพัฒนาเว็บไซต์ใช้ชุดอักษร UTF-8
ตัวอย่าง
<meta charset="UTF-8">
สามารถกำหนดชุดอักษรที่ต่างจาก UTF-8 ในแท็ก <meta> ได้
ตัวอย่าง
<meta charset="ISO-8859-1">
สหภาพ Unicode ได้พัฒนามาตราฐาน UTF-8 และ UTF-16 ตามกลุ่มตัวเลขเพราะตัวเลข ISO-8859 มีขอบเขตจำกัดและไม่สามารถปรับตัวได้กับสภาพแวดล้อมที่มีหลายภาษา
มาตราฐาน Unicode (เกือบ) ครอบคลุมข้อความ จุดสัญญาณ และสัญลักษณ์ของโลกทั้งหมด
คำเตือน:ทุกตัวบริการ HTML5 และ XML ประมงค้างบันทึกตรวจสอบสนับสนุน UTF-8、UTF-16、Windows-1252 และ ISO-8859
ถ้าต้องการศึกษาลึกลงมากขึ้น โปรดเข้าชม คู่มืออ้างอิง Unicode ทั้งหมด.
- หน้าก่อนหน้า ชุดอักษร HTML
- หน้าต่อไป HTML ASCII