คู่มืออ้างอิง HTML Unicode (UTF-8)

หน้าก่อนหน้า สัญลักษณ์ HTML
หน้าต่อไป พื้นฐานละติน

Unicode Consortium

Unicode Consortium ได้พัฒนามาตรฐาน Unicode มุ่งหมายที่จะแทนที่ชุดตัวอักษรที่มีอยู่แล้วด้วยรูปแบบการแปลง Unicode มาตรฐาน (UTF)

มาตรฐาน Unicode ได้ประสบความสำเร็จและสามารถนำไปปฏิบัติด้วย HTML, XML, Java, JavaScript, อีเมล, ASP, PHP และอื่น ๆ มาตรฐานนี้ได้ทันที มีการสนับสนุนมาตรฐาน Unicode ในหลายระบบปฏิบัติการและบราวเซอร์ทั้งหมดที่มีปัจจุบัน

Unicode Consortium ร่วมมือกับองค์กรพัฒนามาตรฐานที่นำหน้า (เช่น ISO, W3C และ ECMA)

ตัวอักษร Unicode

Unicode สามารถสร้างด้วยตัวอักษรชุดต่าง ๆ หลากหลาย ระบบรหัสการที่ใช้งานมากที่สุดคือ UTF-8 และ UTF-16:

ชุดอักษร	การอธิบาย
UTF-8	ความยาวของตัวอักษรใน UTF-8 สามารถมีความยาวจาก 1 ถึง 4 ไบต์ UTF-8 สามารถแสดงแสดงแก้ไขตัวอักษรที่มีอยู่ในมาตรฐาน Unicode ได้ทั้งหมด UTF-8 มีความสามารถยอมรับ ASCII ได้ และเป็นรหัสการเข้าข้อมูลที่นิยมใช้สำหรับอีเมลและเว็บไซต์
UTF-16	รูปแบบการเข้ารหัส Unicode 16 บิตเป็นรูปแบบการเข้ารหัสตัวอักษรยาวของ Unicode ที่สามารถเข้ารหัสครอบคลุมทั้งหมดของ Unicode repertoire UTF-16 ใช้ในระบบปฏิบัติการและสภาพแวดล้อมหลัก เช่น Microsoft Windows, Java และ .NET

ชุดอักษร

การอธิบาย

UTF-8

ความยาวของตัวอักษรใน UTF-8 สามารถมีความยาวจาก 1 ถึง 4 ไบต์

UTF-8 สามารถแสดงแสดงแก้ไขตัวอักษรที่มีอยู่ในมาตรฐาน Unicode ได้ทั้งหมด

UTF-8 มีความสามารถยอมรับ ASCII ได้ และเป็นรหัสการเข้าข้อมูลที่นิยมใช้สำหรับอีเมลและเว็บไซต์

UTF-16

รูปแบบการเข้ารหัส Unicode 16 บิตเป็นรูปแบบการเข้ารหัสตัวอักษรยาวของ Unicode ที่สามารถเข้ารหัสครอบคลุมทั้งหมดของ Unicode repertoire

UTF-16 ใช้ในระบบปฏิบัติการและสภาพแวดล้อมหลัก เช่น Microsoft Windows, Java และ .NET

หมายเหตุ：ตัวอักษรแรก 128 ตัวของ Unicode (ตรงกันข้ามกับ ASCII) ใช้การเข้ารหัสแบบบิตที่หนึ่ง ซึ่งมีค่าเท่ากับค่าบิตของ ASCII ทำให้ข้อความ ASCII ที่มีประสิทธิภาพกลายเป็นการเข้ารหัส UTF-8 Unicode ที่มีประสิทธิภาพ

คำเตือน：HTML 4 สนับสนุน UTF-8 และ HTML 5 สนับสนุน UTF-8 และ UTF-16!

มาตรฐาน HTML5: Unicode UTF-8

เนื่องจากขนาดของชุดอักษรใน ISO-8859 มีจำกัด และไม่สามารถใช้งานได้ในสภาพแวดล้อมหลายภาษา สมาคม Unicode จึงพัฒนามาตรฐาน Unicode

มาตรฐาน Unicode (เกือบ) ครอบคลุมตัวอักษร สัญลักษณ์ และสัญลักษณ์ทั้งหมดของโลก

Unicode สนับสนุนการจัดการข้อความที่เป็นเอกสารที่ไม่ขึ้นกับแผงคอมพิวเตอร์และภาษา

รหัสอักษรปริมาณตัวเลขมาตรฐานของ HTML5 คือ UTF-8。

ถ้าชุดอักษรของเว็บไซต์ HTML5 ที่ใช้ต่างจาก UTF-8 ต้องระบุชุดอักษรนี้ในแท็ก <meta> อย่างต่อไปนี้：

ตัวอย่าง

<meta charset="ISO-8859-1">

ความแตกต่างระหว่าง Unicode และ UTF-8

Unicode คือชุดอักษร UTF-8 คือการเข้ารหัส

Unicode คือรายชื่อตัวอักษรที่มีตัวเลขเดียวกัน (จุดรหัส) และ A = 65, B = 66, C = 67, ...。

รายชื่อตัวเลขเดียวกันกับตัวอักษร "hello": 104 101 108 108 111

การเข้ารหัสคือวิธีที่แปลงเหล่าตัวเลขเป็นตัวเลขสองทศนิยมเพื่อเก็บไว้ในคอมพิวเตอร์:

การเข้ารหัส UTF-8 จะเก็บ "hello" อย่างนี้ (ระบบสองทศนิยม) 01101000 01100101 01101100 01101100 01101111

การเข้ารหัสแปลงตัวเลขเป็นระบบสองทศนิยม。ชุดอักษรแปลงอักษรเป็นตัวเลข。

รหัสอักษร UTF-8 HTML5

ตารางด้านล่างคือรายชื่อรหัสอักษร UTF-8 บางส่วนที่ HTML5 สนับสนุน：

รหัสอักษร	สิบตัวเลข	สิบหกตัวเลข
C0 Controls and Basic Latin	0-127	0000-007F
C1 Controls and Latin-1 Supplement	128-255	0080-00FF
Latin Extended-A	256-383	0100-017F
Latin Extended-B	384-591	0180-024F
Spacing Modifiers	688-767	02B0-02FF
Diacritical Marks	768-879	0300-036F
Greek and Coptic	880-1023	0370-03FF
Cyrillic Basic	1024-1279	0400-04FF
Cyrillic Supplement	1280-1327	0500-052F
General Punctuation	8192-8303	2000-206F
Currency Symbols	8352-8399	20A0-20CF
Letterlike Symbols	8448-8527	2100-214F
Arrows	8592-8703	2190-21FF
Mathematical Operators	8704-8959	2200-22FF
Box Drawings	9472-9599	2500-257F
Block Elements	9600-9631	2580-259F
Geometric Shapes	9632-9727	25A0-25FF
Miscellaneous Symbols	9728-9983	2600-26FF
Dingbats	9984-10175	2700-27BF

หน้าก่อนหน้า สัญลักษณ์ HTML
หน้าต่อไป พื้นฐานละติน

Course Schedule

HTML Character Set

HTML UTF-8

สัญลักษณ์ HTML

HTML Entity

หลักสูตรเลือกตั้ง

แนะนำหลักสูตร

คู่มืออ้างอิง HTML Unicode (UTF-8)

Unicode Consortium

ตัวอักษร Unicode

มาตรฐาน HTML5: Unicode UTF-8

ตัวอย่าง

ความแตกต่างระหว่าง Unicode และ UTF-8

รหัสอักษร UTF-8 HTML5

มีทางเลือกเครื่องมือ

คู่มืออ้างอิง CSS

ตัวอย่าง CSS

แบบทดสอบ CSS

หนังสือเรียนเกี่ยวกับ CSS

ลิงก์ผู้สนับสนุน