مجموعة الحروف الخاصة بـ HTML

لعرض صفحة HTML بشكل صحيح، يجب أن يعرف المتصفح مجموعة الحروف (الترميز) التي سيتم استخدامه:

مثال

<meta charset="UTF-8">

مجموعة الحروف الخاصة بـ HTML

يحث معيار HTML5 مطورو الويب على استخدام مجموعة الحروف UTF-8!

لكن لم يكن دائمًا كذلك. كان ترميز النصوص في بداية الإنترنت ASCII.

فيما بعد، من HTML 2.0 إلى HTML 4.01، تم اعتبار ISO-8859-1 كمعيار مجموعة الحروف.

مع ظهور XML وHTML5، ظهر UTF-8 وألحقت حلًا لمشاكل الترميز الكتابي.

أولاً: ASCII

تخزن بيانات الحاسوب كشفاء ثنائية (01000101) في الأجهزة الإلكترونية.

لجعل تخزين النصوص موحدًا، تم إنشاء رمز التبادل المعياري الأمريكي للمعلومات (American Standard Code for Information Interchange، ASCII) لكل حرف قابلة للحفظ يُحدد له قيمة ثنائية فريدة لدعم الأرقام من 0 إلى 9 والأحرف الكبيرة والصغيرة (a-z، A-Z) والرموز الخاصة (مثل ! $ + - ( ) @ < > ,).

بما أن ASCII يستخدم 7 bits، فإنه يمكنه تمثيل 128 حرفًا مختلفًا فقط.

من أبرز عيوب ASCII أنه يستبعد الأحرف غير الإنجليزية.

اليوم، ASCII لا يزال يستخدم، خاصة في أنظمة الحواسيب الكبيرة.

للدراسة العميقة، يرجى زيارة مرجع كامل لـ ASCII.

في Windows: Windows-1252

Windows-1252 هو مجموعة الحروف الافتراضية في Windows (حتى Windows 95).

هى توسيع لـ ASCII، وضافت أحرف عالمية.

يستخدم وحدة البايت الكاملة (8 bits) لتمثيل 256 حرف مختلف.

بما أن Windows-1252 هو الإعداد الافتراضي في Windows، فإن جميع المتصفحات تدعمه.

للدراسة العميقة، يرجى زيارة مرجع كامل لـ Windows-1252.

في HTML 4: ISO-8859-1

مجموعة الحروف الأكثر استخدامًا في HTML 4 هى ISO-8859-1.

ISO-8859-1 هى توسيع لـ ASCII، وضافت أحرف عالمية.

مثال

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">

في HTML 4، يمكن تحديد مجموعة الحروف المختلفة عن ISO-8859-1 في علامة <meta>:

مثال

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-8">

جميع معالجات HTML 4 تدعم UTF-8 أيضًا:

مثال

<meta http-equiv="Content-Type" content="text/html;charset=UTF-8">

إشارة:عندما يكتشف المتصفح ISO-8859-1، فإنه عادةً يفترض Windows-1252، لأن Windows-1252 يحتوي على 32 حرفًا دوليًا إضافيًا.

للدراسة العميقة، يرجى زيارة مرجع ISO-8859-1 الكامل.

في HTML5: Unicode UTF-8

يشجع معيار HTML5 مطوري الويب على استخدام مجموعة الحروف UTF-8.

مثال

<meta charset="UTF-8">

يمكن تحديد مجموعة الحروف المختلفة عن UTF-8 في علامة <meta>:

مثال

<meta charset="ISO-8859-1">

اتحاد Unicode طور معايير UTF-8 و UTF-16 لأن مجموعة الحروف ISO-8859 مقيدة ولا تتناسب مع بيئات اللغات المتعددة.

يغطي معيار Unicode تقريبًا جميع الأحرف والقوائم والرموز في العالم.

إشارة:جميع معالجات HTML5 و XML تدعم UTF-8 و UTF-16 و Windows-1252 و ISO-8859.

للدراسة العميقة، يرجى زيارة مرجع Unicode الكامل.