HTML エンコーディング(文字セット)

HTMLページを正しく表示するために、Webブラウザは使用する文字セットを知らなければなりません。

ASCIIからUTF-8へ

ASCIIは最初の文字エンコーディング標準です。ASCIIはインターネットで使用できる128種類の文字を定義しています:数字(0-9)、英文字母(A-Z)および特定のシンボルなど、! $ + - ( ) @ < >。

ISO-8859-1はHTML4のデフォルトの文字セットです。この文字セットは256個の異なる文字コードをサポートしています。HTML4はUTF-8もサポートしています。

ANSI(Windows-1252)は、オリジナルのWindows文字セットです。ANSIはISO-8859-1と同じですが、ANSIには32個の追加の文字があります。

HTML5規格は、Web開発者がUTF-8文字セットを使用することを推奨しています。この文字セットは、世界中のほとんどの文字とシンボルをカバーしています!

HTML charset属性

HTMLページを正しく表示するために、Webブラウザはページで使用される文字セットを理解する必要があります。

これは <meta> タグで指定されます:

<meta charset="UTF-8">

実際に試してみてください

文字セット間の違い

以下の表は、上記の文字セット間の違いを示しています:

ナンバー ASCII ANSI 8859 UTF-8 説明
32 スペース
33!!!!エクスクラメーションマーク
34""""クオートマーク
35####ナンバーシグン
36$$$$ドルシグン
37%%%%パーセントシグン
38&&&&ampersand
39''''38
&アンペラーズアンペラーズアンペラーズアンペラーズ'
アポストロフィー40404040(
左括弧41414141)
右括弧****アスタリスク
+プラス記号プラス記号プラス記号プラス記号,
カンマ45454545-
ハイフンマイナス....ピリオド
47////破線
480000数字0
491111数字1
502222数字2
513333数字3
524444数字4
535555数字5
546666数字6
557777数字7
568888数字8
579999数字9
58::::冒号
6059595959;
句点60606060<
より小さい記号61616161=
等号62626262>
より大きな記号????疑問符
64@@@@商用アットマーク
65AAAAラテン大文字のA
66BBBBラテン大文字のB
67CCCCラテン大文字のC
68DDDDラテン大文字のD
69EEEEラテン大文字のE
70FFFFラテン大文字のF
71GGGGラテン大文字のG
72HHHHラテン大文字のH
73IIIIラテン大文字のI
74JJJJラテン大文字のJ
75KKKKラテン大文字のK
76LLLLラテン大文字のL
77MMMMラテン大文字のM
78NNNNラテン大文字のN
79OOOOラテン大文字のO
Latin capital letter MNNNNLatin capital letter N
OLatin capital letter OLatin capital letter OLatin capital letter OLatin capital letter O80
PLatin capital letter PLatin capital letter PLatin capital letter PLatin capital letter P81
QLatin capital letter QLatin capital letter QLatin capital letter QLatin capital letter Q82
RLatin capital letter RLatin capital letter RLatin capital letter RLatin capital letter R83
SLatin capital letter SLatin capital letter SLatin capital letter SLatin capital letter S84
TLatin capital letter TLatin capital letter TLatin capital letter TLatin capital letter T85
ULatin capital letter ULatin capital letter ULatin capital letter ULatin capital letter U86
VLatin capital letter VLatin capital letter VLatin capital letter VLatin capital letter V87
WLatin capital letter WLatin capital letter WLatin capital letter WLatin capital letter W88
XLatin capital letter XLatin capital letter XLatin capital letter XLatin capital letter X89
YLatin capital letter YLatin capital letter YLatin capital letter YLatin capital letter Y90
ZLatin capital letter ZLatin capital letter ZLatin capital letter ZLatin capital letter Z91
[left square bracketleft square bracketleft square bracketleft square bracket\
reverse solidus]]]]right square bracket
^circumflex accentcircumflex accentcircumflex accentcircumflex accent_
low line````grave accent
97aaaaLatin small letter a
98bbbbLatin small letter b
99ccccLatin small letter c
100ddddLatin small letter d
101eeeeLatin small letter e
102ffffLatin small letter f
103ggggLatin small letter g
104hhhhLatin small letter h
105iiiiLatin small letter i
106jjjjLatin small letter j
107kkkkLatin small letter k
108llllLatin small letter l
109mmmmLatin small letter m
110nnnnLatin small letter n
111ooooLatin small letter o
112ppppLatin small letter p
113qqqqLatin small letter q
114rrrr小文字r
115ssss小文字s
116tttt小文字t
117uuuu小文字u
118vvvv小文字v
119wwww小文字w
120xxxx小文字x
121yyyy小文字y
122zzzz小文字z
123{{{{左カッコ
124||||垂直線
125}}}}右カッコ
126タilde
127DEL    
128   ユーロ記号
129 ˇˇˇsingle right-pointing angle quotation mark
130 ˇ  低9の引用符
131 ˇ  小文字fにハOOK
132 ˇ  二重低9の引用符
133   水平省略符
134 ˇ  ダッシュ
135 ˇ  二重ダッシュ
136 ˇ  変更記号
137 ˇ  千の記号
138 ˇ  帶鍵の大文字S
139 ˇ  左斜角引用符
140 ˇ  大文字OE連結
141 ˇˇˇsingle right-pointing angle quotation mark
142 ˇ  帶鍵の大文字Z
143 ˆˆˆsingle right-pointing angle quotation mark
144 ˇˇˇsingle right-pointing angle quotation mark
145   左单引号
146   右单引号
147   左双引号
148   右双引号
149 •  bullet
150 –  en dash
151 149  149
• bullet  –
en dash —  em dash
152 ˜  small tilde
153 ™  trade mark sign
154 š  Latin small letter s with caron
155 ›››single right-pointing angle quotation mark
156 œ  Latin small ligature oe
157   NOT USED
158    ž
Latin small letter z with caron 159159159Ÿ
Latin capital letter Y with diaeresis 160160160no-break space
¡ inverted exclamation markinverted exclamation markinverted exclamation mark¢
cent sign £££pound sign
¤ currency signcurrency signcurrency sign¥
yen sign 166166166¦
broken bar 167167167§
section sign 168168168¨
diaeresis 169169169©
copyright sign 170170170ª
feminine ordinal indicator 171171171«
left-pointing double angle quotation mark 172172172¬
not sign ­­­soft hyphen
174 ®®®registered sign
175 ¯¯¯macron
176 °°°degree sign
177 ±±±plus-minus sign
178 ²²²superscript two
179 ³³³superscript three
180 ´´´acute accent
181 µµµmicro sign
182 pilcrow sign
183 ···middle dot
184 ¸¸¸cedilla
185 ¹¹¹superscript one
186 ºººmasculine ordinal indicator
187 »»»右向双引号
188 ¼¼¼分数四分之一
189 ½½½分数一半
190 ¾¾¾分数三又四分之一
191 ¿¿¿倒置的问号
192 ÀÀÀ大写字母A上面有重音
193 ÁÁÁ大写字母A上面有尖角
194 ÂÂÂ大写字母A上面有反钩
195 ÃÃÃ大写字母A上面有波浪线
196 ÄÄÄ大写字母A上面有二点
197 ÅÅÅ大写字母A上面有圆环
198 ÆÆÆ大写字母AE
199 ÇÇÇ大写字母C下面有连字符
200 ÈÈÈ大写字母E上面有重音
201 ÉÉÉ大写字母E上面有尖角
202 ÊÊÊ大写字母E上面有反钩
203 ËËË大写字母E上面有二点
204 ÌÌÌ大写字母I上面有重音
205 ÍÍÍ大写字母I上面有尖角
206 ÎÎÎ大写字母I上面有反钩
207 ÏÏÏ大写字母I上面有二点
208 ÐÐÐ大写字母Eth
209 ÑÑÑN字母上面有波浪线
210 ÒÒÒラテン大文字O、グレイブ付き
211 ÓÓÓラテン大文字O、アクセント付き
212 ÔÔÔラテン大文字O、カール付き
213 ÕÕÕラテン大文字O、トレマ付き
214 ÖÖÖラテン大文字O、二重点付き
215 ×××乗算記号
216 ØØØラテン大文字O、ストローク付き
217 ÙÙÙラテン大文字U、グレイブ付き
218 ÚÚÚラテン大文字U、アクセント付き
219 ÛÛÛラテン大文字U、カール付き
220 ÜÜÜラテン大文字U、二重点付き
221 ÝÝÝラテン大文字Y、アクセント付き
222 ÞÞÞラテン大文字ス
223 ßßßラテン小文字シャープエス
224 àààラテン小文字エ、グレイブ付き
225 áááラテン小文字エ、アクセント付き
226 âââラテン小文字エ、カール付き
227 ãããラテン小文字エ、トレマ付き
228 äääラテン小文字エ、二重点付き
229 åååラテン小文字エ、リング付き
230 æææラテン小文字エー
231 çççラテン小文字シ、セディル付き
232 èèèラテン小文字エ、グレイブ付き
233 ééé小文字のラテン文字eに鋭い
234 êêê小文字のラテン文字eに円周記号
235 ëëë小文字のラテン文字eに重音記号
236 ììì小文字のラテン文字iに重い
237 ííí小文字のラテン文字iに鋭い
238 îîî小文字のラテン文字iに円周記号
239 ïïï小文字のラテン文字iに重音記号
240 ððð小文字のラテン文字eth
241 ñññ小文字のラテン文字nにフタオ
242 òòò小文字のラテン文字oに重い
243 óóó小文字のラテン文字oに鋭い
244 ôôô小文字のラテン文字oに円周記号
245 õõõ小文字のラテン文字oにフタオ
246 ööö小文字のラテン文字oに重音記号
247 ÷÷÷除算記号
248 øøøラテン文字oにストローク
249 ùùù小文字のラテン文字uに重い
250 úúú小文字のラテン文字uに鋭い
251 ûûûラテン文字に円周記号
252 üüü小文字のラテン文字uに重音記号
253 ýýý小文字のラテン文字yに鋭い
254 þþþ小文字のラテン文字thorn
255 ÿÿÿ小文字のラテン文字yに重音記号

ASCII文字セット

ASCIIは0から31(および127)の値を使用して制御文字としています。

ASCII は 32 から 126 までの値を使用して、文字、数字、記号を表します。

ASCII は 128 から 255 までの値を使用しません。

ANSI 字符セット (Windows-1252)

値 0 から 127 までの範囲では、ANSI は ASCII と同じです。

ANSI には 128 から 159 までの値を持つ独自の文字セットがあります。

値 160 から 255 までの範囲では、ANSI と UTF-8 が同じです。

ISO-8859-1 字符セット

値 0 から 127 までの範囲では、8859-1 は ASCII と同じです。

8859-1 は 128 から 159 までの値を使用しません。

値 160 から 255 までの範囲では、8859-1 と UTF-8 が同じです。

UTF-8 字符セット

値 0 から 127 までの範囲では、UTF-8 は ASCII と同じです。

UTF-8 は 12 から 159 までの値を使用しません。

値 160 から 255 までの範囲では、UTF-8 は ANSI および 8859-1 と同じです。

UTF-8 は値 256 から続き、10,000 以上の異なる文字を含んでいます。

さらに詳しく知りたい場合は、完全な HTML 字符セットリファレンスマニュアルを読んでください。

CSS @charset ルール

CSS @charset ルールを使用して、スタイルシートで使用する文字エンコーディングを指定できます:

スタイルシートのエンコーディングを Unicode UTF-8 に設定します:

@charset "UTF-8";

詳細については、CSS リファレンスマニュアルを参照してください。 CSS @charset ルール の内容。