HTML 字集
- 前のページ HTML 字集
- 次のページ HTML ASCII
HTML ページを正しく表示するために、ブラウザは使用する文字セット(エンコーディング)を知らなければなりません:
例
<meta charset="UTF-8">
HTML 字集
HTML5 规範は、Web 開発者が UTF-8 文字セットを使用することを推奨しています!
しかし常にそうではありませんでした。初期のウェブの文字コードは ASCII でした。
その後、HTML 2.0 から HTML 4.01 まで、ISO-8859-1 が標準文字セットとして認められていました。
XML と HTML5 が登場し、UTF-8 がようやく登場し、多くの文字コード問題を解決しました。
最初:ASCII
コンピュータデータは、電子機器内に二進数コード(01000101)で保存されます。
テキストの保存を標準化するために、アメリカ情報交換標準コード(American Standard Code for Information Interchange、ASCII)が作成されました。それは、0-9の数字、大文字と小文字(a-z、A-Z)および特殊文字(例えば!$+−()@<>、)などの各可保存文字にユニークな二進数を定義しています。
ASCII は7ビットの文字を使用するため、128の異なる文字しか表現できません。
ASCII の最大の欠点は、非英字の文字を除外していることです。
今でも ASCII は使用されていますが、特に大規模なメインフレームコンピュータシステムでよく使用されます。
さらに詳しく知りたい場合は、私たちの 完全な ASCII リファレンス。
Windows では:Windows-1252
Windows-1252 は Windows(Windows 95 まで)のデフォルトの文字セットです。
それは ASCII の拡張であり、国際文字を追加しています。
それは完全なバイト(8ビット)を使用して256の異なる文字を表現します。
Windows-1252 は Windows(Windows 95 まで)のデフォルトの文字セットであるため、すべてのブラウザがそれをサポートしています。
さらに詳しく知りたい場合は、私たちの 完全な Windows-1252 リファレンス。
HTML 4 では:ISO-8859-1
HTML 4 で最もよく使用される文字セットは ISO-8859-1 です。
ISO-8859-1 は ASCII の拡張であり、国際文字を追加しています。
例
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">
HTML 4 では、<meta> タグで ISO-8859-1 以外の文字セットを指定することができます:
例
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-8">
すべての HTML 4 プロセッサーも UTF-8 をサポートしています:
例
<meta http-equiv="Content-Type" content="text/html;charset=UTF-8">
ヒント:ブラウザが ISO-8859-1 を検出した場合、通常は Windows-1252 がデフォルトで設定されます。なぜなら、Windows-1252 には 32 個の国際文字があるからです。
さらに詳しく知りたい場合は、私たちの 完全な ISO-8859-1 参考情報。
HTML5 では:Unicode UTF-8
HTML5 规范は、Web 開発者が UTF-8 字集を使用することを推奨しています。
例
<meta charset="UTF-8">
UTF-8 以外の文字セットを <meta> タグで指定することができます:
例
<meta charset="ISO-8859-1">
Unicode 聯盟は、ISO-8859 字集が制限されており、多言語環境に非対応であるため、UTF-8 と UTF-16 标準を開発しました。
Unicode 标準(ほぼ)世界中のすべての文字、記号、シンボルをカバーしています。
ヒント:すべての HTML5 と XML プロセッサーは UTF-8、UTF-16、Windows-1252、ISO-8859 をサポートしています。
さらに詳しく知りたい場合は、私たちの 完全な Unicode 参考情報。
- 前のページ HTML 字集
- 次のページ HTML ASCII