HTML 문자 집합

HTML 페이지를 올바르게 표시하기 위해 브라우저는 사용할 문자 집합(编码)을 알아야 합니다:

예제

<meta charset="UTF-8">

HTML 문자 집합

HTML5 표준은 웹 개발자가 UTF-8 문자 집합을 사용하도록 장려합니다!

하지만 항상 이렇지 않았습니다. 초기 웹의 문자编码는 ASCII였습니다.

그러나 이는 항상 이렇지 않았습니다. 초기 웹의 문자编码는 ASCII였습니다.

XML과 HTML5가 등장하면서 UTF-8가 최종적으로 등장하여 많은 문자编码 문제를 해결했습니다.

처음: ASCII

컴퓨터 데이터는 전자 장치에서 이진 코드(01000101)로 저장됩니다.

텍스트 저장을 표준화하기 위해 미국 정보 교환 표준 코드(American Standard Code for Information Interchange, ASCII)가 만들어졌습니다. 이는 0-9 사이의 숫자, 대문자와 소문자(a-z, A-Z) 및 특수 문자(예: ! $ + - ( ) @ < > ,) 등 모든 저장 가능한 문자에 대해 독립적인 이진 숫자를 정의합니다.

ASCII가 7비트 문자를 사용하기 때문에 128개의 다른 문자를 나타낼 수 있습니다.

ASCII의 가장 큰 단점은 영어 문자 외의 문자를 제외한다는 것입니다.

현재, ASCII는 특히 대형 호스트 컴퓨터 시스템에서 여전히 사용되고 있습니다.

더 깊이 연구하려면 우리의 완전한 ASCII 참조

Windows에서: Windows-1252

Windows-1252는 Windows(Windows 95까지)의 기본 문자 집합입니다.

그것은 ASCII의 확장으로, 국제 문자를 추가했습니다.

그것은 256개의 다른 문자를 나타내기 위해 전체 바이트(8비트)를 사용합니다.

Windows-1252가 Windows의 기본 설정이기 때문에 모든 브라우저가 그것을 지원합니다.

더 깊이 연구하려면 우리의 완전한 Windows-1252 참조

HTML 4에서: ISO-8859-1

HTML 4에서 가장 일반적으로 사용되는 문자 집합은 ISO-8859-1입니다.

ISO-8859-1는 ASCII의 확장으로, 국제 문자를 추가했습니다.

예제

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">

HTML 4에서는 <meta> 태그에서 ISO-8859-1과 다른 문자 집합을 지정할 수 있습니다:

예제

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-8">

모든 HTML 4 처리기도 UTF-8를 지원합니다:

예제

<meta http-equiv="Content-Type" content="text/html;charset=UTF-8">

추천:브라우저가 ISO-8859-1을 감지할 때, Windows-1252로 기본적으로 설정되는 이유는 Windows-1252가 32개의 국제 문자를 추가로 가지고 있기 때문입니다.

더 깊이 연구하려면 우리의 ISO-8859-1 전체 참조

HTML5에서: Unicode UTF-8

HTML5 규범은 웹 개발자가 UTF-8 문자 집합을 사용하도록 권장합니다.

예제

<meta charset="UTF-8">

UTF-8와 다른 문자 집합을 <meta> 태그에서 지정할 수 있습니다:

예제

<meta charset="ISO-8859-1">

Unicode 연맹은 UTF-8 및 UTF-16 표준을 개발했으며, ISO-8859 문자 집합은 제한적이며 다국어 환경과 호환되지 않기 때문입니다.

Unicode 표준은 (거의) 세계의 모든 문자, 표기 기호 및 기호를 포함하고 있습니다.

추천:모든 HTML5 및 XML 처리기는 UTF-8, UTF-16, Windows-1252 및 ISO-8859를 지원합니다.

더 깊이 연구하려면 우리의 전체 Unicode 참조