Kitabu cha mafanikio ya Unicode (UTF-8) ya HTML

Unicode Union

Unicode Union inaendelea kwa kuwaingia standara ya Unicode. Matokeo yao ni kubadilisha vya heri vya sasa na kusababisha kuwa vya heri vya Unicode (UTF).

Standara ya Unicode imekamilika na imewekwa kwenye matumizi ya HTML, XML, Java, JavaScript, barua pepe, ASP, PHP na mengine. Inaonyeshwa kwa vifaa vya mawasiliano vya kawaida na vifaa vya kusoma vya mawingu zaidi zote.

Unicode Union inaendelea kwa kufanya kikao na vifumo vya uharibifu vya standara vya kawaida (kama ISO, W3C na ECMA).

Vya heri vya Unicode

Unicode inaweza kutumiwa kwa vya heri mbalimbali. Inayotumiwa kwa ufanikio zaidi ni UTF-8 na UTF-16:

Kituo cha herufi Muhtasari
UTF-8

Ukubwa wa heri katika UTF8 kinaweza kuwa 1 hadi 4 byte.

UTF-8 inaweza kuonekana kila heri katika Unicode.

UTF-8 inafaa ya ASCII. UTF-8 inaingiawa kufaa kwa barua pepe kwa tovuti

UTF-16

Muundo wa Unicode wa 16-vitabu ni muundo wa kina cha herufi wa urefu juu wa Unicode, unaoweza kuingiza kina cha kina cha Unicode kote.

UTF-16 inatumiwa kwa muhimu wa muhimu wa mazingira ya mawasiliano, kama Microsoft Windows, Java na .NET.

Kutumia:Herufi ya Unicode ya kwanza 128 (inayotumia binari kama ASCII) inaainishwa na byte wa kina mmoja, na byte hizi zina maadili ya binari yasiyotofautiana na ASCII, kwa hivyo maandiko ya ASCII yanaweza kuwa na maadili ya UTF-8.

Maelezo:HTML 4 inasimamia UTF-8. HTML 5 inasimamia UTF-8 na UTF-16!

Mandaro wa HTML5: Unicode UTF-8

Kwa sababu ukubwa wa kituo cha herufi cha ISO-8859 kinapofikia kina na kusikitika kwa mazingira ya lugha ya kawaida, Barabara ya Unicode inayoitwa Unicode inaendelea kuwa standara.

Mandaro ya Unicode (herufi, alama za kufikia na alama) inaonekana kwenye kina ya dunia kwa uharibifu.

Unicode inasimamia muhimu wa matukio ya harufi, hifadhi na kusafisha harufi kwa sababu ya kufikiria na lugha.

Kituo cha ripoti cha kawaida cha HTML5 kinahusiana na UTF-8.

Ikiwa kituo cha HTML5 cha tovuti kinatumia kituo cha herufi cha tofauti na UTF-8, inafaa kuyungumza kituo cha herufi kwenye kitambaa cha <meta>, kama:

Mifano

<meta charset="ISO-8859-1">

Muundo wa Unicode na UTF-8

Unicode ina kituo cha herufi. UTF-8 ina tukio.

Unicode ina orodha ya herufi yenye namba za tengeneza pekee (kampuni) ya herufi. A = 65, B = 66, C = 67, ...。

Tafanana ya namba za tengeneza inasema stringi ya "hello": 104 101 108 108 111

Tukio linaainishwa kama ukubadilisha namba hizi kuwa namba za binari kwa sababu ya kuhifadhi katika kompyuta:

Tukio la UTF-8 inasafishwa kama hii (binari) kuhifadhi "hello": 01101000 01100101 01101100 01101100 01101111

TukioTumia namba kuwa binari.Kituo cha herufiTumia herufi kuwa namba.

Kituo cha ripoti cha herufi cha UTF-8

Tafanana hii ina orodha ya maktaba ya herufi ya UTF-8 inayosimamia kwa HTML5:

Kituo cha ripoti cha herufi Tengeneza Hexi
C0 Mawasiliano na Kipindi cha Kati cha Kati cha Kati 0-127 0000-007F
Mawasiliano na Kipimo na Kipindi cha Kati cha Kati 128-255 0080-00FF
Makosa ya Kina ya Kina ya Kina 256-383 0100-017F
Makosa ya Kina ya Kina ya Kina ya Kina 384-591 0180-024F
Makosa ya Kina ya Kina ya Kina 688-767 02B0-02FF
Makosa ya Kina ya Kina 768-879 0300-036F
Makosa ya Kina ya Greek na Coptic 880-1023 0370-03FF
Makosa ya Kina ya Cyrillic ya Kwanza 1024-1279 0400-04FF
Makosa ya Kina ya Cyrillic 1280-1327 0500-052F
Vifaa ya Kina ya Kuzingatia 8192-8303 2000-206F
Mifano ya Simboli ya Kina ya Waliochukua Mabaki 8352-8399 20A0-20CF
Mifano ya Herufi 8448-8527 2100-214F
Mito ya Kina 8592-8703 2190-21FF
Vifaa ya Kina ya Saa 8704-8959 2200-22FF
Mifano ya Kichakaza 9472-9599 2500-257F
Mifano ya Mito ya Kina 9600-9631 2580-259F
Mifano ya Mito ya Kina 9632-9727 25A0-25FF
Mifano ya Simboli ya Kina 9728-9983 2600-26FF
Dingbats 9984-10175 2700-27BF