Hàm get_html_translation_table() trong PHP

实例

Đầu ra bảng dịch được sử dụng bởi hàm htmlspecialchars:

新增了
print_r (get_html_translation_table()); // HTML_SPECIALCHARS là mặc định
参数。

Ví dụ thực hành

Định nghĩa và cách sử dụng

Hàm get_html_translation_table() trả về htmlentities()htmlspecialchars() Bảng dịch được sử dụng bởi hàm.

Lưu ý:Một số ký tự có thể được mã hóa theo nhiều cách khác nhau. Hàm get_html_translation_table() trả về mã hóa phổ biến nhất.

Cú pháp

get_html_translation_table(function,flags,character-set)
Tham số Mô tả
function

Tùy chọn. Định nghĩa trả về bảng dịch nào.

Giá trị có thể:

  • HTML_SPECIALCHARS - Mặc định. Dịch các ký tự cần mã hóa URL để hiển thị chính xác trên trang HTML
  • HTML_ENTITIES - Dịch tất cả các ký tự cần mã hóa URL để hiển thị chính xác trên trang HTML
flags

Tùy chọn. Quy định bảng dịch mã sẽ chứa loại dấu ngoặc kép nào và bảng dịch mã được sử dụng cho loại tài liệu nào.

Loại dấu ngoặc kép có sẵn:

  • ENT_COMPAT - Mặc định. Bảng dịch mã chứa các mã bản đồ kép, không chứa mã bản đồ đơn.
  • ENT_QUOTES - Bảng dịch mã chứa các mã bản đồ kép và đơn.
  • ENT_NOQUOTES - Bảng dịch mã không chứa các mã bản đồ kép và đơn.

Đặt các cờ phụ để quy định loại tài liệu mà bảng dịch mã áp dụng:

  • ENT_HTML401 - Mặc định. Bảng dịch mã của HTML 4.01.
  • ENT_HTML5 - Bảng dịch mã của HTML 5.
  • ENT_XML1 - Bảng dịch mã của XML 1.
  • ENT_XHTML - Bảng dịch mã của XHTML.
character-set

Tùy chọn. Giá trị chuỗi, quy định tập hợp ký tự cần sử dụng.

Giá trị cho phép:

  • UTF-8 - Mặc định. ASCII tương thích với 8 byte Unicode đa byte
  • ISO-8859-1 - Tây Âu
  • ISO-8859-15 - Tây Âu (thêm biểu tượng euro + các ký tự tiếng Pháp và tiếng Phần Lan bị mất trong ISO-8859-1)
  • cp866 - Tập hợp ký tự Cyrillic专用 DOS
  • cp1251 - Tập hợp ký tự Cyrillic专用 Windows
  • cp1252 - Tập hợp ký tự西欧专用 Windows
  • KOI8-R - Tiếng Nga
  • BIG5 - Trung văn phồn thể, chủ yếu được sử dụng ở Đài Loan
  • GB2312 - Trung văn giản thể, tập hợp ký tự tiêu chuẩn quốc gia
  • BIG5-HKSCS - Big5 với mở rộng Hong Kong
  • Shift_JIS - Tiếng Nhật
  • EUC-JP - Tiếng Nhật
  • MacRoman - Tập hợp ký tự được sử dụng bởi hệ điều hành Mac

Ghi chú:Trong các phiên bản trước PHP 5.4, các tập hợp ký tự không thể nhận diện sẽ bị bỏ qua và được thay thế bằng ISO-8859-1. Từ PHP 5.4 trở đi, các tập hợp ký tự không thể nhận diện sẽ bị bỏ qua và được thay thế bằng UTF-8.

Chi tiết kỹ thuật

Giá trị trả về: Trả về bảng dịch mã dưới dạng mảng, ký tự gốc làm khóa tên, mã bản đồ làm khóa giá trị.
Phiên bản PHP: 4+

Nhật ký cập nhật:

Phiên bản Mô tả
PHP 5 character-set Giá trị mặc định của tham số thay đổi thành UTF-8.
PHP 5.4

Đã thêm các cờ phụ để quy định loại tài liệu mà bảng dịch mã áp dụng:

  • ENT_HTML401
  • ENT_HTML5
  • ENT_XML1
  • ENT_XHTML
PHP 5.3.4 新增了 character-set 参数。

更多实例

实例

HTML_SPECIALCHARS 的翻译表:

新增了
ENT_XML1
参数。

更多实例

实例
HTML_SPECIALCHARS 的翻译表:
  print_r (get_html_translation_table(HTML_SPECIALCHARS));
  例子 2
  HTML_ENTITIES 的翻译表:
  <?php
)

ENT_XHTML

PHP 5.3.4

新增了
character-set
参数。

更多实例

实例
HTML_SPECIALCHARS 的翻译表:
  print_r (get_html_translation_table(HTML_SPECIALCHARS));
  例子 2
  HTML_ENTITIES 的翻译表:
  <?php
  print_r (get_html_translation_table(HTML_ENTITIES));  
  ?>
  显示字符和实体名:
  Array
  (
  ["] => ["]
  [&] => [&]
  [<] => [<]
  [>] => [>]
  [ ] =>
  [?] => [¡]
  [?] => [¢]
  [?] => [£]
  [?] => [¤]
  [?] => [¥]
  [?] => [¦]
  [?] => [§]
  [?] => [¨]
  [?] => [©]
  [?] => [ª]
  [?] => [«]
  [?] => [¬]
  [?] => [®]
  [?] => [¯]
  [?] => [°]
  [?] => [±]
  [?] => [¹]
  [?] => [º]
  [?] => [»]
  [?] => [¼]
  [?] => [½]
  [?] => [¾]
  [?] => [¿]
  [?] => [À]
  [?] => [Á]
  [?] => [á]
  [?] => [ä]
  [?] => [å]
  [?] => [Æ]
  [?] => [Ç]
  [?] => [È]
  [?] => [É]
  [?] => [Ê]
  [?] => [Ë]
  [?] => [Ì]
  [?] => [Í]
  [?] => [Î]
  [?] => [Ï]
  [?] => [Ð]
  [?] => [Ñ]
  [?] => [Ò]
  [?] => [Ó]
  [?] => [Ô]
  [?] => [Õ]
  [?] => [Ö]
  [?] => [×]
  [?] => [Ø]
  [?] => [Ù]
  [?] => [Ú]
  [?] => [Û]
  [?] => [Ü]
  [?] => [Ý]
  [?] => [Þ]
  [?] => [ß]
  [?] => [à]
  [?] => [á]
  [?] => [â]
  [?] => [?]
  [?] => ä
  [?] => å
  [?] => æ
  [?] => ç
  [?] => è
  [?] => é
  [?] => ê
  [?] => ë
  [?] => ì
  [?] => í
  [?] => î
  [?] => ï
  [?] => ð
  [?] => ñ
  [?] => ò
  [?] => ó
  [?] => ô
  [?] => õ
  [?] => ö
  [?] => ÷
  [?] => ø
  [?] => ù
  [?] => ú
  [?] => û
  [?] => ü
  [?] => ý
  [?] => þ
  [?] => ÿ
  [?] => Œ
  [?] => œ
  [?] => Š
  [?] => š
  [?] => Ÿ
  [?] => ƒ
  [?] => Â
  [?] => ˜
  [Α] => Α
  [Β] => Β
  [Γ] => Γ
  [Δ] => Δ
  [Ε] => Ε
  [Ζ] => Ζ
  [Η] => Η
  [Θ] => Θ
  [Ι] => Ι
  [Κ] => Κ
  [Λ] => Λ
  [Μ] => Μ
  [Ν] => Ν
  [Ξ] => Ξ
  [Ο] => Ο
  [Π] => Π
  [Ρ] => Ρ
  [Σ] => Σ
  [Τ] => Τ
  [Υ] => Υ
  [Φ] => Φ
  [Χ] => Χ
  [Ψ] => Ψ
  [Ω] => Ω
  [α] => α
  [β] => β
  [γ] => γ
  [δ] => δ
  [ε] => ε
  [ζ] => ζ
  [η] => η
  [θ] => θ
  [ι] => ι
  [κ] => κ
  [λ] => λ
  [μ] => μ
  [ν] => ν
  [ξ] => ξ
  [ο] => ο
  [π] => π
  [ρ] => ρ
  [?] => ς
  [σ] => σ
  [τ] => τ
  [υ] => υ
  [φ] => φ
  [χ] => χ
  [ψ] => ψ
  [ω] => ω
  [?] => ϑ
  [?] => ϒ
  [?] => ϖ
  [?] =>  
  [?] =>
  [?] =>  
  [?] => ‌
  [?] => ‍
  [?] => ‎
  [?] => ‏
  [?] => –
  [?] => —
  [?] => ‘
  [?] => ’
  [?] => ‚
  [?] => “
  [?] => ”
  [?] => „
  [?] => †
  [?] => ‡
  [?] => •
  [?] => …
  [?] => ‰
  [′] => ′
  [″] => ″
  [?] => ‹
  [?] => ›
  [ ̄] => ‾
  [?] => ⁄
  [?] => €
  [?] => ℑ
  [?] => ℘
  [?] => ℜ
  [?] => ™
  [?] => ℵ
  [←] => ←
  [↑] => ↑
  [→] => →
  [↓] => ↓
  [?] => ↔
  [?] => ↵
  [?] => ⇐
  [?] => ⇑
  [?] => ⇒
  [?] => ⇓
  [?] => ⇔
  [?] => ∀
  [?] => ∂
  [?] => ∃
  [?] => ∅
  [?] => ∇
  [∈] => ∈
  [?] => ∉
  [?] => ∋
  [∏] => ∏
  [∑] => ∑
  [?] => −
  [?] => ∗
  [√] => √
  [∝] => ∝
  [∞] => ∞
  [∠] => ∠
  [∧] => ∧
  [∨] => ∨
  [∩] => ∩
  [∪] => ∪
  [∫] => ∫
  [∴] => ∴
  [~] => ∼
  [?] => ≅
  [≈] => ≈
  [≠] => ≠
  [≡] => ≡
  [≤] => ≤
  [≥] => ≥
  [?] => ⊂
  [?] => ⊃
  [?] => ⊄
  [?] => ⊆
  [?] => ⊇
  [⊕] => ⊕
  [?] => ⊗
  [⊥] => ⊥
  [?] => ⋅
  [?] => ⌈
  [?] => ⌉
  [?] => ⌊
  [?] => ⌋
  [?] => ⟨
  [?] => ⟩
  [?] => ◊
  [?] => ♠
  [?] => ♣
  [?] => ♥
  [?] => ♦
)