Função get_html_translation_table() do PHP

Exemplo

Saída da tabela de tradução usada pela função htmlspecialchars:

<?php
print_r (get_html_translation_table()); // HTML_SPECIALCHARS é o padrão
?>

Exemplo de execução

Definição e uso

A função get_html_translation_table() retorna htmlentities() e htmlspecialchars() Tabela de tradução usada pela função.

Dica:Alguns caracteres podem ser codificados de várias maneiras. A função get_html_translation_table() retorna a codificação mais comum.

Sintaxe

get_html_translation_table(function,flags,character-set)
Parâmetros Descrição
function

Opcional. Define qual tabela de tradução será retornada.

Valores possíveis:

  • HTML_SPECIALCHARS - padrão. Traduz caracteres que precisam de codificação URL para serem exibidos corretamente na página HTML
  • HTML_ENTITIES - traduz todos os caracteres que precisam de codificação URL para serem exibidos corretamente na página HTML
flags

Opcional. Especifica o tipo de aspas que a tabela de tradução incluirá e o tipo de documento para o qual a tabela de tradução será usada.

Tipos de aspas disponíveis:

  • ENT_COMPAT - padrão. Tabela de tradução contém entidades de aspas duplas, não contém entidades de aspas simples.
  • ENT_QUOTES - tabela de tradução contém entidades de aspas duplas e aspas simples.
  • ENT_NOQUOTES - tabela de tradução não contém entidades de aspas duplas e aspas simples.

Adicionados flags adicionais para especificar o tipo de documento aplicável ao tabela de tradução:

  • ENT_HTML401 - padrão. Tabela de tradução do HTML 4.01.
  • ENT_HTML5 - tabela de tradução do HTML 5.
  • ENT_XML1 - tabela de tradução do XML 1.
  • ENT_XHTML - tabela de tradução do XHTML.
character-set

Opcional. Valor de string que especifica o conjunto de caracteres a ser usado.

Valores permitidos:

  • UTF-8 - padrão. ASCII compatível com múltiplos bytes de Unicode de 8 bits
  • ISO-8859-1 - Europa Ocidental
  • ISO-8859-15 - Europa Ocidental (adiciona símbolos de euro + letras francesas e finlandesas perdidas no ISO-8859-1)
  • cp866 - conjunto de caracteres专用 para Cyrillic do DOS
  • cp1251 - conjunto de caracteres专用 para Cyrillic do Windows
  • cp1252 - conjunto de caracteres专用 para o Windows da Europa Ocidental
  • KOI8-R - russo
  • BIG5 - chinês tradicional, principalmente usado em Taiwan
  • GB2312 - chinês simplificado, conjunto de caracteres padrão nacional
  • BIG5-HKSCS - Big5 com extensão para Hong Kong
  • Shift_JIS - japonês
  • EUC-JP - japonês
  • MacRoman - conjunto de caracteres usado pelo sistema operacional Mac

Notas:Nas versões do PHP anteriores ao 5.4, os conjuntos de caracteres não reconhecidos serão ignorados e substituídos por ISO-8859-1. A partir do PHP 5.4, os conjuntos de caracteres não reconhecidos serão ignorados e substituídos por UTF-8.

Detalhes técnicos

Valor de retorno: Retorna a tabela de tradução em forma de array, o caractere original como nome da chave e o entidade como valor da chave.
Versão do PHP: 4+

Registo de atualizações:

Versão Descrição
PHP 5 character-set O valor padrão do parâmetro foi alterado para UTF-8.
PHP 5.4

Adicionados flags adicionais para especificar o tipo de documento aplicável ao tabela de tradução:

  • ENT_HTML401
  • ENT_HTML5
  • ENT_XML1
  • ENT_XHTML
PHP 5.3.4 Adicionado character-set Parâmetros.

Mais exemplos

Exemplo

Tabela de tradução de HTML_SPECIALCHARS:

<?php
print_r (get_html_translation_table(HTML_SPECIALCHARS));
?>

Exibir caracteres e nomes de entidades:

Array
(
  ["] => "
  [&] => &
  [<] => <
  [>] => >
)

Exemplo 2

Tabela de tradução de HTML_ENTITIES:

<?php
print_r (get_html_translation_table(HTML_ENTITIES));
?>

Exibir caracteres e nomes de entidades:

Array
(
  ["] => "
  [&] => &
  [<] => <
  [>] => >
  [ ] =>  
  [?] => ¡
  [?] => ¢
  [?] => £
  [?] => ¤
  [?] => ¥
  [?] => ¦
  [?] => §
  [?] => ¨
  [?] => ©
  [?] => ª
  [?] => «
  [?] => ¬
  [?] => ­
  [?] => ®
  [?] => ¯
  [?] => °
  [?] => ±
  [?] => ²
  [?] => ³
  [?] => ´
  [?] => µ
  [?] => ¶
  [?] => ·
  [?] => ¸
  [?] => ¹
  [?] => º
  [?] => »
  [?] => ¼
  [?] => ½
  [?] => ¾
  [?] => ¿
  [?] => À
  [?] => Á
  [?] => â
  [?] => á
  [?] => ä
  [?] => å
  [?] => Æ
  [?] => Ç
  [?] => È
  [?] => É
  [?] => Ê
  [?] => Ë
  [?] => Ì
  [?] => Í
  [?] => Î
  [?] => Ï
  [?] => Ð
  [?] => Ñ
  [?] => Ò
  [?] => Ó
  [?] => Ô
  [?] => Õ
  [?] => Ö
  [?] => ×
  [?] => Ø
  [?] => Ù
  [?] => Ú
  [?] => Û
  [?] => Ü
  [?] => Ý
  [?] => Þ
  [?] => ß
  [?] => à
  [?] => á
  [?] => â
  [?] => ã
  [?] => ä
  [?] => å
  [?] => æ
  [?] => ç
  [?] => è
  [?] => é
  [?] => ê
  [?] => ë
  [?] => ì
  [?] => í
  [?] => î
  [?] => ï
  [?] => ð
  [?] => ñ
  [?] => ò
  [?] => ó
  [?] => ô
  [?] => õ
  [?] => ö
  [?] => ÷
  [?] => ø
  [?] => ù
  [?] => ú
  [?] => û
  [?] => ü
  [?] => ý
  [?] => þ
  [?] => ÿ
  [?] => Œ
  [?] => œ
  [?] => Š
  [?] => š
  [?] => Ÿ
  [?] => ƒ
  [?] => Â
  [?] => ˜
  [Α] => Α
  [Β] => Β
  [Γ] => Γ
  [Δ] => Δ
  [Ε] => Ε
  [Ζ] => Ζ
  [Η] => Η
  [Θ] => Θ
  [Ι] => Ι
  [Κ] => Κ
  [Λ] => Λ
  [Μ] => Μ
  [Ν] => Ν
  [Ξ] => Ξ
  [Ο] => Ο
  [Π] => Π
  [Ρ] => Ρ
  [Σ] => Σ
  [Τ] => Τ
  [Υ] => Υ
  [Φ] => Φ
  [Χ] => Χ
  [Ψ] => Ψ
  [Ω] => Ω
  [α] => α
  [β] => β
  [γ] => γ
  [δ] => δ
  [ε] => ε
  [ζ] => ζ
  [η] => η
  [θ] => θ
  [ι] => ι
  [κ] => κ
  [λ] => λ
  [μ] => μ
  [ν] => ν
  [ξ] => ξ
  [ο] => ο
  [π] => π
  [ρ] => ρ
  [?] => ς
  [σ] => σ
  [τ] => τ
  [υ] => υ
  [φ] => φ
  [χ] => χ
  [ψ] => ψ
  [ω] => ω
  [?] => ϑ
  [?] => ϒ
  [?] => ϖ
  [?] =>  
  [?] =>
  [?] =>  
  [?] => ‌
  [?] => ‍
  [?] => ‎
  [?] => ‏
  [?] => –
  [?] => —
  [?] => ‘
  [?] => ’
  [?] => ‚
  [?] => “
  [?] => ”
  [?] => „
  [?] => †
  [?] => ‡
  [?] => •
  [?] => …
  [?] => ‰
  [′] => ′
  [″] => ″
  [?] => ‹
  [?] => ›
  [ ̄] => ‾
  [?] => ⁄
  [?] => €
  [?] => ℑ
  [?] => ℘
  [?] => ℜ
  [?] => ™
  [?] => ℵ
  [←] => ←
  [↑] => ↑
  [→] => →
  [↓] => ↓
  [?] => ↔
  [?] => ↵
  [?] => ⇐
  [?] => ⇑
  [?] => ⇒
  [?] => ⇓
  [?] => ⇔
  [?] => ∀
  [?] => ∂
  [?] => ∃
  [?] => ∅
  [?] => ∇
  [∈] => ∈
  [?] => ∉
  [?] => ∋
  [∏] => ∏
  [∑] => ∑
  [?] => −
  [?] => ∗
  [√] => √
  [∝] => ∝
  [∞] => ∞
  [∠] => ∠
  [∧] => ∧
  [∨] => ∨
  [∩] => ∩
  [∪] => ∪
  [∫] => ∫
  [∴] => ∴
  [~] => ∼
  [?] => ≅
  [≈] => ≈
  [≠] => ≠
  [≡] => ≡
  [≤] => ≤
  [≥] => ≥
  [?] => ⊂
  [?] => ⊃
  [?] => ⊄
  [?] => ⊆
  [?] => ⊇
  [⊕] => ⊕
  [?] => ⊗
  [⊥] => ⊥
  [?] => ⋅
  [?] => ⌈
  [?] => ⌉
  [?] => ⌊
  [?] => ⌋
  [?] => ⟨
  [?] => ⟩
  [?] => ◊
  [?] => ♠
  [?] => ♣
  [?] => ♥
  [?] => ♦
)