Função html_entity_decode() do PHP

Exemplo

Converta characters de entities HTML para characters:

<?php
$str = "<© W3Sçh°°¦§>";
echo html_entity_decode($str);
?>

A saída HTML do código acima é a seguinte (ver código-fonte):

<!DOCTYPE html>
<html>
<body>
<? W3S?h????>
</body>
</html>

Saída do navegador do código acima:

<? W3S?h????>

Definição e uso

A função html_entity_decode() converte entidades HTML em caracteres.

A função html_entity_decode() é htmlentities() Inversão da função.

Sintaxe

html_entity_decode(string,flags,character-set)
Parâmetro Descrição
string Obrigatório. Especifica a string a ser des码.
flags

Opcional. Especifica como lidar com aspas e qual tipo de documento usar.

Tipos de aspas disponíveis:

  • ENT_COMPAT - padrão. Apenas des码 aspas duplas.
  • ENT_QUOTES - des码 aspas duplas e simples.
  • ENT_NOQUOTES - não des码 quaisquer aspas.

Flags adicionais para especificar o tipo de documento utilizado:

  • ENT_HTML401 - padrão. Tratado como HTML 4.01.
  • ENT_HTML5 - tratado como HTML 5.
  • ENT_XML1 - tratado como XML 1.
  • ENT_XHTML - tratado como XHTML.
character-set

Opcional. Valor de string, especifica o conjunto de caracteres a ser usado.

Valores permitidos:

  • UTF-8 - padrão. ASCII compatível com múltiplos bytes de Unicode
  • ISO-8859-1 - Europa Ocidental
  • ISO-8859-15 - Europa Ocidental (adiciona símbolos de euro + letras francesas e finlandesas perdidas no ISO-8859-1)
  • cp866 - conjunto de caracteres专用 do DOS para o Cyrillico
  • cp1251 - conjunto de caracteres专用 do Windows para o Cyrillico
  • cp1252 - conjunto de caracteres专用 do Windows para a Europa Ocidental
  • KOI8-R - russo
  • BIG5 - chinês tradicional, principalmente usado em Taiwan
  • GB2312 - chinês simplificado, conjunto de caracteres padrão nacional
  • BIG5-HKSCS - Big5 com extensão de Hong Kong
  • Shift_JIS - japonês
  • EUC-JP - japonês
  • MacRoman - conjunto de caracteres usado pelo sistema operacional Mac

Comentário:Em versões do PHP 5.4 ou anteriores, os conjunto de caracteres não reconhecidos serão ignorados e substituídos por ISO-8859-1. A partir do PHP 5.4, os conjunto de caracteres não reconhecidos serão ignorados e substituídos por UTF-8.

Detalhes técnicos

Retorno: Retorna a string convertida
Versão do PHP: 4.3.0+

Registro de atualizações:

Versão Descrição
PHP 5 character-set O valor padrão do parâmetro foi alterado para UTF-8.
PHP 5.4

Adicionou flags adicionais para especificar o tipo de documento aplicável ao translation table:

  • ENT_HTML401
  • ENT_HTML5
  • ENT_XML1
  • ENT_XHTML
PHP 5.3.4 Adicionado suporte para codificação de múltiplos bytes.

Mais exemplos

Exemplo 1

Converta characters de entities HTML para characters:

<?php
$str = "Bill & 'Steve'";
echo html_entity_decode($str, ENT_COMPAT); // Converte apenas aspas duplas
echo "<br>";
echo html_entity_decode($str, ENT_QUOTES); // Converte aspas duplas e simples
echo "<br>";
echo html_entity_decode($str, ENT_NOQUOTES); // Não converte nenhuma aspas
?>

Saída HTML do código acima (ver código-fonte):

<!DOCTYPE html>
<html>
<body>
Bill & 'Steve'<br>
Bill & 'Steve'<br>
Bill & 'Steve'
</body>
</html>

Saída do navegador do código acima:

Bill & 'Steve'
Bill & 'Steve'
Bill & 'Steve'

Exemplo 2

Converta caracteres de entities HTML para caracteres usando o conjunto de caracteres da Europa Ocidental:

<?php
$str = "My name is Øyvind Åsane. I'm Norwegian.";
echo html_entity_decode($str, ENT_QUOTES, "ISO-8859-1");
?>

Saída HTML do código acima (ver código-fonte):

<!DOCTYPE html>
<html>
<body>
Meu nome é ?yvind ?sane. Sou norueguês.
</body>
</html>

Saída do navegador do código acima:

Meu nome é ?yvind ?sane. Sou norueguês.