Код специальные символы html php

Коды спецсимволов html

У любого символа есть свой код. Специальные символы встречаются на страницах интернета нередко. Однако просто вставить символ на страницу HTML не получится, поскольку есть большой шанс, что кодировка страницы начнет глючить. Поэтому используются не просто символы, а их коды. Ниже приведена таблица с кодами ASCII и его соответствие в HTML.

Как вставить спецсимвол на страницу html
Скопируйте соответствующий код и вставьте в код. Не рекомендуется копировать сам символ, поскольку при сохранении файла в разных редакторах возможны сбои в кодировках.

Таблица с кодами специальных символов HTML

Коды символов в HTML (спецсимволы)
« " & & < > >  
¡ ¡ ¢ ¢ £ £ ¤ ¤ ¥ ¥
¦ ¦ § § ¨ ¨ © © ª ª
« « ¬ ¬ ® ® ¯ ¯ ° °
± ± ² ² ³ ³ ´ ´ µ µ
· · ¸ ¸ ¹ ¹ º º
» » ¼ ¼ ½ ½ ¾ ¾
¿ ¿ À À
Á Á Â Â Ã Ã Ä Ä Å Å
Æ Æ Ç Ç È È É É Ê Ê
Ë Ë Ì Ì Í Í Î Î Ï Ï
Ð Ð Ñ Ñ Ò Ò Ó Ó Ô Ô
Õ Õ Ö Ö × × Ø Ø Ù Ù
Ú Ú Û Û Ü Ü Ý Ý Þ Þ
ß ß à à á á â â ã ã
ä ä å å æ æ ç ç è è
é é ê ê ë ë ì ì í í
î î ï ï ð ð ñ ñ ò ò
ó ó ô ô õ õ ö ö ÷ ÷
ø ø ù ù ú ú û û ü ü
ý ý þ þ ÿ ÿ Ć Ć ć ć
ı ı IJ IJ ij ij Ł Ł ł ł
Œ Œ œ œ Š Š š š Ÿ Ÿ
Ž Ž ž ž ƒ ƒ ˇ ˇ ˘ ˘
˙ ˙ ˚ ˚ ˛ ˛ ˝ ˝ Α Α
Β Β Γ Γ Δ Δ Ε Ε Ζ Ζ
Η Η Θ Θ Ι Ι Κ Κ Λ Λ
Μ Μ Ν Ν Ξ Ξ Ο Ο Π Π
Ρ Ρ Σ Σ Τ Τ Υ Υ Φ Φ
Χ Χ Ψ Ψ Ω Ω α α β β
γ γ δ δ ε ε ζ ζ η η
θ θ ι ι κ κ λ λ μ μ
ν ν ξ ξ ο ο π π ρ ρ
ς ς σ σ τ τ υ υ φ φ
χ χ ψ ψ ω ω ϑ ϑ ϕ ϕ
ϖ ϖ ϵ ϵ
× ×
ι ι ק ק Ì Ì
þ þ ι ι
ҳ ҳ ̸ ̸ Ҳ Ҳ ̸ ̸ ҳ ҳ
۩ ۩ ۩ ۩
ټ ټ ت ت
 
× × ° ° ÷ ÷
'

Источник

htmlspecialchars

В HTML некоторые символы имеют особый смысл и должны быть представлены в виде HTML сущностей, чтобы сохранить их значение. Эта функция возвращает строку, над которой проведены эти преобразования. Если вам нужно преобразовать все возможные сущности, используйте htmlentities() .

Если входная строка переданная в эту функцию и результирующий документ используют одинаковую кодировку символов, то этой функции достаточно, чтобы подготовить данные для вставки в большинство частей HTML документа. Однако, если данные содержат символы, не определенные в кодировке символов результирующего документа и вы ожидаете сохранения этих символов (как числовые или именованные сущности), то вам недостаточно будет этой и htmlentities() функций (которые только преобразуют подстроки с соответствующими сущностями). Необходимо использовать функцию mb_encode_numericentity() .

  • ‘&’ (амперсанд) преобразуется в ‘&’
  • ‘»‘ (двойная кавычка) преобразуется в ‘"’ в режиме ENT_NOQUOTES is not set.
  • «‘» (одиночная кавычка) преобразуется в ‘'’ (или ') только в режиме ENT_QUOTES .
  • ‘>’ (знак «больше чем») преобразуется в ‘>’

Список параметров

Битовая маска из нижеуказанных флагов, определяющих режим обработки кавычек, некорректных кодовых последовательностей и используемый тип документа. По умолчанию используется ENT_COMPAT | ENT_HTML401.

Доступные значения параметра flags
Название константы Описание
ENT_COMPAT Преобразует двойные кавычки, одинарные кавычки не изменяются.
ENT_QUOTES Преобразует как двойные, так и одинарные кавычки.
ENT_NOQUOTES Оставляет без изменения как двойные, так и одинарные кавычки.
ENT_IGNORE Без всяких уведомительных сообщений отбрасывает некорректные кодовые последовательности вместо возврата пустой строки. Использование этого флага не рекомендуется, так как это может привести к » негативным последствиям, связанным с безопасностью.
ENT_SUBSTITUTE Заменяет некорреткные кодовые последовательности символом замены Юникода U+FFFD в случае использования UTF-8 и &#FFFD; при использовании другой кодировки, вместо возврата пустой строки.
ENT_DISALLOWED Заменяет неверные коды символов для заданного типа документа символом замены юникода U+FFFD (UTF-8) или &#FFFD; (при использовании другой кодировки) вместо того, чтобы оставлять все как есть. Это может быть полезно, например, для того, чтобы убедиться в формальной правильности XML-документов со встроенным внешним контентом.
ENT_HTML401 Обработка кода в соответствии с HTML 4.01.
ENT_XML1 Обработка кода в соответствии с XML 1.
ENT_XHTML Обработка кода в соответствии с XHTML.
ENT_HTML5 Обработка кода в соответствии с HTML 5.

Необязательный аргумент определяющий кодировку, используемую при конвертации симоволов.

Если не указан, то значением по умолчанию для encoding зависит от используемой версии PHP. В PHP 5.6 и старше, для значения по умолчанию используется конфигурационная опция default_charset. В PHP 5.4 и 5.5 используется UTF-8 по умолчанию. Более ранние версии PHP используют ISO-8859-1.

Хотя этот аргумент является технически необязательным, настоятельно рекомендуется указать правильное значение для вашего кода, если вы используете PHP 5.5 или выше, или если ваша опция конфигурации default_charset может быть задана неверно для входных данных.

Для целей этой функции кодировки ISO-8859-1, ISO-8859-15, UTF-8, cp866, cp1251, cp1252 и KOI8-R являются практически эквивалентными, предполагая то, что сама строка string содержит корректные символы в указанной кодировке, то символы, изменяемые htmlspecialchars() , останутся на тех же местах во всех этих кодировках.

Поддерживаются следующие кодировки:

Поддерживаемые кодировки
Кодировка Псевдонимы Описание
ISO-8859-1 ISO8859-1 Западно-европейская Latin-1.
ISO-8859-5 ISO8859-5 Редко используемая кириллическая кодировка (Latin/Cyrillic).
ISO-8859-15 ISO8859-15 Западно-европейская Latin-9. Добавляет знак евро, французские и финские буквы к кодировке Latin-1(ISO-8859-1).
UTF-8 8-битная Unicode, совместимая с ASCII.
cp866 ibm866, 866 Кириллическая кодировка, применяемая в DOS.
cp1251 Windows-1251, win-1251, 1251 Кириллическая кодировка, применяемая в Windows.
cp1252 Windows-1252, 1252 Западно-европейская кодировка, применяемая в Windows.
KOI8-R koi8-ru, koi8r Русская кодировка.
BIG5 950 Традиционный китайский, применяется в основном на Тайване.
GB2312 936 Упрощенный китайский, стандартная национальная кодировка.
BIG5-HKSCS Расширенная Big5, применяемая в Гонг-Конге.
Shift_JIS SJIS, SJIS-win, cp932, 932 Японская кодировка.
EUC-JP EUCJP, eucJP-win Японская кодировка.
MacRoman Кодировка, используемая в Mac OS.
» Пустая строка активирует режим определения кодировки из файла скрипта (Zend multibyte), default_charset и текущей локали (см. nl_langinfo() и setlocale() ), в указанном порядке. Не рекомендуется к использованию.

Замечание: Остальные кодировки не поддерживаются, вместо них будет применена кодировка по умолчанию и сгенерировано предупреждение.

Если параметр double_encode выключен, то PHP не будет преобразовывать существующие html-сущности. По умолчанию преобразуется все без ограничений.

Возвращаемые значения

Если входная строка string содержит неверную последовательность символов в указанной кодировке encoding , то будет возвращаться пустая строка в случае, если флаги ENT_IGNORE или ENT_SUBSTITUTE не установлены.

Список изменений

Версия Описание
5.6.0 Значение по умолчанию для параметра encoding было изменено на значение конфигурационной опции default_charset.
5.4.0 Значение по умолчанию для параметра encoding было изменено на UTF-8.
5.4.0 Добавлены константы ENT_SUBSTITUTE , ENT_DISALLOWED , ENT_HTML401 , ENT_XML1 , ENT_XHTML и ENT_HTML5 .
5.3.0 Добавлена константа ENT_IGNORE .
5.2.3 Добавлен параметр double_encode .

Примеры

Пример #1 Пример использования htmlspecialchars()

Примечания

Замечание:

Обратите внимание, что функция не производит других преобразований кроме описанных выше. Для преобразования всех HTML сущностей используйте htmlentities() .

Смотрите также

  • get_html_translation_table() — Возвращает таблицу преобразований, используемую функциями htmlspecialchars и htmlentities
  • htmlspecialchars_decode() — Преобразует специальные HTML-сущности обратно в соответствующие символы
  • strip_tags() — Удаляет HTML и PHP-теги из строки
  • htmlentities() — Преобразует все возможные символы в соответствующие HTML-сущности
  • nl2br() — Вставляет HTML-код разрыва строки перед каждым переводом строки

Источник

Читайте также:  Find overlapping turtle python
Оцените статью