Коды спецсимволов html
У любого символа есть свой код. Специальные символы встречаются на страницах интернета нередко. Однако просто вставить символ на страницу HTML не получится, поскольку есть большой шанс, что кодировка страницы начнет глючить. Поэтому используются не просто символы, а их коды. Ниже приведена таблица с кодами ASCII и его соответствие в HTML.
Как вставить спецсимвол на страницу html
Скопируйте соответствующий код и вставьте в код. Не рекомендуется копировать сам символ, поскольку при сохранении файла в разных редакторах возможны сбои в кодировках.
Таблица с кодами специальных символов HTML
Коды символов в HTML (спецсимволы) | |||||||||
---|---|---|---|---|---|---|---|---|---|
« | " | & | & | < | > | > | |||
¡ | ¡ | ¢ | ¢ | £ | £ | ¤ | ¤ | ¥ | ¥ |
¦ | ¦ | § | § | ¨ | ¨ | © | © | ª | ª |
« | « | ¬ | ¬ | ® | ® | ¯ | ¯ | ° | ° |
± | ± | ² | ² | ³ | ³ | ´ | ´ | µ | µ |
¶ | ¶ | · | · | ¸ | ¸ | ¹ | ¹ | º | º |
» | » | ¼ | ¼ | ½ | ½ | ¾ | ¾ | ⅛ | ⅛ |
⅜ | ⅜ | ⅝ | ⅝ | ⅞ | ⅞ | ¿ | ¿ | À | À |
Á | Á | Â | Â | Ã | Ã | Ä | Ä | Å | Å |
Æ | Æ | Ç | Ç | È | È | É | É | Ê | Ê |
Ë | Ë | Ì | Ì | Í | Í | Î | Î | Ï | Ï |
Ð | Ð | Ñ | Ñ | Ò | Ò | Ó | Ó | Ô | Ô |
Õ | Õ | Ö | Ö | × | × | Ø | Ø | Ù | Ù |
Ú | Ú | Û | Û | Ü | Ü | Ý | Ý | Þ | Þ |
ß | ß | à | à | á | á | â | â | ã | ã |
ä | ä | å | å | æ | æ | ç | ç | è | è |
é | é | ê | ê | ë | ë | ì | ì | í | í |
î | î | ï | ï | ð | ð | ñ | ñ | ò | ò |
ó | ó | ô | ô | õ | õ | ö | ö | ÷ | ÷ |
ø | ø | ù | ù | ú | ú | û | û | ü | ü |
ý | ý | þ | þ | ÿ | ÿ | Ć | Ć | ć | ć |
ı | ı | IJ | IJ | ij | ij | Ł | Ł | ł | ł |
Œ | Œ | œ | œ | Š | Š | š | š | Ÿ | Ÿ |
Ž | Ž | ž | ž | ƒ | ƒ | ˇ | ˇ | ˘ | ˘ |
˙ | ˙ | ˚ | ˚ | ˛ | ˛ | ˝ | ˝ | Α | Α |
Β | Β | Γ | Γ | Δ | Δ | Ε | Ε | Ζ | Ζ |
Η | Η | Θ | Θ | Ι | Ι | Κ | Κ | Λ | Λ |
Μ | Μ | Ν | Ν | Ξ | Ξ | Ο | Ο | Π | Π |
Ρ | Ρ | Σ | Σ | Τ | Τ | Υ | Υ | Φ | Φ |
Χ | Χ | Ψ | Ψ | Ω | Ω | α | α | β | β |
γ | γ | δ | δ | ε | ε | ζ | ζ | η | η |
θ | θ | ι | ι | κ | κ | λ | λ | μ | μ |
ν | ν | ξ | ξ | ο | ο | π | π | ρ | ρ |
ς | ς | σ | σ | τ | τ | υ | υ | φ | φ |
χ | χ | ψ | ψ | ω | ω | ϑ | ϑ | ϕ | ϕ |
ϖ | ϖ | ϵ | ϵ | – | – | — | — | ‘ | ‘ |
’ | ’ | ‚ | ‚ | “ | “ | ” | ” | „ | „ |
† | † | ‡ | ‡ | • | • | ‰ | ‰ | × | × |
″ | ″ | ‹ | ‹ | › | › | ‾ | ‾ | ⁄ | ⁄ |
€ | € | ℏ | ℏ | ℑ | ℑ | ℘ | ℘ | ℜ | ℜ |
™ | ™ | ℵ | ℵ | ← | ← | ↑ | ↑ | → | → |
↓ | ↓ | ↔ | ↔ | ↕ | ↕ | ↵ | ↵ | ⇐ | ⇐ |
⇑ | ⇑ | ⇒ | ⇒ | ⇓ | ⇓ | ⇔ | ⇔ | ⇕ | ⇕ |
∀ | ∀ | ∂ | ∂ | ∃ | ∃ | ∅ | ∅ | ∇ | ∇ |
∈ | ∈ | ∉ | ∉ | ∋ | ∋ | ∏ | ∏ | ∑ | ∑ |
− | − | ∓ | ∓ | ∗ | ∗ | √ | √ | ∞ | ∞ |
∞ | ∞ | ∠ | ∠ | ∧ | ∧ | ∨ | ∨ | ∩ | ∩ |
∪ | ∪ | ∫ | ∫ | ∴ | ∴ | ∼ | ∼ | ≃ | ≃ |
≅ | ≅ | ≈ | ≈ | ≠ | ≠ | ≡ | ≡ | ≢ | ≢ |
≤ | ≤ | ≥ | ≥ | ≪ | ≪ | ≫ | ≫ | ⊂ | ⊂ |
⊃ | ⊃ | ⊄ | ⊄ | ⊅ | ⊅ | ⊆ | ⊆ | ⊇ | ⊇ |
⊕ | ⊕ | ⊗ | ⊗ | ⊥ | ⊥ | ⋅ | ⋅ | ⌈ | ⌈ |
⌉ | ⌉ | ⌊ | ⌊ | ⌋ | ⌋ | 〈 | 〈 | 〉 | 〉 |
⎛ | ⎛ | ⎜ | ⎜ | ⎝ | ⎝ | ⎞ | ⎞ | ⎟ | ⎟ |
⎠ | ⎠ | ⎡ | ⎡ | ⎢ | ⎢ | ⎣ | ⎣ | ⎤ | ⎤ |
⎥ | ⎥ | ⎦ | ⎦ | ⎧ | ⎧ | ⎨ | ⎨ | ⎩ | ⎩ |
⎪ | ⎪ | ⎫ | ⎫ | ⎬ | ⎬ | ⎭ | ⎭ | ⎯ | ⎯ |
│ | │ | □ | □ | ◊ | ◊ | ○ | ○ | ☜ | ☜ |
☞ | ☞ | ♠ | ♠ | ♣ | ♣ | ♥ | ♥ | ♦ | ♦ |
✓ | ✓ | ✂ | ✂ | ✃ | ✃ | ✄ | ✄ | ✆ | ✆ |
✇ | ✇ | ✈ | ✈ | ✉ | ✉ | ✌ | ✌ | ✍ | ✍ |
✎ | ✎ | ✏ | ✏ | ✐ | ✐ | ✑ | ✑ | ✒ | ✒ |
✔ | ✔ | ✕ | ✕ | ✖ | ✖ | ✗ | ✗ | ✘ | ✘ |
✙ | ✙ | ✚ | ✚ | ✛ | ✛ | ✜ | ✜ | ✝ | ✝ |
✞ | ✞ | ✟ | ✟ | ✠ | ✠ | ✡ | ✡ | ✢ | ✢ |
✣ | ✣ | ✤ | ✤ | ✥ | ✥ | ✦ | ✦ | ✧ | ✧ |
✩ | ✩ | ✪ | ✪ | ✫ | ✫ | ✬ | ✬ | ✭ | ✭ |
✮ | ✮ | ✯ | ✯ | ✰ | ✰ | ✱ | ✱ | ✲ | ✲ |
✳ | ✳ | ✴ | ✴ | ✵ | ✵ | ✶ | ✶ | ✷ | ✷ |
✸ | ✸ | ✹ | ✹ | ✺ | ✺ | ✻ | ✻ | ✼ | ✼ |
✽ | ✽ | ✾ | ✾ | ✿ | ✿ | ❀ | ❀ | ❁ | ❁ |
❂ | ❂ | ❃ | ❃ | ❄ | ❄ | ❅ | ❅ | ❆ | ❆ |
❇ | ❇ | ❈ | ❈ | ❉ | ❉ | ❊ | ❊ | ❋ | ❋ |
❍ | ❍ | ❏ | ❏ | ❐ | ❐ | ❑ | ❑ | ❒ | ❒ |
❖ | ❖ | ❘ | ❘ | ❙ | ❙ | ❚ | ❚ | ❛ | ❛ |
❜ | ❜ | ❝ | ❝ | ❞ | ❞ | ❡ | ❡ | ❢ | ❢ |
❣ | ❣ | ❤ | ❤ | ❥ | ❥ | ❦ | ❦ | ❧ | ❧ |
❶ | ❶ | ❷ | ❷ | ❸ | ❸ | ❹ | ❹ | ❺ | ❺ |
❻ | ❻ | ❼ | ❼ | ❽ | ❽ | ❾ | ❾ | ❿ | ❿ |
➀ | ➀ | ➁ | ➁ | ➂ | ➂ | ➃ | ➃ | ➄ | ➄ |
➅ | ➅ | ➆ | ➆ | ⑦ | ⑦ | ➇ | ➇ | ➈ | ➈ |
➉ | ➉ | ➊ | ➊ | ➋ | ➋ | ➌ | ➌ | ➍ | ➍ |
➎ | ➎ | ➏ | ➏ | ➐ | ➐ | ➑ | ➑ | ➒ | ➒ |
➓ | ➓ | ➔ | ➔ | ➘ | ➘ | ➙ | ➙ | ➚ | ➚ |
➛ | ➛ | ➜ | ➜ | ➝ | ➝ | ➞ | ➞ | ➟ | ➟ |
➠ | ➠ | ➡ | ➡ | ➢ | ➢ | ➣ | ➣ | ➤ | ➤ |
➥ | ➥ | ➦ | ➦ | ➧ | ➧ | ➨ | ➨ | ➩ | ➩ |
➪ | ➪ | ➫ | ➫ | ➬ | ➬ | ➭ | ➭ | ➮ | ➮ |
➯ | ➯ | ➱ | ➱ | ➲ | ➲ | ➳ | ➳ | ➴ | ➴ |
➵ | ➵ | ➶ | ➶ | ➷ | ➷ | ➸ | ➸ | ➹ | ➹ |
➺ | ➺ | ➻ | ➻ | ➼ | ➼ | ➽ | ➽ | ➾ | ➾ |
虎 | 虎 | の | の | 子 | 子 | ♈ | ♈ | ♉ | ♉ |
♊ | ♊ | ♋ | ♋ | ♌ | ♌ | ♍ | ♍ | ♎ | ♎ |
♏ | ♏ | ♐ | ♐ | ♑ | ♑ | ♒ | ♓ | ☀ | ☀ |
☁ | ☁ | ☂ | ☂ | ☃ | ☃ | ☼ | ☼ | ☽ | ☽ |
★ | ★ | ☆ | ☆ | ☾ | ☾ | ♔ | ♔ | ♕ | ♕ |
♖ | ♖ | ♗ | ♗ | ♘ | ♘ | ♙ | ♙ | ♚ | ♚ |
♛ | ♛ | ♜ | ♜ | ♝ | ♝ | ♞ | ♞ | ♟ | ♟ |
Ⓐ | Ⓐ | Ⓑ | Ⓑ | Ⓒ | Ⓒ | Ⓓ | Ⓓ | Ⓔ | Ⓔ |
Ⓕ | Ⓕ | Ⓖ | Ⓖ | Ⓗ | Ⓗ | Ⓘ | Ⓘ | Ⓙ | Ⓙ |
Ⓚ | Ⓚ | Ⓛ | Ⓛ | Ⓜ | Ⓜ | Ⓝ | Ⓝ | Ⓞ | Ⓞ |
Ⓟ | Ⓟ | Ⓠ | Ⓠ | Ⓡ | Ⓡ | Ⓢ | Ⓢ | Ⓣ | Ⓣ |
Ⓤ | Ⓤ | Ⓥ | Ⓥ | Ⓦ | Ⓦ | Ⓧ | Ⓧ | Ⓨ | Ⓨ |
Ⓩ | Ⓩ | ☀ | ☀ | ☁ | ☁ | ☂ | ☂ | ☃ | ☃ |
☼ | ☼ | ☽ | ☽ | ☾ | ☾ | ☿ | ☿ | ♀ | ♀ |
☢ | ☢ | ☣ | ☣ | ☤ | ☤ | ☥ | ☥ | ☦ | ☦ |
☭ | ♁ | ♂ | ♂ | ☮ | ☮ | ☯ | ☯ | ♁ | ♁ |
♀ | ♀ | ☿ | ☿ | ♃ | ♃ | ♄ | ♄ | ♅ | ♅ |
♆ | ♆ | ♇ | ♇ | ☣ | ☣ | ☤ | ☤ | ☬ | ☬ |
☫ | ☫ | ☪ | ☪ | ☨ | ☨ | ☦ | ☦ | ||
〄 | 〄 | ♨ | ♨ | ☸ | ☸ | 卐 | 卐 | ⌘ | ⌘ |
√ | √ | ι | ι | ק | ק | √ | √ | Ì | Ì |
þ | þ | ℳ | ℳ | ℴ | ℴ | ℯ | ℯ | ι | ι |
ҳ | ҳ | ̸ | ̸ | Ҳ | Ҳ | ̸ | ̸ | ҳ | ҳ |
๑ | ๑ | ۩ | ۩ | ۩ | ۩ | ๑ | ๑ | ソ | ソ |
ッ | ッ | ヅ | ヅ | ツ | ツ | ゾ | ゾ | シ | シ |
ジ | ジ | ټ | ټ | ت | ت | ン | ン | ㋛ | ㋛ |
☺ | ☺ | ☹ | ☹ | ☻ | ☻ | 、 | 、 | ||
。 | 。 | 〃 | 〃 | 〄 | 〄 | 々 | 々 | 〆 | 〆 |
〇 | 〇 | 〈 | 〈 | 〉 | 〉 | 《 | 《 | 》 | 》 |
「 | 「 | 」 | 」 | 『 | 『 | 』 | 』 | 』 | 』 |
【 | 【 | 〠 | 〠 | 〿 | 〿 | | | ぁ | ぁ |
× | × | ° | ° | ÷ | ÷ | ∅ | ∅ | ⌐ | ⌐ |
′ | ′ | ‘ | ' |
htmlspecialchars
В HTML некоторые символы имеют особый смысл и должны быть представлены в виде HTML сущностей, чтобы сохранить их значение. Эта функция возвращает строку, над которой проведены эти преобразования. Если вам нужно преобразовать все возможные сущности, используйте htmlentities() .
Если входная строка переданная в эту функцию и результирующий документ используют одинаковую кодировку символов, то этой функции достаточно, чтобы подготовить данные для вставки в большинство частей HTML документа. Однако, если данные содержат символы, не определенные в кодировке символов результирующего документа и вы ожидаете сохранения этих символов (как числовые или именованные сущности), то вам недостаточно будет этой и htmlentities() функций (которые только преобразуют подстроки с соответствующими сущностями). Необходимо использовать функцию mb_encode_numericentity() .
- ‘&’ (амперсанд) преобразуется в ‘&’
- ‘»‘ (двойная кавычка) преобразуется в ‘"’ в режиме ENT_NOQUOTES is not set.
- «‘» (одиночная кавычка) преобразуется в ‘'’ (или ') только в режиме ENT_QUOTES .
- ‘
- ‘>’ (знак «больше чем») преобразуется в ‘>’
Список параметров
Битовая маска из нижеуказанных флагов, определяющих режим обработки кавычек, некорректных кодовых последовательностей и используемый тип документа. По умолчанию используется ENT_COMPAT | ENT_HTML401.
Название константы | Описание |
---|---|
ENT_COMPAT | Преобразует двойные кавычки, одинарные кавычки не изменяются. |
ENT_QUOTES | Преобразует как двойные, так и одинарные кавычки. |
ENT_NOQUOTES | Оставляет без изменения как двойные, так и одинарные кавычки. |
ENT_IGNORE | Без всяких уведомительных сообщений отбрасывает некорректные кодовые последовательности вместо возврата пустой строки. Использование этого флага не рекомендуется, так как это может привести к » негативным последствиям, связанным с безопасностью. |
ENT_SUBSTITUTE | Заменяет некорреткные кодовые последовательности символом замены Юникода U+FFFD в случае использования UTF-8 и &#FFFD; при использовании другой кодировки, вместо возврата пустой строки. |
ENT_DISALLOWED | Заменяет неверные коды символов для заданного типа документа символом замены юникода U+FFFD (UTF-8) или &#FFFD; (при использовании другой кодировки) вместо того, чтобы оставлять все как есть. Это может быть полезно, например, для того, чтобы убедиться в формальной правильности XML-документов со встроенным внешним контентом. |
ENT_HTML401 | Обработка кода в соответствии с HTML 4.01. |
ENT_XML1 | Обработка кода в соответствии с XML 1. |
ENT_XHTML | Обработка кода в соответствии с XHTML. |
ENT_HTML5 | Обработка кода в соответствии с HTML 5. |
Необязательный аргумент определяющий кодировку, используемую при конвертации симоволов.
Если не указан, то значением по умолчанию для encoding зависит от используемой версии PHP. В PHP 5.6 и старше, для значения по умолчанию используется конфигурационная опция default_charset. В PHP 5.4 и 5.5 используется UTF-8 по умолчанию. Более ранние версии PHP используют ISO-8859-1.
Хотя этот аргумент является технически необязательным, настоятельно рекомендуется указать правильное значение для вашего кода, если вы используете PHP 5.5 или выше, или если ваша опция конфигурации default_charset может быть задана неверно для входных данных.
Для целей этой функции кодировки ISO-8859-1, ISO-8859-15, UTF-8, cp866, cp1251, cp1252 и KOI8-R являются практически эквивалентными, предполагая то, что сама строка string содержит корректные символы в указанной кодировке, то символы, изменяемые htmlspecialchars() , останутся на тех же местах во всех этих кодировках.
Поддерживаются следующие кодировки:
Кодировка | Псевдонимы | Описание |
---|---|---|
ISO-8859-1 | ISO8859-1 | Западно-европейская Latin-1. |
ISO-8859-5 | ISO8859-5 | Редко используемая кириллическая кодировка (Latin/Cyrillic). |
ISO-8859-15 | ISO8859-15 | Западно-европейская Latin-9. Добавляет знак евро, французские и финские буквы к кодировке Latin-1(ISO-8859-1). |
UTF-8 | 8-битная Unicode, совместимая с ASCII. | |
cp866 | ibm866, 866 | Кириллическая кодировка, применяемая в DOS. |
cp1251 | Windows-1251, win-1251, 1251 | Кириллическая кодировка, применяемая в Windows. |
cp1252 | Windows-1252, 1252 | Западно-европейская кодировка, применяемая в Windows. |
KOI8-R | koi8-ru, koi8r | Русская кодировка. |
BIG5 | 950 | Традиционный китайский, применяется в основном на Тайване. |
GB2312 | 936 | Упрощенный китайский, стандартная национальная кодировка. |
BIG5-HKSCS | Расширенная Big5, применяемая в Гонг-Конге. | |
Shift_JIS | SJIS, SJIS-win, cp932, 932 | Японская кодировка. |
EUC-JP | EUCJP, eucJP-win | Японская кодировка. |
MacRoman | Кодировка, используемая в Mac OS. | |
» | Пустая строка активирует режим определения кодировки из файла скрипта (Zend multibyte), default_charset и текущей локали (см. nl_langinfo() и setlocale() ), в указанном порядке. Не рекомендуется к использованию. |
Замечание: Остальные кодировки не поддерживаются, вместо них будет применена кодировка по умолчанию и сгенерировано предупреждение.
Если параметр double_encode выключен, то PHP не будет преобразовывать существующие html-сущности. По умолчанию преобразуется все без ограничений.
Возвращаемые значения
Если входная строка string содержит неверную последовательность символов в указанной кодировке encoding , то будет возвращаться пустая строка в случае, если флаги ENT_IGNORE или ENT_SUBSTITUTE не установлены.
Список изменений
Версия | Описание |
---|---|
5.6.0 | Значение по умолчанию для параметра encoding было изменено на значение конфигурационной опции default_charset. |
5.4.0 | Значение по умолчанию для параметра encoding было изменено на UTF-8. |
5.4.0 | Добавлены константы ENT_SUBSTITUTE , ENT_DISALLOWED , ENT_HTML401 , ENT_XML1 , ENT_XHTML и ENT_HTML5 . |
5.3.0 | Добавлена константа ENT_IGNORE . |
5.2.3 | Добавлен параметр double_encode . |
Примеры
Пример #1 Пример использования htmlspecialchars()
Примечания
Замечание:
Обратите внимание, что функция не производит других преобразований кроме описанных выше. Для преобразования всех HTML сущностей используйте htmlentities() .
Смотрите также
- get_html_translation_table() — Возвращает таблицу преобразований, используемую функциями htmlspecialchars и htmlentities
- htmlspecialchars_decode() — Преобразует специальные HTML-сущности обратно в соответствующие символы
- strip_tags() — Удаляет HTML и PHP-теги из строки
- htmlentities() — Преобразует все возможные символы в соответствующие HTML-сущности
- nl2br() — Вставляет HTML-код разрыва строки перед каждым переводом строки