- HTML Глобальный атрибут lang
- Синтаксис
- Значения
- Значение по умолчанию
- Применяется к тегам
- Различия между HTML 4.01 и HTML5
- Пример использования:
- Атрибут lang
- Пример HTML:
- Спецификации
- Атрибут lang
- Синтаксис
- Значения
- Значение по умолчанию
- Применяется к тегам
- Пример
- Коды языков
- Типы тегов
- lang
- Интерактивный пример
- Спецификации
- Совместимость с браузерами
- Смотрите также
- Коды языков HTML
- Пример кода указания языка страницы lang HTML документа
- Стандарт ISO 639-1 кодов языков
HTML Глобальный атрибут lang
Атрибут lang (от англ. «language» ‒ «язык») задаёт язык, на котором написан текст внутри текущего элемента. Атрибут в теге устанавливает язык для всего текста на странице. В качестве задаваемого значения должно выступать значение допустимое документом BCP 47.
Так же предусмотрено указание через тире (‒) субверсии языка (версия языка: en-us , zh-gan ; набор символов для написания: sr-Latn ‒ сербский-латиница).
Атрибут lang может выполнять следующие функции:
- Оказание помощи поисковым системам (Yandex, Google и т.д.);
- Оказание помощи речевым синтезаторам (выбор соответствующего произношения);
- Помощь браузерам в выборе вариантов символов для высококачественной полиграфии (выбор соответствующих шрифтов, набора кавычек);
- Помощь браузерам в принятии решений о переносах, лигатурах, и интервалах;
- Помощь браузерам в выборе соответствующих пользовательских интерфейсов управления формой (выбор даты);
- Содействие в проверке орфографии и грамматики (выбор соответствующего словаря).
Примечание: Большинство программ умеет определять язык текста и без атрибута lang , так как они используют определенные таблицы символов в формате Unicode, с которыми сверяют символы текста HTML-страницы. В этих таблицах каждый символ языка имеет определенный код, таким образом, допустим, английская и русская буквы «A» хоть и одинаковы внешне, но имеют разные коды.
Синтаксис
Значения
В качестве значения указывается код языка.
Значение по умолчанию
Применяется к тегам
Атрибут lang относится к глобальным атрибутам, и может быть использован с любым элементом HTML.
Различия между HTML 4.01 и HTML5
В HTML5, атрибут lang может быть использован в любом HTML элементе.
В HTML 4.01 атрибут lang не используется со следующими элементами: ,
, , ,
, , , и .
Пример использования:
Атрибут lang
Пример HTML:
Текст на русском языке со вставкой на "English" языке.
Спецификации
Спецификация | Статус |
---|---|
Current W3C Draft | Текущий проект |
WHATWG HTML Living Standard (WHATWG) | Живой стандарт |
HTML5 (W3C) | Рекомендация |
HTML 5.1 (W3C) | Рекомендация |
HTML 4.01(W3C) | Рекомендация |
Атрибут lang
Текст документа может быть набран как на одном языке, так и содержать вставки на других языках, которые могут различаться по своим правилам оформления текста. Например, для русского, немецкого и английского языка характерны разные кавычки, в которые берется цитата. Чтобы указать язык, на котором написан текст внутри текущего элемента и применяется атрибут lang . Браузер использует его значение для правильного отображения некоторых символов.
Синтаксис
Значения
Значение по умолчанию
Применяется к тегам
Пример
Цитата на французском языке: Ce que femme veut, Dieu le veut
.
Цитата на немецком: Der Mensch, versuche die Gotter nicht
.
Цитата на английском: То be or not to be
.
Результат данного примера показан на рис. 1. Для отображения типовых кавычек в примере используется стилевое свойство quotes , а само переключение языка и соответствующего вида кавычек происходит через атрибут lang , добавляемый к тегу .
Рис. 1. Вид кавычек для разных языков
Коды языков
Код языка применяется для атрибутов, задающих язык, на котором написан весь документ или отдельные его блоки. В HTML язык обычно задается через атрибут lang.
В табл. 1 приведены некоторые распространенные языки и их коды, которые используются в качестве значений.
Язык | Код |
---|---|
Абхазский | ab |
Азербайджанский | az |
Аймарский | ay |
Албанский | sq |
Английский | en |
Американский английский | en-us |
Арабский | ar |
Армянский | hy |
Ассамский | as |
Африкаанс | af |
Башкирский | ba |
Белорусский | be |
Бенгальский | bn |
Болгарский | bg |
Бретонский | br |
Валлийский | cy |
Венгерский | hu |
Вьетнамский | vi |
Галисийский | gl |
Голландский | nl |
Греческий | el |
Грузинский | ka |
Гуарани | gn |
Датский | da |
Зулу | zu |
Иврит | iw |
Идиш | ji |
Индонезийский | in |
Интерлингва (искусственный язык) | ia |
Ирландский | ga |
Исландский | is |
Испанский | es |
Итальянский | it |
Казахский | kk |
Камбоджийский | km |
Каталанский | ca |
Кашмирский | ks |
Кечуа | qu |
Киргизский | ky |
Китайский | zh |
Корейский | ko |
Корсиканский | co |
Курдский | ku |
Лаосский | lo |
Латвийский, латышский | lv |
Латынь | la |
Литовский | lt |
Малагасийский | mg |
Малайский | ms |
Мальтийский | mt |
Маори | mi |
Македонский | mk |
Молдавский | mo |
Монгольский | mn |
Науру | na |
Немецкий | de |
Непальский | ne |
Норвежский | no |
Пенджаби | pa |
Персидский | fa |
Польский | pl |
Португальский | pt |
Пуштунский | ps |
Ретороманский | rm |
Румынский | ro |
Русский | ru |
Самоанский | sm |
Санскрит | sa |
Сербский | sr |
Словацкий | sk |
Словенский | sl |
Сомали | so |
Суахили | sw |
Суданский | su |
Тагальский | tl |
Таджикский | tg |
Тайский | th |
Тамильский | ta |
Татарский | tt |
Тибетский | bo |
Тонга | to |
Турецкий | tr |
Туркменский | tk |
Узбекский | uz |
Украинский | uk |
Урду | ur |
Фиджи | fj |
Финский | fi |
Французский | fr |
Фризский | fy |
Хауса | ha |
Хинди | hi |
Хорватский | hr |
Чешский | cs |
Шведский | sv |
Эсперанто (искусственный язык) | eo |
Эстонский | et |
Яванский | jw |
Японский | ja |
Не выкладывайте свой код напрямую в комментариях, он отображается некорректно. Воспользуйтесь сервисом cssdeck.com или jsfiddle.net, сохраните код и в комментариях дайте на него ссылку. Так и результат сразу увидят.
Типы тегов
HTML5
Блочные элементы
Строчные элементы
Универсальные элементы
Нестандартные теги
Осуждаемые теги
Видео
Документ
Звук
Изображения
Объекты
Скрипты
Списки
Ссылки
Таблицы
Текст
Форматирование
Формы
Фреймы
lang
Глобальный атрибут lang помогает определить язык элемента: язык, на котором написаны нередактируемые элементы, или язык, на котором пользователем должны быть написаны редактируемые элементы. Атрибут содержит единственный «языковой тег» ( language tag ) в формате, определённом в Tags for Identifying Languages (BCP47).
Интерактивный пример
Если значение атрибута — пустая строка ( lang=»» ), язык устанавливается, как неизвестный. Если тег языка недействителен согласно BCP47, он устанавливается, как недействительный.
Примечание: ## Синтаксис языкового тегаПодробный синтаксис BCP47 достаточно подробен, чтобы отмечать специфичные языковые диалекты, но в большинстве случаев его использование намного проще.Языковой тег состоит из языковых вложенных тегов, разделённых дефисом, где каждый вложенный тег указывает на определённое свойство языка. 3 наиболее распространённых вложенных тега:
Обязателен. Двух-или-трёх-символьный код, определяющий базовый язык, обычно записываемый в нижнем регистре. К примеру, код английского языка является en , а для Бадеши — bdz .
Необязателен. Данный подтег определяет систему записи, и всегда состоящий из 4 символов с первой заглавной буквой. К примеру, французский язык Брайля — это fr-Brai , а ja-Kana — это японский язык, написанный с использованием алфавита Катакана (Katakana). Если язык написан типичным способом, например, английский с латинским алфавитом, нет необходимости использовать данный подтег.
Необязателен. Данный подтег определяет диалект основного языка из определённого места и состоит из двух букв в ALLCAPS, соответствующих коду страны, или трёх цифр, соответствующих региону, который не относится к стране. К примеру, es-ES — это испанский язык, на котором разговаривают в Испании, а es-013 означает испанский язык, на котором разговаривают в Центральной Америке. «Международный испанский» было бы просто es .Подтег скрипта предшествует подтегу региона, если присутствуют оба тега — ru-Cyrl-BY — это русский язык, написанный кириллицей, на котором разговаривают в Беларуси.Чтобы найти правильный подтег кода языка, используйте the Language Subtag Lookup.
Даже если указан атрибут lang, то он может не учитываться, поскольку атрибут **xml:lang **имеет приоритет над lang.
Для псевдокласса CSS :lang , два недопустимых названия языка будут разными, если их имена различны. Хотя, :lang(es) соответствует обоим lang=»es-ES» и lang=»es-419″ , но :lang(xyzzy) не соответствует lang=»xyzzy-Zorp!» .
Спецификации
Совместимость с браузерами
BCD tables only load in the browser
Смотрите также
Коды языков HTML
В HTML коды языков могут использоваться для указания языка веб-страницы или ее части. Это поможет поисковой системе, а также браузеру правильно обработать страницу.
По рекомендации W3C , следует указывать язык для каждой страницы, используя атрибут lang внутри тега .
Пример кода указания языка страницы lang HTML документа
Пример указания языка на HTML веб странице:
Пример для спецификации XHTML:
Стандарт ISO 639-1 кодов языков
HTML использует стандарт кодов языков ISO 639-1.
Таблица кодов языков ниже содержит HTML код языка с указанием перевода на русский и английский.
Код ISO639-1 | Язык на русском | Язык на английском |
---|---|---|
ab | Абхазский | Abkhazian |
av | Аварский | Avaric |
ae | Авестийский | Avestan |
az | Азербайджанский | Azerbaijani |
ay | Аймара | Aymara |
ak | Акан | Akan |
sq | Албанский | Albanian |
am | Амхарский | Amharic |
en | Английский | English |
ar | Арабский | Arabic |
hy | Армянский | Armenian |
as | Ассамский | Assamese |
aa | Афарский | Afar |
af | Африкаанс | Afrikaans |
bm | Бамбара | Bambara |
eu | Баскский | Basque |
ba | Башкирский | Bashkir |
be | Белорусский | Belarusian |
bn | Бенгальский | Bengali (Bangla) |
my | Бирманский | Burmese |
bi | Бислама | Bislama |
bg | Болгарский | Bulgarian |
bs | Боснийский | Bosnian |
br | Бретонский | Breton |
cy | Валлийский | Welsh |
hu | Венгерский | Hungarian |
ve | Венда | Venda |
vo | Волапюк | Volapük |
wo | Волоф | Wolof |
vi | Вьетнамский | Vietnamese |
gl | Галисийский | Galician |
lg | Ганда | Luganda, Ganda |
hz | Гереро | Herero |
kl | Гренландский | Kalaallisut, Greenlandic |
el | Греческий (новогреческий) | Greek |
ka | Грузинский | Georgian |
gn | Гуарани | Guarani |
gu | Гуджарати | Gujarati |
gd | Гэльский | Gaelic (Scottish) |
da | Датский | Danish |
dz | Дзонг-кэ | Dzongkha |
dv | Дивехи (Мальдивский) | Divehi, Dhivehi, Maldivian |
zu | Зулу | Zulu |
he | Иврит | Hebrew |
ig | Игбо | Igbo |
yi или ji | Идиш | Yiddish |
id или in | Индонезийский | Indonesian |
ia | Интерлингва | Interlingua |
ie | Интерлингве | Interlingue |
iu | Инуктитут | Inuktitut |
ik | Инупиак | Inupiak |
ga | Ирландский | Irish |
is | Исландский | Icelandic |
es | Испанский | Spanish |
it | Итальянский | Italian |
yo | Йоруба | Yoruba |
kk | Казахский | Kazakh |
kn | Каннада | Kannada |
kr | Канури | Kanuri |
ca | Каталанский | Catalan |
ks | Кашмири | Kashmiri |
qu | Кечуа | Quechua |
ki | Кикуйю | Kikuyu |
kj | Киньяма | Kwanyama |
ky | Киргизский | Kyrgyz |
zh | Китайский | Chinese |
kv | Коми | Komi |
kg | Конго | Kongo |
ko | Корейский | Korean |
kw | Корнский | Cornish |
co | Корсиканский | Corsican |
xh | Коса | Xhosa |
ku | Курдский | Kurdish |
km | Кхмерский | Khmer |
lo | Лаосский | Lao |
la | Латинский | Latin |
lv | Латышский | Latvian (Lettish) |
ln | Лингала | Lingala |
lt | Литовский | Lithuanian |
lu | Луба-катанга | Luga-Katanga |
lb | Люксембургский | Luxembourgish |
mk | Македонский | Macedonian |
mg | Малагасийский | Malagasy |
ms | Малайский | Malay |
ml | Малаялам | Malayalam |
mt | Мальтийский | Maltese |
mi | Маори | Maori |
mr | Маратхи | Marathi |
mh | Маршалльский | Marshallese |
mn | Монгольский | Mongolian |
gv | Мэнский (Мэнкский) | Manx |
nv | Навахо | Navajo |
na | Науру | Nauru |
nd | Ндебелесеверный | NorthernNdebele |
nr | Ндебелеюжный | SouthernNdebele |
ng | Ндунга | Ndonga |
de | Немецкий | German |
ne | Непальский | Nepali |
nl | Нидерландский (Голландский) | Dutch |
no | Норвежский | Norwegian |
ny | Ньянджа | Chichewa, Chewa, Nyanja |
nn | Нюнорск (новонорвежский) | Norwegiannynorsk |
oj | Оджибве | Ojibwe |
oc | Окситанский | Occitan |
or | Ория | Oriya |
om | Оромо | Oromo (AfaanOromo) |
os | Осетинский | Ossetian |
pi | Пали | Pāli |
pa | Пенджабский | Punjabi (Eastern) |
fa | Персидский | Persian (Farsi) |
pl | Польский | Polish |
pt | Португальский | Portuguese |
ps | Пушту | Pashto,Pushto |
rm | Ретороманский | Romansh |
rw | Руанда | Kinyarwanda (Rwanda) |
ro | Румынский | Romanian |
rn | Рунди | Kirundi |
ru | Русский | Russian |
sm | Самоанский | Samoan |
sg | Санго | Sango |
sa | Санскрит | Sanskrit |
sc | Сардинский | Sarda |
ss | Свази | Swati |
sr | Сербский | Serbian |
si | Сингальский | Sinhalese |
sd | Синдхи | Sindhi |
sk | Словацкий | Slovak |
sl | Словенский | Slovenian |
so | Сомали | Somali |
st | Сотоюжный | Sesotho |
sw | Суахили | Swahili (Kiswahili) |
su | Сунданский | Sundanese |
tl | Тагальский | Tagalog |
tg | Таджикский | Tajik |
th | Тайский | Thai |
ty | Таитянский | Tahitian |
ta | Тамильский | Tamil |
tt | Татарский | Tatar |
tw | Тви | Twi |
te | Телугу | Telugu |
bo | Тибетский | Tibetan |
ti | Тигринья | Tigrinya |
to | Тонганский | Tonga |
tn | Тсвана | Setswana |
ts | Тсонга | Tsonga |
tr | Турецкий | Turkish |
tk | Туркменский | Turkmen |
uz | Узбекский | Uzbek |
ug | Уйгурский | Uyghur |
uk | Украинский | Ukrainian |
ur | Урду | Urdu |
fo | Фарерский | Faroese |
fj | Фиджи | Fijian |
fl | Филиппинский | Pilipino |
fi | Финский (Suomi) | Finnish |
fr | Французский | French |
fy | Фризский | WesternFrisian |
ff | Фулах | Fula, Fulah, Pulaar, Pular |
ha | Хауса | Hausa |
hi | Хинди | Hindi |
ho | Хиримоту | HiriMotu |
hr | Хорватский | Croatian |
cu | Церковнославянский (Старославянский) | OldChurchSlavonic, OldBulgarian |
ch | Чаморро | Chamorro |
ce | Чеченский | Chechen |
cs | Чешский | Czech |
za | Чжуанский | Zhuang,Chuang |
cv | Чувашский | Chuvash |
sv | Шведский | Swedish |
sn | Шона | Shona |
ee | Эве | Ewe |
eo | Эсперанто | Esperanto |
et | Эстонский | Estonian |
jv | Яванский | Javanese |
ja | Японский | Japanese |