Мнемоники в HTML

Эта статья находится на начальном уровне проработки, в одной из её версий выборочно используется текст из источника, распространяемого под свободной лицензией
Материал из энциклопедии Руниверсалис
HTML

Символ-мнемоника (англ. entity «сущность») — конструкция SGML, которая ссылается на символ из набора символов текстового файла. В HTML предопределено большое количество спецсимволов[1]. Чтобы вставить спецсимвол (управляющий/форматный символ) в разметку, нужно вставить в HTML-структуру соответствующий этому символу символ-мнемонику.

Назначение и синтаксис

Назначение

Если необходимо поместить в выводимый текст какую-либо литеру, то сделать это можно двумя способами:

  • введя эту литеру непосредственно в исходный текст;
  • используя специальный синтаксис представления литеры.

Первый способ плохо применим к литерам, имеющим форматный смысл в HTML, таким, как угловые скобки < и > (знаки «меньше» и «больше»). Такие литеры далеко не всегда будут восприниматься как просто текстовые. Сложности этого способа усугубляются тем, что метод определения того, является ли данная литера форматной или текстовой, зависит от конкретного браузера, так как каждый из них пытается исправлять ошибки синтаксиса HTML по-своему, а использование форматных литер не по форматному назначению — именно ошибка. Этот способ также может быть неудобен, когда требуется ввести литеру, которой нет на клавиатуре. К примеру, кавычки-ёлочки на стандартной клавиатуре Windows отсутствуют.

При непосредственном редактировании исходного кода HTML с использованием текстового редактора редактируемый файл представляется равноширинным шрифтом (шрифтом постоянной ширины), в котором некоторые символы могут выглядеть трудноотличимо: в частности, пробелы разной ширины и смысла (например, «разрывные» и «неразрывные») все будут выглядеть одинаково, одинаково или почти одинаково будут выглядеть различные горизонтальные чёрточки (чёрточка-минус, минус, дефис, неразрывный дефис, мягкий перенос, короткое и длинное тире и т. п.), что делает работу с ними неудобной. Во многих равноширинных шрифтах плохо работает наложение «модифицирующих» литер, таких, как акут (русское ударение, U+0301), из-за чего такой модификатор может накладываться не на предыдущий, а на следующий символ, что создаёт дополнительную путаницу. И, наконец, этот способ полностью неприменим к литерам, отсутствующим в кодировке файла HTML.

Поэтому, во всех этих случаях лучше (если не единственно возможно) применять способ № 2 — использовать специальный синтаксис. Следует иметь в виду, что заданные специальным образом литеры теряют форматный смысл, например, угловые скобки перестают выделять теги, а пробел перестаёт разделять их атрибуты, что и позволяет использовать форматные литеры как просто текстовые, задавая их специальным образом.

Синтаксис

Задание литеры её именем

Литера может быть представлена в исходном коде HTML как «&charname;», где charname — её имя. Кавычки не являются частью синтаксиса. Регистр букв существен. Завершающий символ «точка с запятой» часто можно опускать: если в исходном тексте после такой литеры расположен пробел, директива HTML или что-либо другое, не могущее быть продолжением имени литеры, то браузер всё понимает правильно. Более того, если данное имя не является префиксом другого, то завершитель при нём необязателен. С другой стороны, во избежание недоразумений завершитель лучше ставить всегда[2].

Пример: «&» (амперсанд (англ. ampersand), имя — «amp») — «&amp;», скажем, «John & Mary» — «John &amp; Mary».

Задание литеры её юникод-номером

В качестве имени любой литеры можно использовать её юникод-номер, предварённый значком «#», если номер десятичный, или сочетанием «#x» (знак «#» и латинская буква «x»), если номер шестнадцатеричный. То есть, для литеры с юникод-номером ddddd10, 0≤ddddd≤111411110, можно использовать имя #ddddd, а для юникод-номера hhhh16, 0≤hhhh≤10FFFF16 — #xhhhh или #Xhhhh. Количество цифр не ограничено, лидирующие (незначащие) нули не имеют значения, регистр буквы «x» и шестнадцатеричных цифр ABCDEF несуществен[2].

Пример: «&» ampersand, U+0026, (3810); имя может быть «#38» или «#038» или «#0038», «#x26» или «#x026» или «#X0026» и т. д.; «John & Mary» — «John &#38; Mary».

«Древние» литеры

Литеры, имеющие форматное значение в HTML, будучи помещены в исходный текст непосредственно, без подстановки, могут вызвать синтаксические проблемы. Лучше задавать их специальным образом.

  • знак «меньше» (Less-Than sign), U+003C (<);
  • знак «больше» (Greater-Than sign), U+003E (>);
  • амперсанд (Ampersand symbol), U+0026 (&);
  • двойная кавычка (Quote symbol), U+0022 (").

Каждая из этих литер в HTML имеет два имени — одно в нижнем регистре и одно в верхнем. Оба этих имени для одной литеры совершенно одинаковы за исключением регистра букв. Это сделано из соображений совместимости, поскольку древний стандарт HTML был нечувствительным к регистру в отношении таких имён, так что старые HTML‑ные документы могут использовать любой регистр.

В настоящее время форма нижнего регистра является предпочтительной, а форма верхнего регистра — нежелательной, так как может вызывать проблемы. Варианты имён верхнего регистра вводились браузерами для обеспечения реальной совместимости со старыми документами вопреки стандарту HTML, и только в версии 5.0 они были официально введены в стандарт.

Есть ещё три другие литеры с такими же вариантами верхнего/нижнего регистров, но без какого‑либо специального форматного значения в HTML — copyright (©), registered trademark (®) и trademark (™);

Эти литеры также присутствовали в стандарте HTML в тот момент, когда он был изменён с нечувствительного к регистру имён литер на чувствительный, так что правила для них такие же, как для форматных.

Имена всех «старых» (форматных и неформатных) литер:

  • < — lt или LT (is less than operator, U+003C, Basic Latin (ASCII));
  • > — gt или GT (is greater than operator, U+003E, Basic Latin (ASCII));
  • & — amp или AMP (ampersand, U+0026, Basic Latin (ASCII));
  • " — quot или QUOT (quote, U+0022, Basic Latin (ASCII));
  • © — copy или COPY (Copyright sign, U+00A9, Latin‑1 Supplement);
  • ® — reg или REG (Registered Trademark sign, U+00AE, Latin‑1 Supplement);
  • ™ — trade или TRADE (Trademark sign, U+2122, Letter‐like Symbols);

Совместимость

Кроме HTML соответствующие соглашения используются в других системах, например, XML, движок Википедии, FB2 и т. д. Однако эти системы следуют стандарту HTML не полностью.

Например, в XML из имён литер допустимы лишь имена форматных литер (включая апостроф) нижнего регистра, то есть lt, gt, amp, quot и apos, при задании литер шестнадцатеричным юникод-номером латинская буква «x» должна быть в нижнем регистре и завершающая точка с запятой обязательна. Движок Википедии использует имена HTML версии до 4.0 и требует обязательного завершения точкой с запятой. FB2 допускает задание литер только юникод-номерами, при этом некоторые обработчики FB2 дополнительно ограничивают эти номера только десятичными.

Таким образом, наиболее совместимый способ задания — десятичными номерами с обязательным завершителем. Если используются шестнадцатеричные имена, то латинскую букву «x» лучше держать в нижнем регистре, а шестнадцатеричные цифры ABCDEF — в верхнем. Из имён наиболее стандартны lt, gt, amp и quot (в XML стандартен ещё и apos). В остальном следует ориентироваться на стандарт HTML 4.0, использование имён версии 5.0 наименее надёжно.

Таблицы ссылок-мнемоник

Управляющие символы C0 и основная латиница

U+0000—U+007F

Данный диапазон Юникода полностью соответствует стандарту ASCII за исключением соглашения о наложении литер через возврат на шаг.[3]

Символ Назначение Мнемоника HTML Код
U+0000—U+001F — управляющие символы C0
табуляция — HT (ANSI), ГТ (ГОСТ) &Tab; 5.0 U+0009 &#9;
перевод строки — LF (ANSI), ПС (ГОСТ) &NewLine; 5.0 U+000A &#10;
U+0032—U+007E — основная латиница
пробел U+0020 &#32;
! восклицательный знак &excl; 5.0 U+0021 &#33;
" двойная кавычка[4] &QUOT; 5.0 U+0022 &#34;
&quot; 2.0
# знак номера («решётка» или «диез») &num; 5.0 U+0023 &#35;
$ знак доллара &dollar; 5.0 U+0024 &#36;
% знак процента &percnt; 5.0 U+0025 &#37;
& амперсанд &AMP; 5.0 U+0026 &#38;
&amp; 1.0/2.0
' одинарная кавычка (занимающий позицию апостроф)[5] &apos; 5.0 U+0027 &#39;
( левая круглая скобка &lpar; 5.0 U+0028 &#40;
) правая круглая скобка &rpar; 5.0 U+0029 &#41;
* звёздочка (может быть как высоко, так и среднерасположенной)[6][7] &ast; 5.0 U+002A &#42;
&midast;
+ знак плюс &plus; 5.0 U+002B &#43;
, запятая[8] &comma; 5.0 U+002C &#44;
- чёрточка-минус (не рекомендован к использованию)[9][10] U+002D &#45;
. точка[11] &period; 5.0 U+002E &#46;
/ косая черта (солидус)[12][13] &sol; 5.0 U+002F &#47;
U+0030—U+0039 — цифры 0—9[14]
: двоеточие &colon; 5.0 U+003A &#58;
; точка с запятой &semi; 5.0 U+003B &#59;
< знак меньше &LT; 5.0 U+003C &#60;
&lt; 1.0/2.0
= знак равенства &equals; 5.0 U+003D &#61;
> знак больше &GT; 5.0 U+003E &#62;
&gt; 1.0/2.0
? знак вопроса &quest; 5.0 U+003F &#63;
@ коммерческий «эт» &commat; 5.0 U+0040 &#64;
U+0041—U+005A — заглавные латинские буквы A—Z[15]
[ левая квадратная скобка &lsqb; 5.0 U+005B &#91;
&lbrack;
\ обратная косая черта[16] &bsol; 5.0 U+005C &#92;
] правая квадратная скобка &rsqb; 5.0 U+005D &#93;
&rbrack;
^ карет — (может быть как высоко, так и среднерасположенным)[17][18] &Hat; 5.0 U+005E &#94;
_ занимающее позицию подчёркивание (должно стыковаться по горизонтали)[19] &lowbar; 5.0 U+005F &#95;
&UnderBar;
` занимающий позицию обратный апостроф (грейв)[20] &grave; 5.0 U+0060 &#96;
&DiacriticalGrave;
U+0061—U+007A — строчные латинские буквы a—z[21]
{ левая фигурная скобка &lcub; 5.0 U+007B &#123;
&lbrace;
| вертикальная черта[22] &verbar; 5.0 U+007C &#124;
&vert;
&VerticalLine;
} правая фигурная скобка &rcub; 5.0 U+007D &#125;
&rbrace;
~ занимающая позицию тильда (может быть как высоко, так и среднерасположенной, не рекомендуется к использованию)[23][24] U+007E &#126;
U+007F — управляющие символы C0

Управляющие символы C1 и дополнение из Latin-1

U+0080—U+00FF

Исторически в диапазон U+00A0—U+00FF («Дополнение из Latin‑1») переносились литеры из соответствующих позиций Latin‑1 (ISO 8859‑1), пока не стало объявлено, что стандарт Latin‑1 включён в Юникод полностью — как ASCII (U+0000—U+007F), так и данный диапазон (U+0080—U+00FF), за исключением соглашения о наложении литер через возврат на шаг.

Символ Назначение Мнемоника HTML Код
U+0080—U+009F — управляющие символы C1
U+00A0—U+00FF — дополнение из Latin‑1
  неразрывный пробел &NonBreakingSpace; 5.0 U+00A0 &#160;
&nbsp; 3.2
¡ перевёрнутый восклицательный знак &iexcl; 3.2 U+00A1 &#161;
¢ символ цента &cent; 3.2 U+00A2 &#162;
£ символ фунта &pound; 3.2 U+00A3 &#163;
¤ знак валюты &curren; 3.2 U+00A4 &#164;
¥ символ иены и юаня &yen; 3.2 U+00A5 &#165;
¦ разорванная вертикальная черта &brkbar; нестандарт U+00A6 &#166;
&brvbar; 3.2
§ знак параграфа &sect; 3.2 U+00A7 &#167;
¨ диерезис, трема
умлаут
(все занимают позицию)
&die; 5.0 U+00A8 &#168;
&Dot; 5.0
&DoubleDot; 5.0
&uml; 3.2
© знак охраны авторского права &COPY; 5.0 U+00A9 &#169;
&copy; 3.2
ª порядковый индикатор (женский род) &ordf; 3.2 U+00AA &#170;
« направленная влево двойная угловая кавычка &laquo; 3.2 U+00AB &#171;
¬ знак «отрицание» &not; 3.2 U+00AC &#172;
­ мягкий перенос (обозначает место возможного переноса: при отсутствии переноса невидим, при наличии — виден как дефис перед разрывом строки). В примере, по отсутствию переноса, невидим. &shy; 3.2 U+00AD &#173;
® знак правовой охраны товарного знака &REG; 5.0 U+00AE &#174;
&circledR; 5.0
&reg; 3.2
¯ занимающий позицию макрон &hibar; нестандарт U+00AF &#175;
&macron; нестандарт
&strns; 5.0
&macr; 3.2
° занимающий позицию знак градуса &degree; нестандарт U+00B0 &#176;
&deg; 3.2
± плюс-минус &pm; 5.0 U+00B1 &#177;
&PlusMinus; 5.0
&plusmn; 3.2
² верхний индекс «2» &sup2; 3.2 U+00B2 &#178;
³ верхний индекс «3» &sup3; 3.2 U+00B3 &#179;
´ занимающий позицию акут &DiacriticalAcute; 5.0 U+00B4 &#180;
&acute; 3.2
µ дольный префикс микро
микрон — устаревшее обозначение микрометра
&micro; 3.2 U+00B5 &#181;
знак абзаца &para; 3.2 U+00B6 &#182;
· интерпункт &centerdot; 5.0 U+00B7 &#183;
&CenterDot; 5.0
&middot; 3.2
¸ занимающая позицию седиль &Cedilla; 5.0 U+00B8 &#184;
&cedil; 3.2
¹ верхний индекс «1» &sup1; 3.2 U+00B9 &#185;
º порядковый индикатор (мужской род) &ordm; 3.2 U+00BA &#186;
» направленная вправо двойная угловая кавычка &raquo; 3.2 U+00BB &#187;
¼ простая дробь «одна четвёртая» &frac14; 3.2 U+00BC &#188;
½ простая дробь «одна вторая» &half; 5.0 U+00BD &#189;
&frac12; 3.2
¾ простая дробь «три четверти» &frac34; 3.2 U+00BE &#190;
¿ перевёрнутый знак вопроса &iquest; 3.2 U+00BF &#191;
À латинская заглавная A с грависом («тупым ударением») &Agrave; 2.0 U+00C0 &#192;
Á латинская заглавная A с акутом («острым ударением») &Aacute; 2.0 U+00C1 &#193;
 латинская заглавная A с циркумфлексом &Acirc; 2.0 U+00C2 &#194;
à латинская заглавная A с тильдой &Atilde; 2.0 U+00C3 &#195;
Ä латинская заглавная A с тремой &Auml; 2.0 U+00C4 &#196;
Å латинская заглавная A с кружком сверху &Aring; 2.0 U+00C5 &#197;
Æ латинская заглавная лигатура AE &AElig; 2.0 U+00C6 &#198;
Ç латинская заглавная C с седилью &Ccedil; 2.0 U+00C7 &#199;
È латинская заглавная E с грависом &Egrave; 2.0 U+00C8 &#200;
É латинская заглавная E с акутом &Eacute; 2.0 U+00C9 &#201;
Ê латинская заглавная E с циркумфлексом &Ecirc; 2.0 U+00CA &#202;
Ë латинская заглавная E с тремой &Euml; 2.0 U+00CB &#203;
Ì латинская заглавная I с грависом &Igrave; 2.0 U+00CC &#204;
Í латинская заглавная I с акутом &Iacute; 2.0 U+00CD &#205;
Î латинская заглавная I с циркумфлексом &Icirc; 2.0 U+00CE &#206;
Ï латинская заглавная I с тремой &Iuml; 2.0 U+00CF &#207;
Ð латинская заглавная буква «eth» &ETH; 2.0 U+00D0 &#208;
Ñ латинская заглавная N с тильдой &Ntilde; 2.0 U+00D1 &#209;
Ò латинская заглавная O с грависом &Ograve; 2.0 U+00D2 &#210;
Ó латинская заглавная O с акутом &Oacute; 2.0 U+00D3 &#211;
Ô латинская заглавная O с циркумфлексом &Ocirc; 2.0 U+00D4 &#212;
Õ латинская заглавная O с тильдой &Otilde; 2.0 U+00D5 &#213;
Ö латинская заглавная O с тремой &Ouml; 2.0 U+00D6 &#214;
× знак умножения &times; 3.2 U+00D7 &#215;
Ø латинская заглавная O диагонально перечёркнутая &Oslash; 2.0 U+00D8 &#216;
Ù латинская заглавная U с грависом &Ugrave; 2.0 U+00D9 &#217;
Ú латинская заглавная U с акутом &Uacute; 2.0 U+00DA &#218;
Û латинская заглавная U с циркумфлексом &Ucirc; 2.0 U+00DB &#219;
Ü латинская заглавная U с тремой &Uuml; 2.0 U+00DC &#220;
Ý латинская заглавная Y с акутом &Yacute; 2.0 U+00DD &#221;
Þ латинская заглавная буква Торн (THORN) &THORN; 2.0 U+00DE &#222;
ß латинская строчная эсцет &szlig; 2.0 U+00DF &#223;
à латинская строчная «a» с грависом &agrave; 2.0 U+00E0 &#224;
á латинская строчная «a» с акутом &aacute; 2.0 U+00E1 &#225;
â латинская строчная «a» с циркумфлексом &acirc; 2.0 U+00E2 &#226;
ã латинская строчная «a» с тильдой &atilde; 2.0 U+00E3 &#227;
ä латинская строчная «a» с тремой &auml; 2.0 U+00E4 &#228;
å латинская строчная «a» с кружком сверху &aring; 2.0 U+00E5 &#229;
æ латинская строчная лигатура «ae» &aelig; 2.0 U+00E6 &#230;
ç латинская строчная «c» с седилью &ccedil; 2.0 U+00E7 &#231;
è латинская строчная «e» с грависом &egrave; 2.0 U+00E8 &#232;
é латинская строчная «e» с акутом &eacute; 2.0 U+00E9 &#233;
ê латинская строчная «e» с циркумфлексом &ecirc; 2.0 U+00EA &#234;
ë латинская строчная «e» с тремой &euml; 2.0 U+00EB &#235;
ì латинская строчная «i» с грависом &igrave; 2.0 U+00EC &#236;
í латинская строчная «i» с акутом &iacute; 2.0 U+00ED &#237;
î латинская строчная «i» с циркумфлексом &icirc; 2.0 U+00EE &#238;
ï латинская строчная «i» с тремой &iuml; 2.0 U+00EF &#239;
ð латинская строчная «eth» &eth; 2.0 U+00F0 &#240;
ñ латинская строчная «n» с тильдой &ntilde; 2.0 U+00F1 &#241;
ò латинская строчная «o» с грависом &ograve; 2.0 U+00F2 &#242;
ó латинская строчная «o» с акутом &oacute; 2.0 U+00F3 &#243;
ô латинская строчная «o» с циркумфлексом &ocirc; 2.0 U+00F4 &#244;
õ латинская строчная «o» с тильдой &otilde; 2.0 U+00F5 &#245;
ö латинская строчная «o» с тремой &ouml; 2.0 U+00F6 &#246;
÷ знак деления &div; 5.0 (?) U+00F7 &#247;
&divide; 3.2
ø латинская строчная «o» диагонально перечёркнутая &oslash; 2.0 U+00F8 &#248;
ù латинская строчная «u» с грависом &ugrave; 2.0 U+00F9 &#249;
ú латинская строчная «u» с акутом &uacute; 2.0 U+00FA &#250;
û латинская строчная «u» с циркумфлексом &ucirc; 2.0 U+00FB &#251;
ü латинская строчная «u» с тремой &uuml; 2.0 U+00FC &#252;
ý латинская строчная «y» с акутом &yacute; 2.0 U+00FD &#253;
þ латинская строчная «торн» (thorn) &thorn; 2.0 U+00FE &#254;
ÿ латинская строчная «y» с тремой &yuml; 2.0 U+00FF &#255;

Расширение латиницы — A

U+0100—U+017F

Символ Назначение Мнемоника HTML Код
Ā латинская заглавная «A» с макроном &Amacr; 5.0 U+0100 &#256;
ā латинская строчная «a» с макроном &amacr; 5.0 U+0101 &#257;
Ă латинская заглавная «A» с бреве &Abreve; 5.0 U+0102 &#258;
ă латинская строчная «a» с бреве &abreve; 5.0 U+0103 &#259;
Ą латинская заглавная «A» с огонэком &Aogon; 5.0 U+0104 &#260;
ą латинская строчная «a» с огонэком &aogon; 5.0 U+0105 &#261;
Ć латинская заглавная «C» с акутом &Cacute; 5.0 U+0106 &#262;
ć латинская строчная «c» с акутом &cacute; 5.0 U+0107 &#263;
Ĉ латинская заглавная «C» с циркумфлексом &Ccirc; 5.0 U+0108 &#264;
ĉ латинская строчная «c» с циркумфлексом &ccirc; 5.0 U+0109 &#265;
Ċ латинская заглавная «C» с точкой сверху &Cdot; 5.0 U+010A &#266;
ċ латинская строчная «c» с точкой сверху &cdot; 5.0 U+010B &#267;
Č латинская заглавная «C» с птичкой &Ccaron; 5.0 U+010C &#268;
č латинская строчная «c» с птичкой &ccaron; 5.0 U+010D &#269;
Ď латинская заглавная «D» с птичкой &Dcaron; 5.0 U+010E &#270;
ď латинская строчная «d» с птичкой (в шрифтах предпочтителен вариант с апострофом) &dcaron; 5.0 U+010F &#271;
Đ латинская заглавная «D» с горизонтальным штрихом. На вид может не отличаться от Eth (Ð, U+00D0, &ETH;) &Dstrok; 5.0 U+0110 &#272;
đ латинская строчная «d» с горизонтальным штрихом. На вид может не отличаться от eth (ð, U+00F0, &eth;) &dstrok; 5.0 U+0111 &#273;
Ē латинская заглавная «E» с макроном &Emacr; 5.0 U+0112 &#274;
ē латинская строчная «e» с макроном &emacr; 5.0 U+0113 &#275;
Ĕ латинская заглавная «E» с бреве U+0114 &#276;
ĕ латинская строчная «e» с бреве U+0115 &#277;
Ė латинская заглавная «E» с точкой сверху &Edot; 5.0 U+0116 &#278;
ė латинская строчная «e» с точкой сверху &edot; 5.0 U+0117 &#279;
Ę латинская заглавная «E» с огонэком &Eogon; 5.0 U+0118 &#280;
ę латинская строчная «e» с огонэком &eogon; 5.0 U+0119 &#281;
Ě латинская заглавная «E» с птичкой &Ecaron; 5.0 U+011A &#282;
ě латинская строчная «e» с птичкой &ecaron; 5.0 U+011B &#283;
Ĝ латинская заглавная «G» с циркумфлексом &Gcirc; 5.0 U+011C &#284;
ĝ латинская строчная «g» с циркумфлексом &gcirc; 5.0 U+011D &#285;
Ğ латинская заглавная «G» с бреве &Gbreve; 5.0 U+011E &#286;
ğ латинская строчная «g» с бреве &gbreve; 5.0 U+011F &#287;
Ġ латинская заглавная «G» с точкой сверху &Gdot; 5.0 U+0120 &#288;
ġ латинская строчная «g» с точкой сверху &gdot; 5.0 U+0121 &#289;
Ģ латинская заглавная «G» с цедилью &Gcedil; 5.0 U+0122 &#290;
ģ латинская строчная «g» с цедилью U+0123 &#291;
Ĥ латинская заглавная «H» с циркумфлексом &Hcirc; 5.0 U+0124 &#292;
ĥ латинская строчная «h» с циркумфлексом &hcirc; 5.0 U+0125 &#293;
Ħ латинская заглавная «H» с горизонтальным штрихом &Hstrok; 5.0 U+0126 &#294;
ħ латинская строчная «h» с горизонтальным штрихом &hstrok; 5.0 U+0127 &#295;
Ĩ латинская заглавная «I» с тильдой &Itilde; 5.0 U+0128 &#296;
ĩ латинская строчная «i» с тильдой &itilde; 5.0 U+0129 &#297;
Ī латинская заглавная «I» с макроном &Imacr; 5.0 U+012A &#298;
ī латинская строчная «i» с макроном &imacr; 5.0 U+012B &#299;
Ĭ латинская заглавная «I» с бреве U+012C &#300;
ĭ латинская строчная «i» с бреве U+012D &#301;
Į латинская заглавная «I» с огонэком &Iogon; 5.0 U+012E &#302;
į латинская строчная «i» с огонэком &iogon; 5.0 U+012F &#303;
İ латинская заглавная «I» с точкой сверху &Idot; 5.0 U+0130 &#304;
ı латинская строчная «i» без точки сверху &imath; 5.0 U+0131 &#305;
&inodot;
IJ латинская заглавная лигатура «IJ» &IJlig; 5.0 U+0132 &#306;
ij латинская строчная лигатура «ij» &ijlig; 5.0 U+0133 &#307;
Ĵ латинская заглавная «J» с циркумфлексом &Jcirc; 5.0 U+0134 &#308;
ĵ латинская строчная «j» с циркумфлексом &jcirc; 5.0 U+0135 &#309;
Ķ латинская заглавная «K» с цедилью &Kcedil; 5.0 U+0136 &#310;
ķ латинская строчная «k» с цедилью &kcedil; 5.0 U+0137 &#311;
ĸ латинская строчная «kra» (гренландское «к») &kgreen; 5.0 U+0138 &#312;
Ĺ латинская заглавная «L» с акутом &Lacute; 5.0 U+0139 &#313;
ĺ латинская строчная «l» с акутом &lacute; 5.0 U+013A &#314;
Ļ латинская заглавная «L» с цедилью &Lcedil; 5.0 U+013B &#315;
ļ латинская строчная «l» с цедилью &lcedil; 5.0 U+013C &#316;
Ľ латинская заглавная «L» с птичкой (в шрифтах предпочтителен вариант с апострофом) &Lcaron; 5.0 U+013D &#317;
ľ латинская строчная «l» с птичкой (в шрифтах предпочтителен вариант с апострофом) &lcaron; 5.0 U+013E &#318;
Ŀ латинская заглавная «L» с точкой посередине &Lmidot; 5.0 U+013F &#319;
ŀ латинская строчная «l» с точкой посередине &lmidot; 5.0 U+0140 &#320;
Ł латинская заглавная «L» с горизонтальным штрихом &Lstrok; 5.0 U+0141 &#321;
ł латинская строчная «l» с горизонтальным штрихом &lstrok; 5.0 U+0142 &#322;
Ń латинская заглавная «N» с акутом &Nacute; 5.0 U+0143 &#323;
ń латинская строчная «n» с акутом &nacute; 5.0 U+0144 &#324;
Ņ латинская заглавная «N» с цедилью &Ncedil; 5.0 U+0145 &#325;
ņ латинская строчная «n» с цедилью &ncedil; 5.0 U+0146 &#326;
Ň латинская заглавная «N» с птичкой &Ncaron; 5.0 U+0147 &#327;
ň латинская строчная «n» с птичкой &ncaron; 5.0 U+0148 &#328;
ʼn латинская строчная «n» предшествуемая апострофом &napos; 5.0 U+0149 &#329;
Ŋ латинская заглавная «ENG» &ENG; 5.0 U+014A &#330;
ŋ латинская строчная «eng» &eng; 5.0 U+014B &#331;
Ō латинская заглавная «O» с макроном &Omacr; 5.0 U+014C &#332;
ō латинская строчная «o» с макроном &omacr; 5.0 U+014D &#333;
Ŏ латинская заглавная «O» с бреве U+014E &#334;
ŏ латинская строчная «o» с бреве U+014F &#335;
Ő латинская заглавная «O» с двойным акутом &Odblac; 5.0 U+0150 &#336;
ő латинская строчная «o» с двойным акутом &odblac; 5.0 U+0151 &#337;
Œ латинская заглавная лигатура «OE» &OElig; 4.0 U+0152 &#338;
œ латинская строчная лигатура «oe» &oelig; 4.0 U+0153 &#339;
Ŕ латинская заглавная «R» с акутом &Racute; 5.0 U+0154 &#340;
ŕ латинская строчная «r» с акутом &racute; 5.0 U+0155 &#341;
Ŗ латинская заглавная «R» с цедилью &Rcedil; 5.0 U+0156 &#342;
ŗ латинская строчная «r» с цедилью &rcedil; 5.0 U+0157 &#343;
Ř латинская заглавная «R» с птичкой &Rcaron; 5.0 U+0158 &#344;
ř латинская строчная «r» с птичкой &rcaron; 5.0 U+0159 &#345;
Ś латинская заглавная «S» с акутом &Sacute; 5.0 U+015A &#346;
ś латинская строчная «s» с акутом &sacute; 5.0 U+015B &#347;
Ŝ латинская заглавная «S» с циркумфлексом &Scirc; 5.0 U+015C &#348;
ŝ латинская строчная «s» с циркумфлексом &scirc; 5.0 U+015D &#349;
Ş латинская заглавная «S» с цедилью &Scedil; 5.0 U+015E &#350;
ş латинская строчная «s» с цедилью &scedil; 5.0 U+015F &#351;
Š латинская заглавная «S» с птичкой &Scaron; 4.0 U+0160 &#352;
š латинская строчная «s» с птичкой &scaron; 4.0 U+0161 &#353;
Ţ латинская заглавная «T» с цедилью &Tcedil; 5.0 U+0162 &#354;
ţ латинская строчная «t» с цедилью &tcedil; 5.0 U+0163 &#355;
Ť латинская заглавная «T» с птичкой &Tcaron; 5.0 U+0164 &#356;
ť латинская строчная «t» с птичкой (в шрифтах предпочтителен вариант с апострофом) &tcaron; 5.0 U+0165 &#357;
Ŧ латинская заглавная «T» с горизонтальным штрихом &Tstrok; 5.0 U+0166 &#358;
ŧ латинская строчная «t» с горизонтальным штрихом &tstrok; 5.0 U+0167 &#359;
Ũ латинская заглавная «U» с тильдой &Utilde; 5.0 U+0168 &#360;
ũ латинская строчная «u» с тильдой &utilde; 5.0 U+0169 &#361;
Ū латинская заглавная «U» с макроном &Umacr; 5.0 U+016A &#362;
ū латинская строчная «u» с макроном &umacr; 5.0 U+016B &#363;
Ŭ латинская заглавная «U» с бреве &Ubreve; 5.0 U+016C &#364;
ŭ латинская строчная «u» с бреве &ubreve; 5.0 U+016D &#365;
Ů латинская заглавная «U» с кольцом сверху &Uring; 5.0 U+016E &#366;
ů латинская строчная «u» с кольцом сверху &uring; 5.0 U+016F &#367;
Ű латинская заглавная «U» с двойным акутом &Udblac; 5.0 U+0170 &#368;
ű латинская строчная «u» с двойным акутом &udblac; 5.0 U+0171 &#369;
Ų латинская заглавная «U» с огонэком &Uogon; 5.0 U+0172 &#370;
ų латинская строчная «u» с огонэком &uogon; 5.0 U+0173 &#371;
Ŵ латинская заглавная «W» с циркумфлексом &Wcirc; 5.0 U+0174 &#372;
ŵ латинская строчная «w» с циркумфлексом &wcirc; 5.0 U+0175 &#373;
Ŷ латинская заглавная «Y» с циркумфлексом &Ycirc; 5.0 U+0176 &#374;
ŷ латинская строчная «y» с циркумфлексом &ycirc; 5.0 U+0177 &#375;
Ÿ латинская заглавная «Y» с тремой &Yuml; 4.0 U+0178 &#376;
Ź латинская заглавная «Z» с акутом &Zacute; 5.0 U+0179 &#377;
ź латинская строчная «z» с акутом &zacute; 5.0 U+017A &#378;
Ż латинская заглавная «Z» с точкой сверху &Zdot; 5.0 U+017B &#379;
ż латинская строчная «z» с точкой сверху &zdot; 5.0 U+017C &#380;
Ž латинская заглавная «Z» с птичкой &Zcaron; 5.0 U+017D &#381;
ž латинская строчная «z» с птичкой &zcaron; 5.0 U+017E &#382;
ſ латинская строчная «долгая s» U+017F &#383;

Расширение латиницы — B

U+0180—U+024F

Символ Назначение Мнемоника HTML Код
ƒ • латинская строчная f с хвостиком снизу (иногда называется рукописной f, на самом деле прямая или курсив)
• знак флорина
• символ функции
• это не регулярная курсивная латинская f (𝑓, U+1D453), хотя, в зависимости от шрифта, может выглядеть очень похоже
&fnof; 4.0 U+0192 &#402;
Ƶ латинская заглавная «Z» с горизонтальным штрихом &imped; 5.0 U+01B5 &#437;
ǵ латинская строчная «g» с акутом &gacute; 5.0 U+01F5 &#501;
ȷ латинская строчная «j» без точки сверху &jmath; 5.0 U+0237 &#567;

Занимающие позицию модификаторы букв

U+02B0—U+02FF

Символ Назначение Мнемоника HTML Код
ˆ занимающий позицию акцент перевёрнутая птичка/circumflex accent &circ; 4.0 U+02C6 &#710;
ˇ занимающий позицию акцент птичка (гачек) &caron; 5.0 U+02C7 &#711;
&Hacek;
˘ занимающий позицию бреве &breve; 5.0 U+02D8 &#728;
&Breve;
˙ занимающая позицию точка сверху &dot; 5.0 U+02D9 &#729;
&DiacriticalDot;
˚ занимающий позицию кружок сверху &ring; 5.0 U+02DA &#730;
˛ занимающий позицию огонэк &ogon; 5.0 U+02DB &#731;
˜ занимающая позицию малая тильда &DiacriticalTilde; 5.0 U+02DC &#732;
&tilde; 4.0
˝ занимающий позицию двойной акут &dblac; 5.0 U+02DD &#733;
&DiacriticalDoubleAcute;

Комбинируемые диакритические знаки

U+0300—U+036F

Символ Назначение Мнемоника HTML Код
 ́ комбинируемый знак ударения (аку́т — ставится непосредственно после буквы, над которой должен изображаться) U+0301 &#769;
 ̑ комбинируемый перевёрнутый бре́вис (ставится непосредственно после буквы, над которой должен изображаться) &DownBreve; 5.0 U+0311 &#785;

Греческие и коптские символы

U+0370 — U+03FF

Включает Греческий алфавит.

Символ Назначение Мнемоника HTML Код
Α греческая заглавная альфа &Alpha; 4.0 U+0391 &#913;
Β греческая заглавная бета &Beta; 4.0 U+0392 &#914;
Γ греческая заглавная гамма &Gamma; 4.0 U+0393 &#915;
Δ греческая заглавная дельта &Delta; 4.0 U+0394 &#916;
Ε греческая заглавная эпсилон &Epsilon; 4.0 U+0395 &#917;
Ζ греческая заглавная дзета &Zeta; 4.0 U+0396 &#918;
Η греческая заглавная эта &Eta; 4.0 U+0397 &#919;
Θ греческая заглавная тета &Theta; 4.0 U+0398 &#920;
Ι греческая заглавная йота &Iota; 4.0 U+0399 &#921;
Κ греческая заглавная каппа &Kappa; 4.0 U+039A &#922;
Λ греческая заглавная лямбда &Lambda; 4.0 U+039B &#923;
Μ греческая заглавная мю &Mu; 4.0 U+039C &#924;
Ν греческая заглавная ню &Nu; 4.0 U+039D &#925;
Ξ греческая заглавная кси &Xi; 4.0 U+039E &#926;
Ο греческая заглавная омикрон &Omicron; 4.0 U+039F &#927;
Π греческая заглавная пи &Pi; 4.0 U+03A0 &#928;
Ρ греческая заглавная ро &Rho; 4.0 U+03A1 &#929;
Σ греческая заглавная сигма &Sigma; 4.0 U+03A3 &#931;
Τ греческая заглавная тау &Tau; 4.0 U+03A4 &#932;
Υ греческая заглавная ипсилон &Upsilon; 4.0 U+03A5 &#933;
Φ греческая заглавная фи &Phi; 4.0 U+03A6 &#934;
Χ греческая заглавная хи &Chi; 4.0 U+03A7 &#935;
Ψ греческая заглавная пси &Psi; 4.0 U+03A8 &#936;
Ω • греческая заглавная омега
• Ом (единица электрического сопротивления) — рекомендуется вместо ранее введённого специального символа «Ом» U+2126 (Ω, &#8486;)
&ohm; 5.0 U+03A9 &#937;
&Omega; 4.0
α греческая строчная альфа &alpha; 4.0 U+03B1 &#945;
β греческая строчная бета &beta; 4.0 U+03B2 &#946;
γ греческая строчная гамма &gamma; 4.0 U+03B3 &#947;
δ греческая строчная дельта &delta; 4.0 U+03B4 &#948;
ε греческая строчная эпсилон &epsi; 5.0 U+03B5 &#949;
&epsilon; 4.0
ζ греческая строчная дзета &zeta; 4.0 U+03B6 &#950;
η греческая строчная эта &eta; 4.0 U+03B7 &#951;
θ греческая строчная тета &theta; 4.0 U+03B8 &#952;
ι греческая строчная йота &iota; 4.0 U+03B9 &#953;
κ греческая строчная каппа &kappa; 4.0 U+03BA &#954;
λ греческая строчная лямбда &lambda; 4.0 U+03BB &#955;
μ греческая строчная мю &mu; 4.0 U+03BC &#956;
ν греческая строчная ню &nu; 4.0 U+03BD &#957;
ξ греческая строчная кси &xi; 4.0 U+03BE &#958;
ο греческая строчная омикрон &omicron; 4.0 U+03BF &#959;
π греческая строчная пи &pi; 4.0 U+03C0 &#960;
ρ греческая строчная ро &rho; 4.0 U+03C1 &#961;
ς греческая строчная сигма конечная &sigmav; 5.0 U+03C2 &#962;
&varsigma; 5.0
&sigmaf; 4.0
σ греческая строчная сигма &sigma; 4.0 U+03C3 &#963;
τ греческая строчная тау &tau; 4.0 U+03C4 &#964;
υ греческая строчная ипсилон &upsi; 5.0 U+03C5 &#965;
&upsilon; 4.0
φ греческая строчная фи &phi; 4.0 U+03C6 &#966;
χ греческая строчная хи &chi; 4.0 U+03C7 &#967;
ψ греческая строчная пси &psi; 4.0 U+03C8 &#968;
ω греческая строчная омега &omega; 4.0 U+03C9 &#969;
ϑ греческая символьная тета &thetav; 5.0 U+03D1 &#977;
&vartheta; 5.0
&thetasym; 4.0
ϒ греческий ипсилон с хвостиком &Upsi; 5.0 U+03D2 &#978;
&upsih; 4.0
ϕ греческая символьная фи &straightphi; 5.0 U+03D5 &#981;
&varphi; 5.0
&phiv; 5.0
ϖ греческая символьная пи &varpi; 5.0 U+03D6 &#982;
&piv; 4.0
Ϝ греческая заглавная дигамма &Gammad; 5.0 U+03DC &#988;
ϝ греческая строчная дигамма &gammad; 5.0 U+03DD &#989;
&digamma; 5.0
ϰ греческая символьная каппа &varkappa; 5.0 U+03F0 &#1008;
&kappav; 5.0
ϱ греческая символьная ро &varrho; 5.0 U+03F1 &#1009;
&rhov; 5.0
ϵ греческая символьный эпсилон (прямой эпсилон, лунный эпсилон) &straightepsilon; 5.0 U+03F5 &#1013;
&varepsilon; 5.0
&epsiv; 5.0
϶ греческая обратный эпсилон (обращённый лунный эпсилон) &backepsilon; 5.0 U+03F6 &#1014;
&bepsi; 5.0

Общая пунктуация

Символ Назначение Мнемоника Код
пробел длины N (длинный пробел, примерно с короткое тире) &ensp; &#8194;
пробел длины M (очень длинный пробел, примерно с длинное тире) &emsp; &#8195;
узкий пробел &thinsp; &#8201;
‌‌ zero width non-joiner — запрет склейки (лигатуры) соседних символов &zwnj; &#8204;
‍‍ zero width joiner — запрос на склейку (лигатуру) соседних символов &zwj; &#8205;
left-to-right mark — признак начала текста, читаемого слева­‑направо &lrm; &#8206;
right-to-left mark — признак начала текста, читаемого справа­‑налево &rlm; &#8207;
неразрывный (неразделяемый) дефис / non-breaking hyphen   &#8209;
короткое тире (тире длины N) &ndash; &#8211;
длинное тире (тире длины M) &mdash; &#8212;
одинарная кавычка типа «верхняя перевёрнутая девятка» &lsquo; &#8216;
одинарная кавычка типа «верхняя девятка» &rsquo; &#8217;
одинарная кавычка типа «нижняя девятка» &sbquo; &#8218;
одинарная кавычка типа «верхняя обращённая девятка» &#8219;
двойная кавычка типа «верхняя перевёрнутая девятка» &ldquo; &#8220;
двойная кавычка типа «верхняя девятка» &rdquo; &#8221;
двойная кавычка типа «нижняя девятка» &bdquo; &#8222;
двойная кавычка типа «верхняя обращённая девятка» &#8223;
типографский крестик &dagger; &#8224;
двойной типографский крестик &Dagger; &#8225;
маркер списка (буллит) &bull; &#8226;
горизонтальное многоточие &hellip; &#8230;
проми́лле &permil; &#8240;
штрих &prime; &#8242;
двойной штрих &Prime; &#8243;
направленная влево одинарная угловая кавычка (предложена, но ещё не стандартизирована ISO, практически всюду есть) &lsaquo; &#8249;
направленная вправо одинарная угловая кавычка (предложена, но ещё не стандартизирована ISO, практически всюду есть) &rsaquo; &#8250;
занимающее позицию надчёркивание &oline; &#8254;
 ⁄  комбинируемый символ «дробь-черта» (1&frasl;2 → ½, 3&frasl;4 → ¾, 12&frasl;23 → 12⁄23, при необходимости последовательность цифр ограничивается пробелом нулевой длины (&#8203;) или неразрывным пробелом нулевой длины (&#8288;): 12&#8203;34&frasl;56 → 12​34⁄56, 2&#8288;99&frasl;100 → 2⁠99⁄100) &frasl; &#8260;

Знаки валют

Символ Назначение Мнемоника Код
евро &euro; &#8364;
рубль &#8381;

Буквоподобные символы

Символ Назначение Мнемоника Код
готическая заглавная I (регулярная латинская готическая буква) = мнимая часть &image; &#8465;
Знак номера &numero; (HTML 5.0) &#8470;
эллиптическая функция Вейерштрасса или множество всех подмножеств. Отдельный символ, >не рукописная заглавная P (𝒫, &#119979;) &weierp; &#8472;
готическая заглавная R (регулярная латинская готическая буква) = вещественная часть &real; &#8476;
товарный знак &TRADE; — есть не всюду
&trade;
&#8482;
математическая буква Алеф = бесконечный кардинал — в отличие от еврейской буквы Алеф (‎א‎, &#1488;) читается слева направо &alefsym; &#8501;

Формы чисел

Символ Назначение Мнемоника Код
простая дробь «одна треть» &frac13; (HTML 5.0) &#8531;

Стрелки

Символ Назначение Мнемоника Код
влево &larr; &#8592;
вверх &uarr; &#8593;
вправо &rarr; &#8594;
вниз &darr; &#8595;
влево-вправо &harr; &#8596;
вниз с углом вправо = возврат каретки &crarr; &#8629;
двойная стрелка влево &lArr; &#8656;
двойная вверх &uArr; &#8657;
двойная вправо &rArr; &#8658;
двойная вниз &dArr; &#8659;
двойная влево-вправо &hArr; &#8660;
влево &#9668;
вверх &#9650;
вправо &#9658;
вниз &#9660;

Математические операции

Символ Назначение Мнемоника Код
квантор всеобщности (для всех…) &forall; &#8704;
частная производная &part; &#8706;
квантор существования (существует…) &exist; &#8707;
пустое множество (диаметр) &empty; &#8709;
набла &nabla; &#8711;
принадлежит &isin; &#8712;
не принадлежит &notin; &#8713;
содержит &ni; &#8715;
произведение по множеству &prod; &#8719;
сумма по множеству &sum; &#8721;
минус — не чёрточка-минус из ASCII, имеет те же размеры и такое же расположение горизонтального штриха, что и «+» &minus; &#8722;
деление (не косая черта из ASCII) &#8725;
разность множеств (не обратная косая черта из ASCII) &setmn; (HTML 5.0)
&setminus; (HTML 5.0)
&Backslash; (HTML 5.0)
&ssetmn; (HTML 5.0)
&smallsetminus; (HTML 5.0)
&#8726;
звёздочка (гарантированно не приподнятая над строкой) &lowast; &#8727;
квадратный корень = знак радикала &radic; &#8730;
пропорционально к &prop; &#8733;
бесконечность &infin; &#8734;
угол &ang; &#8736;
конъюнкция (логическое И) = wedge &and; &#8743;
дизъюнкция (логическое ИЛИ) = vee &or; &#8744;
пересечение = cap &cap; &#8745;
объединение = cup &cup; &#8746;
интеграл &int; &#8747;
следовательно, тем самым = therefore &there4; &#8756;
эквивалентно (для бесконечно малых/больших) = similar to &sim; &#8764;
конгруэнтно = is approximately equal (congruent) to &cong; &#8773;
примерно равно = is almost equal (asymptotic) to &asymp; &#8776;
не равно = is not equal to &ne; &#8800;
тождественно равно, логически эквивалентно = is equivalent to &equiv; &#8801;
меньше или равно = is less or equal to &le; &#8804;
больше или равно = is greater or equal to &ge; &#8805;
подмножество = is subset of &sub; &#8834;
включает в себя = is superset of &sup; &#8835;
не является подмножеством = is not subset of &nsub; &#8836;
подмножество или эквивалентно = is subset of or equivalent to &sube; &#8838;
включает в себя или эквивалентно = is superset of or equivalent to &supe; &#8839;
плюс в круге = прямая сумма &oplus; &#8853;
умножение [косым] крестом в круге = тензорное произведение &otimes; &#8855;
up tack = ортогонально к = перпендикулярно &perp; &#8869;
умножение точкой = скалярное произведение &sdot; &#8901;

Технические символы

Символ Назначение Мнемоника Код
левая скобка округления вверх = apl upstile &lceil; &#8968;
правая скобка округления вверх &rceil; &#8969;
левая скобка округления вниз = apl downstile &lfloor; &#8970;
правая скобка округления вниз &rfloor; &#8971;
угловая скобка влево = бра &lang; &#9001;
угловая скобка вправо = кет &rang; &#9002;

Геометрические фигуры

Символ Назначение Мнемоника Код
ромб &loz; &#9674;

Различные символы

Символ Назначение Мнемоника Код
«пики» (карточная масть) &spades; &#9824;
«трефы» (карточная масть) &clubs; &#9827;
«червы» (карточная масть) &hearts; &#9829;
«бубны» (карточная масть) &diams; &#9830;

Примечания

  1. HTML5. Named character references.
  2. 2,0 2,1 HTML Document Representation.
  3. Наложение через возврат на шаг используется в ASCII для получения изображений комбинированных литер (u␈` → ù) и полужирных вариантов (u␈u → u). Все последовательности стандарта ASCII, изображающие комбинированные литеры, а так же полужирные варианты алфавитно-цифровых литер, имеют соответствия в Юникоде, но не переводом «литера-в-литеру», а заменой последовательности литер ASCII на одну литеру Юникода. Полужирные варианты прочих литер ASCII соответствий не имеют, и должны изображаться средствами, выходящими за рамки стандарта Юникод. Поскольку многие шрифты не содержат полужирных вариантов литер, их изображение сильно зависит от особенностей работы системы изображения текстов (подстановка литер и шрифтов), поэтому предпочтительно задание полужирных начертаний внеюникодными средствами.
  4. наложение двойной кавычки через возврат на шаг в ASCII (␈") в Юникоде изображается комбинируемым символом «двойной акут» « ̋» U+030B (&#779;) или «двойная вертикальная чёрточка сверху» « ̎» U+030E (&#783;)
  5. наложение апострофа через возврат на шаг в ASCII (␈') в Юникоде изображается комбинируемым символом «акут» « ́» U+0301 (&#769;)
  6. для того, чтобы получить именно среднерасположенную звёздочку, нужно использовать математическую операцию «∗» U+2217 &lowast; (&#8727;)
  7. наложение звёздочки через возврат на шаг в ASCII (␈*) в Юникоде изображается комбинируемым символом «звёздочка сверху» « ⃰» U+20F0 (&#8432;)
  8. наложение запятой через возврат на шаг в ASCII (␈,) в Юникоде изображается комбинируемым символом «запятая снизу» « ̦» U+0326 (&#806;)
  9. в качестве дефиса следует использовать символы дефис «‐» U+2010 (&#8208;), неразрывный дефис «‑» U+2011 (&#8209;) и мягкий перенос «­» U+00AD &shy; (&#173;); в качестве тире — короткое тире «–» U+2013 &ndash; (&#8211;), длинное тире «—» U+2014 &mdash; (&#8212;), равноширинное («цифровое») тире «‒» U+2012 (&#8210;) и другие; в качестве минуса — математический знак «−» U+2212 &minus; (&#8722;)
  10. наложение чёрточки-минуса через возврат на шаг в ASCII (␈-) в Юникоде изображается комбинируемым символом «короткий горизонтальный штрих» « ̵» U+0335 (&#821;), или, если имеется в виду непрерывное зачёркивание (со стыковкой слева и справа), — «длинный горизонтальный штрих» « ̶» U+0336 (&#822;)
  11. наложение точки через возврат на шаг в ASCII (␈.) в Юникоде изображается комбинируемым символом «точка снизу» « ̣» U+0323 (&#803;)
  12. для деления (a+bc+d с явным (внеюникодным) управлением надстрочным и подстрочным размещением) рекомендована операция « ∕ » U+2215 (&#8725;); для чисто цифровых дробей с неявным (юникодным) управлением надстрочным и подстрочным размещением (12⁄34) — комбинируемый символ дробь-черта U+2044 &frasl; (&#8260;)
  13. наложение косой черты через возврат на шаг в ASCII (␈/) в Юникоде изображается комбинируемым символом «короткое косое перечёркивание» « ̷» U+0337 (&#823;) или «длинное косое перечёркивание» « ̸» U+0338 (&#824;)
  14. полужирные начертания посредством наложение цифры на себя через возврат на шаг в ASCII (0␈0 → 0) в Юникоде изображаются символами диапазона «𝟎» U+1D7CE (&#120782;)—«𝟗» U+1D7D7 (&#120791;)
  15. полужирные начертания посредством наложение буквы на себя через возврат на шаг в ASCII (A␈A → A) в Юникоде изображаются символами диапазона «𝐀» U+1D400 (&#119808;)—«𝐙» U+1D419 (&#119833;)
  16. наложение обратной косой черты через возврат на шаг в ASCII (␈\) в Юникоде изображается комбинируемым символом «обратное косое перечёркивание» « ⃥» U+20E5 (&#8421;)
  17. в качестве гарантированно надстрочного следует использовать последовательность «неразрывный пробел, комбинируемый циркумфлекс» « ̂» U+00A0 U+0302 (&nbsp;&#770;) или занимающий позицию циркумфлекс «ˆ» U+02C6 &circ; (&#710;)
  18. наложение карета через возврат на шаг в ASCII (␈^) в Юникоде изображается комбинируемым символом «циркумфлекс» « ̂» U+0302 (&#770;)
  19. наложение подчёркивания через возврат на шаг в ASCII (␈_) в Юникоде изображается комбинируемым символом «макрон снизу» (без стыковки по горизонтали) « ̱» U+0331 (&#817;) или «подчёркивание» (со стыковкой по горизонтали) « ̲» U+0332 (&#818;)
  20. наложение грейва через возврат на шаг в ASCII (␈`) в Юникоде изображается комбинируемым символом «грейв» « ̀» U+0300 (&#768;)
  21. полужирные начертания посредством наложение буквы на себя через возврат на шаг в ASCII (a␈a → a) в Юникоде изображаются символами диапазона «𝐚» U+1D41A (&#119834;)—«𝐳» U+1D433 (&#119859;)
  22. наложение вертикальной черты через возврат на шаг в ASCII (␈|) в Юникоде изображается комбинируемым символом «вертикальная черта» « ⃒» U+20D2 (&#8402;) или «короткая вертикальная черта» « ⃓» U+20D3 (&#8403;)
  23. в качестве надстрочной следует использовать последовательность «неразрывный пробел, комбинируемая тильда» « ̃» U+00A0 U+0303 (&nbsp;&#771;) или малую тильду ˜ U+02DC (&#732;), в качестве среднестрочной — математическую операцию «∼» U+223C &sim; (&#8764;)
  24. наложение тильды через возврат на шаг в ASCII (␈~) в Юникоде изображается комбинируемым символом «тильда» « ̃» U+0303 (&#771;)

Ссылки