ISO 8859-1
ISO/IEC 8859-1 (также известная как ISO 8859-1 и Latin-1) — кодовая страница, предназначенная для западноевропейских языков; она базируется на символьном наборе популярных в прошлом терминалов VT220. Кодовые позиции 0—31 (0x0—0x1F) и 127—159 (0x7F—0x9F) не определены. По образцу ISO 8859-1 сделаны все остальные кодировки серии ISO 8859.
ISO-8859-1 — кодировка, зарегистрированная IANA в 1992 г. В отличие от ISO/IEC 8859-1, кодовые позиции 0—31 и 127—159 здесь заполнены управляющими символами (большинство из которых используется весьма редко). В HTML ISO-8859-1 является кодировкой по умолчанию (в XHTML, однако, кодировкой по умолчанию является UTF-8).
IANA разрешает использовать следующие варианты названия: ISO_8859-1:1987, ISO_8859-1, ISO-8859-1, iso-ir-100, sISOLatin1, latin1, l1, IBM819, CP819.
В Юникоде первые 256 кодовых позиций совпадают с ISO-8859-1.
В Microsoft Windows для западноевропейских языков используется кодировка Windows-1252, которая отличается от ISO-8859-1 тем, что позиции 128—159 (0x80—0x9F) здесь заняты разными полезными типографскими символами. Большинство браузеров не различает ISO-8859-1 и Windows-1252 — фактически, и в том, и в другом случае они отображают текст как Windows-1252.
Такая путаница между этими двумя кодировками привела к тому, что многие программы, генерирующие файлы HTML, ошибочно обозначали символы их кодами из Windows−1252 вместо кодов Юникода (исходя из того, что номер символа в ISO-8859-1 равен его номеру в Юникоде): например, тире (—) обозначалось —
вместо правильного —
, многоточие обозначалось …
вместо правильного …
и т. д.; из-за распространённости этого явления современные браузеры продолжают показывать, например, —
как тире, хотя на самом деле —
— это управляющий символ «end of guarded area», применение которого в HTML бессмысленно.
В проекте стандарта HTML 5 предписывается показывать ISO-8859-1 как Windows-1252.[1]
Таблицы
[править | править код]Нижняя часть (0—127) таблиц кодировки не показана, поскольку полностью соответствует обычному ASCII. Числа под буквами обозначают шестнадцатеричный код буквы в Юникоде.
ISO-8859-1
[править | править код].0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8. | PAD 80 | HOP 81 | BPH 82 | NBH 83 | IND 84 | NEL 85 | SSA 86 | ESA 87 | HTS 88 | HTJ 89 | VTS 8A | PLD 8B | PLU 8C | RI 8D | SS2 8E | SS3 8F |
9. | DCS 90 | PU1 91 | PU2 92 | STS 93 | CCH 94 | MW 95 | SPA 96 | EPA 97 | SOS 98 | SGCI 99 | SCI 9A | CSI 9B | ST 9C | OSC 9D | PM 9E | APC 9F |
A. | A0 | ¡ A1 | ¢ A2 | £ A3 | ¤ A4 | ¥ A5 | ¦ A6 | § A7 | ¨ A8 | © A9 | ª AA | « AB | ¬ AC | AD | ® AE | ¯ AF |
B. | ° B0 | ± B1 | ² B2 | ³ B3 | ´ B4 | µ B5 | ¶ B6 | · B7 | ¸ B8 | ¹ B9 | º BA | » BB | ¼ BC | ½ BD | ¾ BE | ¿ BF |
C. | À C0 | Á C1 | Â C2 | Ã C3 | Ä C4 | Å C5 | Æ C6 | Ç C7 | È C8 | É C9 | Ê CA | Ë CB | Ì CC | Í CD | Î CE | Ï CF |
D. | Ð D0 | Ñ D1 | Ò D2 | Ó D3 | Ô D4 | Õ D5 | Ö D6 | × D7 | Ø D8 | Ù D9 | Ú DA | Û DB | Ü DC | Ý DD | Þ DE | ß DF |
E. | à E0 | á E1 | â E2 | ã E3 | ä E4 | å E5 | æ E6 | ç E7 | è E8 | é E9 | ê EA | ë EB | ì EC | í ED | î EE | ï EF |
F. | ð F0 | ñ F1 | ò F2 | ó F3 | ô F4 | õ F5 | ö F6 | ÷ F7 | ø F8 | ù F9 | ú FA | û FB | ü FC | ý FD | þ FE | ÿ FF |
Интересно расположение символов × и ÷ посреди букв: первоначально там планировалось разместить лигатуру Œœ, но в конечном итоге было решено, что она не нужна, и освободившиеся два места были заполнены небуквенными символами.[2]
Windows−1252
[править | править код]В первоначальной версии этой кодировки отсутствовали символы: € (0x80), ˆ (0x88), ˜ (0x98), Ž (0x8E), ž (0x9E).
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8. | € 20AC | ‚ 201A | ƒ 192 | „ 201E | … 2026 | † 2020 | ‡ 2021 | ˆ 2C6 | ‰ 2030 | Š 160 | ‹ 2039 | Œ 152 | Ž 17D | |||
9. | ‘ 2018 | ’ 2019 | “ 201C | ” 201D | • 2022 | – 2013 | — 2014 | ˜ 2DC | ™ 2122 | š 161 | › 203A | œ 153 | ž 17E | Ÿ 178 | ||
A. | A0 | ¡ A1 | ¢ A2 | £ A3 | ¤ A4 | ¥ A5 | ¦ A6 | § A7 | ¨ A8 | © A9 | ª AA | « AB | ¬ AC | AD | ® AE | ¯ AF |
B. | ° B0 | ± B1 | ² B2 | ³ B3 | ´ B4 | µ B5 | ¶ B6 | · B7 | ¸ B8 | ¹ B9 | º BA | » BB | ¼ BC | ½ BD | ¾ BE | ¿ BF |
C. | À C0 | Á C1 | Â C2 | Ã C3 | Ä C4 | Å C5 | Æ C6 | Ç C7 | È C8 | É C9 | Ê CA | Ë CB | Ì CC | Í CD | Î CE | Ï CF |
D. | Ð D0 | Ñ D1 | Ò D2 | Ó D3 | Ô D4 | Õ D5 | Ö D6 | × D7 | Ø D8 | Ù D9 | Ú DA | Û DB | Ü DC | Ý DD | Þ DE | ß DF |
E. | à E0 | á E1 | â E2 | ã E3 | ä E4 | å E5 | æ E6 | ç E7 | è E8 | é E9 | ê EA | ë EB | ì EC | í ED | î EE | ï EF |
F. | ð F0 | ñ F1 | ò F2 | ó F3 | ô F4 | õ F5 | ö F6 | ÷ F7 | ø F8 | ù F9 | ú FA | û FB | ü FC | ý FD | þ FE | ÿ FF |
Примечания
[править | править код]- ↑ Проект стандарта на сайте www.w3.org . Дата обращения: 15 января 2010. Архивировано 6 января 2010 года.
- ↑ Disposition of comments on ballot results SC2 N 3005 — ISO/IEC 8859 Part 15 . Дата обращения: 25 июня 2010. Архивировано 19 июня 2010 года.