文字参照
文字参照(もじさんしょう、英: character reference)とはHTMLなどのSGML文書においては、直接記述できない文字や記号(マークアップで使われる、半角の不等号「<
」や「>
」など)を表記する際に用いられる方法である。SGML構成素のひとつとして定義されており、文書文字集合中の文字を参照する為の手段を提供する。HTMLにおける文字参照には、表記方法により数値文字参照[注釈 1]と文字実体参照[注釈 2]の二種が存在する。XMLにおいては、HTMLにおける「数値文字参照」を「文字参照」と呼ぶ。なおHTMLにおける「文字実体参照」は、XMLでは実体参照[注釈 3]と呼び区別する。
数値文字参照(文字参照)
[編集]数値文字参照は、10進数もしくは16進数によって文書文字集合における該当文字をISO 10646の文字番号で指定する方法である。以下はその例示であり、同一の8分音符記号「♪」を示している。16進数による指定は元々のSGMLの規格には存在しなかったが、HTML 4.0で規格化された。16進数表記の際には大文字小文字の区別がない。
- 「
♪
」(10進数による指定) - 「
♪
」(16進数による指定)
文字実体参照(実体参照)
[編集]文字実体参照は、特定の文字列(名前のようなもの)によって文書文字集合における該当文字を指定する方法である。
文字実体参照の方が数値文字参照に比べて直感的に文字参照を行えるため、一般的に用いられる事が多い。しかしながら、文字実体参照として定義されていない特殊な文字(例えば前述の8分音符「♪」)については、数値文字参照を行うより他に参照方法がない。
HTMLで使用可能な文字参照
[編集]以下は、HTMLマークアップにおいて頻繁に用いられると思われる文字実体参照である。
文字 | 文字実体参照 | 説明 |
---|---|---|
| | ノーブレークスペース - 折り返しを起こさない(ホワイトスペースではない)空白 |
< | < | 小なり記号(半角) |
> | > | 大なり記号(半角) |
& | & | アンパサンド(半角) |
" | " | 二重引用符(半角) |
数値文字参照の16進数による表現では大文字と小文字の区別がなかったのに対し、文字実体参照では大文字小文字の区別が存在する。よって、以下のような大文字小文字の違いによる文字実体参照の差異が存在する場合がある。
- ä (
ä
) 小文字 a(ウムラウト付) - Ä (
Ä
) 大文字 A(ウムラウト付)
XMLで使用可能な実体参照
[編集]XMLの仕様においては、定義済み実体として可能な文字は次に示す5種類のみである。これ以外の実体参照は、別に指定したDTDを使用しない限りは使用できない。
定義済み実体 | 表示 | 使用用途(他の用途に使っても構わない) |
---|---|---|
& | & | コメントやCDATAセクションの内部に書く場合を除いて、すべてこのように表記する。(属性値も含む[1]) |
< | < | 上と同じ。(タグとして書く場合はもちろん除く。) |
> | > | SGMLとの互換性のために、要素の内容でテキスト"]]>"を表記する時に"]]>"のように使う。(CDATAセクションの内部で使用するわけではないことに注意) |
" | " | 属性値ではこの表記を行う(<タグ 属性="ここで使用する">〜</タグ>) |
' | ' | 属性値ではこの表記を行う(<タグ 属性='ここで使用する'>〜</タグ>) |
文字参照の一覧表
[編集]ISO-8859-1文字
[編集]文字 | 16進数 | 10進数 | 文字実体参照 | 説明 |
---|---|---|---|---|
00A0 | 0160 | | ノーブレークスペース | |
¡ | 00A1 | 0161 | ¡ | 逆立ち感嘆符 |
¢ | 00A2 | 0162 | ¢ | セント記号 |
£ | 00A3 | 0163 | £ | 英貨ポンド記号 |
¤ | 00A4 | 0164 | ¤ | 一般通貨記号 |
¥ | 00A5 | 0165 | ¥ | 円記号 |
¦ | 00A6 | 0166 | ¦ | 縦破線 |
§ | 00A7 | 0167 | § | 節記号 |
¨ | 00A8 | 0168 | ¨ | ウムラウト |
© | 00A9 | 0169 | © | 著作権記号 |
ª | 00AA | 0170 | ª | 順序の指示(女性形) |
« | 00AB | 0171 | « | 左角引用符 |
¬ | 00AC | 0172 | ¬ | 否定記号 |
| 00AD | 0173 | ­ | ソフトハイフン |
® | 00AE | 0174 | ® | 登録商標 |
¯ | 00AF | 0175 | ¯ | マクロン |
° | 00B0 | 0176 | ° | 度記号 |
± | 00B1 | 0177 | ± | プラスマイナス記号 |
² | 00B2 | 0178 | ² | 上付き数字の2、平方 |
³ | 00B3 | 0179 | ³ | 上付き数字の3、立方 |
´ | 00B4 | 0180 | ´ | 鋭アクセント |
µ | 00B5 | 0181 | µ | ミクロン記号 |
¶ | 00B6 | 0182 | ¶ | 段落記号 |
· | 00B7 | 0183 | · | 中黒 |
¸ | 00B8 | 0184 | ¸ | セディーユ |
¹ | 00B9 | 0185 | ¹ | 上付き数字の1 |
º | 00BA | 0186 | º | 順序の指示(男性形) |
» | 00BB | 0187 | » | 右角引用符 |
¼ | 00BC | 0188 | ¼ | 分数1/4 |
½ | 00BD | 0189 | ½ | 分数1/2 |
¾ | 00BE | 0190 | ¾ | 分数3/4 |
¿ | 00BF | 0191 | ¿ | 逆立ち疑問符 |
À | 00C0 | 0192 | À | 大文字 A(重アクセント記号付) |
Á | 00C1 | 0193 | Á | 大文字 A(鋭アクセント付) |
 | 00C2 | 0194 |  | 大文字 A(曲折アクセント記号付) |
à | 00C3 | 0195 | à | 大文字 A(ティルデ付) |
Ä | 00C4 | 0196 | Ä | 大文字 A(ウムラウト付) |
Å | 00C5 | 0197 | Å | 大文字 A(輪付) |
Æ | 00C6 | 0198 | Æ | 大文字 AE 二重母音(合字) |
Ç | 00C7 | 0199 | Ç | 大文字 C(セディーユ付) |
È | 00C8 | 0200 | È | 大文字 E(重アクセント記号付) |
É | 00C9 | 0201 | É | 大文字 E(鋭アクセント記号付) |
Ê | 00CA | 0202 | Ê | 大文字 E(曲折アクセント付) |
Ë | 00CB | 0203 | Ë | 大文字 E(ウムラウト付) |
Ì | 00CC | 0204 | Ì | 大文字 I(重アクセント記号付) |
Í | 00CD | 0205 | Í | 大文字 I(鋭アクセント記号付) |
Î | 00CE | 0206 | Î | 大文字 I(曲折アクセント付) |
Ï | 00CF | 0207 | Ï | 大文字 I(ウムラウト付) |
Ð | 00D0 | 0208 | Ð | 大文字エズ |
Ñ | 00D1 | 0209 | Ñ | 大文字 N(ティルデ付) |
Ò | 00D2 | 0210 | Ò | 大文字 O(重アクセント記号付) |
Ó | 00D3 | 0211 | Ó | 大文字 O(鋭アクセント記号付) |
Ô | 00D4 | 0212 | Ô | 大文字 O(曲折アクセント記号付) |
Õ | 00D5 | 0213 | Õ | 大文字 O (ティルデ付) |
Ö | 00D6 | 0214 | Ö | 大文字 O(ウムラウト付) |
× | 00D7 | 0215 | × | 乗算記号 |
Ø | 00D8 | 0216 | Ø | 大文字 O(スラッシュ付) |
Ù | 00D9 | 0217 | Ù | 大文字 U(重アクセント記号付) |
Ú | 00DA | 0218 | Ú | 大文字 U(鋭アクセント記号付) |
Û | 00DB | 0219 | Û | 大文字 U(曲折アクセント記号付) |
Ü | 00DC | 0220 | Ü | 大文字 U(ウムラウト付) |
Ý | 00DD | 0221 | Ý | 大文字 Y(鋭アクセント記号付) |
Þ | 00DE | 0222 | Þ | 大文字ソーン |
ß | 00DF | 0223 | ß | ドイツ語の小文字鋭 s(sz 合字) |
à | 00E0 | 0224 | à | 小文字 a(重アクセント記号付) |
á | 00E1 | 0225 | á | 小文字 a(鋭アクセント記号付) |
â | 00E2 | 0226 | â | 小文字 a(曲折アクセント記号付) |
ã | 00E3 | 0227 | ã | 小文字 a(ティルデ付) |
ä | 00E4 | 0228 | ä | 小文字 a(ウムラウト付) |
å | 00E5 | 0229 | å | 小文字 a(輪付) |
æ | 00E6 | 0230 | æ | 小文字 ae 二重母音(合字) |
ç | 00E7 | 0231 | ç | 小文字 c(セディーユ付) |
è | 00E8 | 0232 | è | 小文字 e(重アクセント記号付) |
é | 00E9 | 0233 | é | 小文字 e(鋭アクセント記号付) |
ê | 00EA | 0234 | ê | 小文字 e(曲折アクセント記号付) |
ë | 00EB | 0235 | ë | 小文字 e(ウムラウト付) |
ì | 00EC | 0236 | ì | 小文字 i(重アクセント記号付) |
í | 00ED | 0237 | í | 小文字 i(鋭アクセント記号付) |
î | 00EE | 0238 | î | 小文字 i(曲折アクセント記号付) |
ï | 00EF | 0239 | ï | 小文字 i(ウムラウト付) |
ð | 00F0 | 0240 | ð | 小文字エズ |
ñ | 00F1 | 0241 | ñ | 小文字 n(ティルデ付) |
ò | 00F2 | 0242 | ò | 小文字 o(重アクセント記号付) |
ó | 00F3 | 0243 | ó | 小文字 o(鋭アクセント記号付) |
ô | 00F4 | 0244 | ô | 小文字 o(曲折アクセント記号付) |
õ | 00F5 | 0245 | õ | 小文字 o(ティルデ付) |
ö | 00F6 | 0246 | ö | 小文字 o(ウムラウト付) |
÷ | 00F7 | 0247 | ÷ | 除算記号 |
ø | 00F8 | 0248 | ø | 小文字 o(斜線付) |
ù | 00F9 | 0249 | ù | 小文字 u(重アクセント記号付) |
ú | 00FA | 0250 | ú | 小文字 u(鋭アクセント記号付) |
û | 00FB | 0251 | û | 小文字 u(曲折アクセント記号付) |
ü | 00FC | 0252 | ü | 小文字 u(ウムラウト付) |
ý | 00FD | 0253 | ý | 小文字 y(鋭アクセント記号付) |
þ | 00FE | 0254 | þ | 小文字ソーン |
ÿ | 00FF | 0255 | ÿ | 小文字 y(ウムラウト付) |
Windows標準コードページ1252集合に含まれるが ISO-8859-1 に含まれない文字には以下の文字がある。
文字 | 文字実体参照 | 説明 |
---|---|---|
€ | € | ユーロ |
† | † | ダガー, 短剣符 |
‡ | ‡ | ダブルダガー |
• | • | ブリット, ビュレット |
™ | ™ | 商標 |
‰ | ‰ | パーミル |
タイプセット・スタイル句読法(以下を参照) |
タイプセット・スタイル句読法
[編集]見やすくするためアルファベット「O」の隣に文字を配置している。
文字 | 文字実体参照 | 説明 |
---|---|---|
‘O | ‘ | left single quote |
O’ | ’ | right single quote |
O‚ | ‚ | single low-9 quote |
“O | “ | left double quote |
O” | ” | right double quote |
O„ | „ | double low-9 quote |
—O | — | em dash |
–O | – | en dash |
注釈
[編集]出典
[編集]関連項目
[編集]- Extensible Markup Language#実体参照 - XMLにおける実体参照についてはこちらを参照。
- SGML実体
外部リンク
[編集]- World Wide Web Consortium(原文は英語、邦訳は有志による日本語訳)
- 5.3 Character references - HTML 4.01(邦訳)HTML 4.01勧告の文字参照の説明。
- 24 Character entity references in HTML 4 - HTML 4.01(邦訳)HTML 4.01勧告の文字実体参照の定義。
- 4.1 Character and Entity References - XML 1.0(邦訳)XML 1.0勧告の文字参照及び実体参照の定義。