文字参照

文字参照(もじさんしょう、: character reference)とはHTMLなどのSGML文書においては、直接記述できない文字記号マークアップで使われる、半角不等号<」や「>」など)を表記する際に用いられる方法である。SGML構成素のひとつとして定義されており、文書文字集合中の文字を参照する為の手段を提供する。HTMLにおける文字参照には、表記方法により数値文字参照[注釈 1]文字実体参照[注釈 2]の二種が存在する。XMLにおいては、HTMLにおける「数値文字参照」を「文字参照」と呼ぶ。なおHTMLにおける「文字実体参照」は、XMLでは実体参照[注釈 3]と呼び区別する。

数値文字参照(文字参照)

[編集]

数値文字参照は、10進数もしくは16進数によって文書文字集合における該当文字をISO 10646の文字番号で指定する方法である。以下はその例示であり、同一の8分音符記号「♪」を示している。16進数による指定は元々のSGMLの規格には存在しなかったが、HTML 4.0で規格化された。16進数表記の際には大文字小文字の区別がない。

  • &#9834;」(10進数による指定)
  • &#x266A;」(16進数による指定)

文字実体参照(実体参照)

[編集]

文字実体参照は、特定の文字列(名前のようなもの)によって文書文字集合における該当文字を指定する方法である。

文字実体参照の方が数値文字参照に比べて直感的に文字参照を行えるため、一般的に用いられる事が多い。しかしながら、文字実体参照として定義されていない特殊な文字(例えば前述の8分音符「♪」)については、数値文字参照を行うより他に参照方法がない。

HTMLで使用可能な文字参照

[編集]

以下は、HTMLマークアップにおいて頻繁に用いられると思われる文字実体参照である。

文字 文字実体参照 説明
  &nbsp; ノーブレークスペース - 折り返しを起こさない(ホワイトスペースではない)空白
< &lt; 小なり記号(半角)
> &gt; 大なり記号(半角)
& &amp; アンパサンド(半角)
" &quot; 二重引用符(半角)

数値文字参照の16進数による表現では大文字小文字の区別がなかったのに対し、文字実体参照では大文字小文字の区別が存在する。よって、以下のような大文字小文字の違いによる文字実体参照の差異が存在する場合がある。

  • &auml; (ä) 小文字 a(ウムラウト付)
  • &Auml; (Ä) 大文字 A(ウムラウト付)

XMLで使用可能な実体参照

[編集]

XMLの仕様においては、定義済み実体として可能な文字は次に示す5種類のみである。これ以外の実体参照は、別に指定したDTDを使用しない限りは使用できない。

定義済み実体 表示 使用用途(他の用途に使っても構わない)
&amp; & コメントやCDATAセクションの内部に書く場合を除いて、すべてこのように表記する。(属性値も含む[1]
&lt; < 上と同じ。(タグとして書く場合はもちろん除く。)
&gt; > SGMLとの互換性のために、要素の内容でテキスト"]]>"を表記する時に"]]&gt;"のように使う。(CDATAセクションの内部で使用するわけではないことに注意)
&quot; " 属性値ではこの表記を行う(<タグ 属性="ここで使用する">〜</タグ>)
&apos; ' 属性値ではこの表記を行う(<タグ 属性='ここで使用する'>〜</タグ>)

文字参照の一覧表

[編集]

ISO-8859-1文字

[編集]
文字 16進数 10進数 文字実体参照 説明
  00A0 0160 &nbsp; ノーブレークスペース
¡ 00A1 0161 &iexcl; 逆立ち感嘆符
¢ 00A2 0162 &cent; セント記号
£ 00A3 0163 &pound; 英貨ポンド記号
¤ 00A4 0164 &curren; 一般通貨記号
¥ 00A5 0165 &yen; 円記号
¦ 00A6 0166 &brvbar; 縦破線
§ 00A7 0167 &sect; 節記号
¨ 00A8 0168 &uml; ウムラウト
© 00A9 0169 &copy; 著作権記号
ª 00AA 0170 &ordf; 順序の指示(女性形)
« 00AB 0171 &laquo; 左角引用符
¬ 00AC 0172 &not; 否定記号
­ 00AD 0173 &shy; ソフトハイフン
® 00AE 0174 &reg; 登録商標
¯ 00AF 0175 &macr; マクロン
° 00B0 0176 &deg; 度記号
± 00B1 0177 &plusmn; プラスマイナス記号
² 00B2 0178 &sup2; 上付き数字の2、平方
³ 00B3 0179 &sup3; 上付き数字の3、立方
´ 00B4 0180 &acute; 鋭アクセント
µ 00B5 0181 &micro; ミクロン記号
00B6 0182 &para; 段落記号
· 00B7 0183 &middot; 中黒
¸ 00B8 0184 &cedil; セディーユ
¹ 00B9 0185 &sup1; 上付き数字の1
º 00BA 0186 &ordm; 順序の指示(男性形)
» 00BB 0187 &raquo; 右角引用符
¼ 00BC 0188 &frac14; 分数1/4
½ 00BD 0189 &frac12; 分数1/2
¾ 00BE 0190 &frac34; 分数3/4
¿ 00BF 0191 &iquest; 逆立ち疑問符
À 00C0 0192 &Agrave; 大文字 A(重アクセント記号付)
Á 00C1 0193 &Aacute; 大文字 A(鋭アクセント付)
 00C2 0194 &Acirc; 大文字 A(曲折アクセント記号付)
à 00C3 0195 &Atilde; 大文字 A(ティルデ付)
Ä 00C4 0196 &Auml; 大文字 A(ウムラウト付)
Å 00C5 0197 &Aring; 大文字 A(付)
Æ 00C6 0198 &AElig; 大文字 AE 二重母音(合字
Ç 00C7 0199 &Ccedil; 大文字 C(セディーユ付)
È 00C8 0200 &Egrave; 大文字 E(重アクセント記号付)
É 00C9 0201 &Eacute; 大文字 E(鋭アクセント記号付)
Ê 00CA 0202 &Ecirc; 大文字 E(曲折アクセント付)
Ë 00CB 0203 &Euml; 大文字 E(ウムラウト付)
Ì 00CC 0204 &Igrave; 大文字 I(重アクセント記号付)
Í 00CD 0205 &Iacute; 大文字 I(鋭アクセント記号付)
Î 00CE 0206 &Icirc; 大文字 I(曲折アクセント付)
Ï 00CF 0207 &Iuml; 大文字 I(ウムラウト付)
Ð 00D0 0208 &ETH; 大文字エズ
Ñ 00D1 0209 &Ntilde; 大文字 N(ティルデ付)
Ò 00D2 0210 &Ograve; 大文字 O(重アクセント記号付)
Ó 00D3 0211 &Oacute; 大文字 O(鋭アクセント記号付)
Ô 00D4 0212 &Ocirc; 大文字 O(曲折アクセント記号付)
Õ 00D5 0213 &Otilde; 大文字 O (ティルデ付)
Ö 00D6 0214 &Ouml; 大文字 O(ウムラウト付)
× 00D7 0215 &times; 乗算記号
Ø 00D8 0216 &Oslash; 大文字 O(スラッシュ付)
Ù 00D9 0217 &Ugrave; 大文字 U(重アクセント記号付)
Ú 00DA 0218 &Uacute; 大文字 U(鋭アクセント記号付)
Û 00DB 0219 &Ucirc; 大文字 U(曲折アクセント記号付)
Ü 00DC 0220 &Uuml; 大文字 U(ウムラウト付)
Ý 00DD 0221 &Yacute; 大文字 Y(鋭アクセント記号付)
Þ 00DE 0222 &THORN; 大文字ソーン
ß 00DF 0223 &szlig; ドイツ語の小文字鋭 s(sz 合字)
à 00E0 0224 &agrave; 小文字 a(重アクセント記号付)
á 00E1 0225 &aacute; 小文字 a(鋭アクセント記号付)
â 00E2 0226 &acirc; 小文字 a(曲折アクセント記号付)
ã 00E3 0227 &atilde; 小文字 a(ティルデ付)
ä 00E4 0228 &auml; 小文字 a(ウムラウト付)
å 00E5 0229 &aring; 小文字 a(輪付)
æ 00E6 0230 &aelig; 小文字 ae 二重母音(合字)
ç 00E7 0231 &ccedil; 小文字 c(セディーユ付)
è 00E8 0232 &egrave; 小文字 e(重アクセント記号付)
é 00E9 0233 &eacute; 小文字 e(鋭アクセント記号付)
ê 00EA 0234 &ecirc; 小文字 e(曲折アクセント記号付)
ë 00EB 0235 &euml; 小文字 e(ウムラウト付)
ì 00EC 0236 &igrave; 小文字 i(重アクセント記号付)
í 00ED 0237 &iacute; 小文字 i(鋭アクセント記号付)
î 00EE 0238 &icirc; 小文字 i(曲折アクセント記号付)
ï 00EF 0239 &iuml; 小文字 i(ウムラウト付)
ð 00F0 0240 &eth; 小文字エズ
ñ 00F1 0241 &ntilde; 小文字 n(ティルデ付)
ò 00F2 0242 &ograve; 小文字 o(重アクセント記号付)
ó 00F3 0243 &oacute; 小文字 o(鋭アクセント記号付)
ô 00F4 0244 &ocirc; 小文字 o(曲折アクセント記号付)
õ 00F5 0245 &otilde; 小文字 o(ティルデ付)
ö 00F6 0246 &ouml; 小文字 o(ウムラウト付)
÷ 00F7 0247 &divide; 除算記号
ø 00F8 0248 &oslash; 小文字 o(斜線付)
ù 00F9 0249 &ugrave; 小文字 u(重アクセント記号付)
ú 00FA 0250 &uacute; 小文字 u(鋭アクセント記号付)
û 00FB 0251 &ucirc; 小文字 u(曲折アクセント記号付)
ü 00FC 0252 &uuml; 小文字 u(ウムラウト付)
ý 00FD 0253 &yacute; 小文字 y(鋭アクセント記号付)
þ 00FE 0254 &thorn; 小文字ソーン
ÿ 00FF 0255 &yuml;小文字 y(ウムラウト付)

Windows標準コードページ1252集合に含まれるが ISO-8859-1 に含まれない文字には以下の文字がある。

文字 文字実体参照 説明
&euro; ユーロ
&dagger; ダガー, 短剣符
&Dagger; ダブルダガー
&bull; ブリット, ビュレット
&trade; 商標
&permil; パーミル
タイプセット・スタイル句読法(以下を参照)

タイプセット・スタイル句読法

[編集]

見やすくするためアルファベット「O」の隣に文字を配置している。

文字 文字実体参照 説明
‘O &lsquo; left single quote
O’ &rsquo; right single quote
O‚ &sbquo; single low-9 quote
“O &ldquo; left double quote
O” &rdquo; right double quote
O„ &bdquo; double low-9 quote
—O &mdash; em dash
–O &ndash; en dash

注釈

[編集]
  1. ^ : numeric character reference
  2. ^ : character entity reference
  3. ^ : entity reference

出典

[編集]

関連項目

[編集]

外部リンク

[編集]