ホーム > HTMLサンプル

2009/12/26-2016/03/18

HTMLもXML形式で書いておくと便利かも

目次
  1. いろいろ
  2. &xxx; の文字に注意
  3. JavaScript のコメントアウト
  4. その他

いろいろ

XHTML ではない HTML を書く場合でも、XML フォーマットを満たすように書いておくと 後々便利かもしれません。XML フォーマットはガチガチの規格になっている分、 書き誤りのチェックや HTML 内のテキストの書き換えなどの操作が楽になります。

XML データを編集するツールはたくさんあるので、大量のHTMLファイルの title を書き換えるとか、 特定のタグの情報を抽出したり、置換したり、追加したりするといった処理がとても容易になります。 XML フォーマットを満たさない HTML だと、 この種の抽出処理や書き換え作業はとても面倒になるかトリッキーで危ないものになります。 このあたりは、sed, awk などを検索して調べてみてください・・・これが遠い昔 (1980年代~1990年近辺)の道具です。 めまいがしたら(?)もうちょっとマシな道具があります・・・それが XML(こちらは2000年代)です。

&xxx; の文字に注意

HTMLの XML 化にも難点があって、HTML で使う   © などの表記(エンティティといいます)は XML には定義されていません。 このような文字を含む HTML やその一部を XML とみなして読むと & の部分で XML パースエラーが出ます。

◎ XML で定義されているエンティティ
  HTML を XML として読ませても問題ない文字。

" " "
&lt;   &#60; <
&gt;   &#62; >
&amp;  &#38; &
&#数字;  各種文字コード

◎ XML の定義にはないエンティティ
  HTML を XML として読ませるとエラーになる文字の例。
  &#数字; の表記ならエラーにならない。

           10進数   16進数
   &nbsp;  &#160;   &#xA0;  No-Break Space, ノーブレークスペース
©  &copy;  &#169;   &#xA9;  コピーライト
®  &reg;   &#174;   &#xAE;  登録商標

参考リンク: Wikipedia:文字参照の一覧

JavaScript のコメントアウト

HTML の中に JavaScript コードがあり、< や > などの記号が使われていると、 XML とみなしてパースするとエラーになります。 JavaScript の部分は XML から見てコメントに見えるようにします。

<script>
//<![CDATA[

// javascript を書く

//]]>
</script>

//<![CDATA[、//]]> が XML 特有の表記で、この部分はコメントになり無視されます。 HTML でいう <!-- コメント --> に相当します。

その他

XHTMLチェックツール
XHTML を DTD 検証つきで厳密にチェックしたり、XML の書式のチェックをしたりするツール。 Windows .NET のプログラム。Windows Vista以降ならそのまま動きます。
目次
gorogoronyan@gmail.com
inserted by FC2 system