gorogoronyan FC2

HTML を作成するときの細かい注意点

追記 2023

下の記事は 2014年頃の記事でかなり古い話です。 現在では気にしない話ばかりです。

要点

現在の多くのテキストファイルは下を使用します。

  1. 文字コードは utf-8 のユニコードで BOM なし
  2. 改行コードは LF (JavaScript の \n)

まれに古代か平成レトロの昔話でシフト JIS の文字コードや \r\n の改行コードが必要になる場合もありますが、通常使いません。 昔話のトラブルに遭遇したら思い出してください。

HTML ファイルを保存するときの文字コード

ホームページのサンプル HTML をメモ帳にコピー&ペーストして ファイルを保存するときに、HTML の 文字コード指定が utf-8 になっている場合は、utf-8 形式で保存します。
Windows のメモ帳で HTML を utf-8 で保存する方法

誤った文字コードで HTML ファイルを保存すると、 ブラウザで表示したときに文字化けするのですぐにわかります。

HTML ファイルの文字コードの誤りによる文字化けの例
HTML ファイルの文字コードの誤りによる文字化けの例

HTML の改行コード

Windows のメモ帳で保存したテキストファイルは、 改行コード が CR LF になっています。 HTML では細かいことを言うと改行コードに LF が推奨されています。 こちらは初歩的な話では気にする必要はありません。
HTML: 改行文字

Windows のメモ帳で保存したテキストファイルをバイナリエディタで表示した例
Windows のメモ帳で保存したテキストファイルをバイナリエディタで表示した例
メモ帳で保存した場合、改行コードは 0x0D (CR), 0x0A(LF) になっている。

utf-8 テキストファイルの BOM

HTML では BOM を付けない方が無難です。 Windows10 のメモ帳では初期設定で BOMなしの utf-8 テキストで保存するので、気にする必要はありません。

Windows7 までのメモ帳で保存した utf-8 のテキストファイルには、 BOM (Byte Order Mark) と呼ばれる特殊なデータが先頭についていました。

バイナリエディタで BOM付きの utf-8テキストファイルを表示した例
バイナリエディタで BOM付きの utf-8テキストファイルを表示した例
メモ帳やテキストエディタには表示されないけど、先頭に EF BB BF の3バイトの識別データがついている。

BOM も初歩的な話では気にする必要はありませんが、 HTML 作成ツールやプログラミング言語のツールを使用するときに注意が必要です。 BOM が付いているとエラーになるツールもあります。 つまらないトラブルの原因になるので BOM は使いません。

その他

他のテキストエディタを使った場合でも 上ような文字コードや改行コードや BOM などの話が出てきます。 上の話が原因で細かいトラブルが起こることがあるので、 そういうときに思い出してください。

関連

inserted by FC2 system