XMLのルール
XMLは「厳しめ」なので、機械処理に向きます。
整形式(Well-formed)ルール
- 開始タグと終了タグが対応している
- 入れ子が正しい(交差しない)
- ルート要素が必ず1つ
- 属性値はクォートで囲む
- 特殊文字はエスケープ(< > & " ')
コツ: “とりあえず整形式” → 必要なら XSD/DTD で妥当性へ。
名前空間(Namespace)
似た名前の要素が混ざると衝突するので、xmlns を使って区別します。
<rss xmlns:content="http://purl.org/rss/1.0/modules/content/">
...
</rss>
Webサービス連携や規格文書のXMLで頻出。
XML宣言と文字コード
<?xml version="1.0" encoding="UTF-8"?>
実ファイルがUTF-8なら宣言もUTF-8に合わせるのが基本です。