sitemapファイルを準備することで、検索エンジンがWebページを効率よくクロールします。
ここでは、「sitemap.xml」ファイルの書き方を示します。
sitemap.xml サンプル
<?xml version="1.0" encoding="UTF-8" ?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9" >
<url>
<loc>http://www.sample.com/</loc>
<priority>1.0</priority>
<changefreq>always</changefreq>
<lastmod>2008-01-14T12:34:56Z</lastmod>
</url>
<url>
<loc>http://www.sample.com/page.html</loc>
<priority>0.5</priority>
<changefreq>weekly</changefreq>
<lastmod>2007-12-24</lastmod>
</url>
</urlset>
解説
<?xml version="1.0" encoding="UTF-8" ?>
<必須> sitemap.xml ファイルは文字コード「UTF-8」で作成しなければなりません。
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9" > ~ </urlset>
<必須> バージョン 0.9 を使うことで、Google、Yahoo、MSN の検索エンジンが理解してくれます。
<url> ~ </url>
<必須> 必要なページ分繰り返します。
サイト上の全てのページを記述しなければならないわけではありません。
検索エンジンにインデックス化させるつもりのページを記述します。
<loc> ~ </loc>
<必須> URLを記述
対象となるURLを記述。2,048文字以下というルールとなっています。
<priority> ~ </priority>
<任意> 優先度を記述
0.0(低)~1.0(高) / 0.5 が標準
sitemap上に記述したURLの中での重み付けなので、全部 1.0 にしても何の意味もありません。
<changefreq> ~ </changefreq>
<任意> 更新頻度を記述
対象URLのページ更新する頻度を記述。
"always"(常時)、"hourly"(毎時)、"daily"(毎日)、"weekly"(毎週)、"monthly"(毎月)、"yearly"(毎年) 、"never"(不変)。
"always"はアクセスごとに内容が変わるような文書、"never"は保存用URL文書として使用されます。
<lastmod> ~ </lastmod>
<任意> 更新日時を記述
以下のいずれかの方法で記述します。
- YYYY / 年のみ / 例 : 2008
- YYYY-MM / 年月 / 例 : 2008-04
- YYYY-MM-DD / 年月日 / 例 : 2001-08-02
- YYYY-MM-DDThh:mmTZD / 年月日および時分 / 例 : 2001-08-02T10:45+09:00
- YYYY-MM-DDThh:mm:ssTZD / 年月日および時分秒 / 例 : 2001-08-02T10:45:23+09:00
- YYYY-MM-DDThh:mm:ss.sTZD / 年月日および時分秒および小数部分 / 例 : 2001-08-02T10:45:23.5+09:00
小数点以下の秒の桁数に制限はありません。
TZDはタイムゾーンで、UTC(グリニッジ標準時)との時差を+09:00とするか、UTCで表記する場合は Z とします。
また、年月日と時分秒の間は T で区切ります。