Google 様にクロールしてもらえるようにサイトマップ XML を作る

メインサイト Neo's World で独自ドメインを取ったことに伴い、新ドメイン配下のページを Google にクロールさせたいと思った。

指定のサイトの URL を自動的にクロールしてもらうためには、サイトマップ XML を配信するのが良いらしい。

サイトマップ XML の書き方

サイトマップ XML は次のように書く。

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url><loc>https://neos21.net/index.html</loc></url>
  <url><loc>https://neos21.net/about/index.html</loc></url>
  <!-- 以下、サイト上のクロールしたい URL をひたすら羅列… -->
</urlset>

以前、link 要素の canonical 属性による URL 正規化の手法を紹介したが、その時に各ページに埋め込んだ正規化した URL を、今度は XML に全ページ分記述する感じだ。

以下のように、既存のサイトから XML を生成してくれるサービスもあるので、書き方の参考に。

サイトマップの配備と初回クロール

サイトマップ XML は、ルートディレクトリに置く。僕のサイトだと以下にある。

初回は「Google Search Console」という管理用のページから、サイトマップ XML を読み込んでくださいーと依頼してやるとスムーズだ。