2014年10月17日金曜日

WebmasterCentral和訳  XMLサイトマップとRSS/Atomフィードのベストプラクティス

10月24日追記:サイトマップ上限サイズについて、むーさん見解を補足。
「Googleは50MBまでサポートしているが、皆がそうというわけではない。よってベストプラクティスとしてはsitemaps.org準拠の10MBを推奨する。」とのことです。

むーさんも解説してたサイトマップとフィードのお話がしっかりした公式記事に。
晩酌のお供に翻訳してみました。
・・・どうせすぐに公式日本語訳出ちゃうんだろうけど。せっかちさんだけ読むといいよ。
記事内のリンク先も可能な限り日本語版に張り替えてあるよ!ほめて!
-------------------------------------------------------------------
XMLサイトマップとRSS/Atomフィードのベストプラクティス
2014年10月16日
 
中級者向け、上級者向け

サイトマップの送信はウェブサイト最適化のために大切です。
サイトマップによって、Googleはサイト内の全てのページを見つけ出し、変化があったときにすぐにダウンロードすることが可能になります。
この記事では、サイトマップの重要なフィールド・XMLサイトマップとRSS/Atomフィードの使い分け・Googleに対しての最適化について説明いたします。
サイトマップとフィード
サイトマップはXMLサイトマップRSSAtomの各フォーマットが利用できます。
これらの主な違いは、XMLサイトマップはウェブサイト内のURL全部を含むのに対し、RSS/Atomフィードは最近変化したものだけを含む点です。この点から以下のような重要なことが読み取れます。

· 通常XMLサイトマップは大きく、一方で直近の変化だけを含むRSS/Atomフィードは小さい。
· XMLサイトマップのほうが、RSS/Atomフィードよりもダウンロード頻度が低い。

最適なクローリングのために、XMLサイトマップとRSS/Atomフィード両方の利用をお勧めいたします。
XMLサイトマップはGoogleにサイト内の全ページについての情報を教えてくれます。
一方RSS/Atomフィードはサイトの更新について教えてくれ、Googleにインデックスされた皆さんのコンテンツの鮮度を保ってくれます。
ただし、サイトマップやフィードを送信しても必ずインデックスされるわけではない点はご承知ください。

XMLサイトマップの例:

 


RSSフィードの例:


Atomフィードの例:
 



各例の中にある”other tags”はそれぞれの規格に応じた任意・必須のタグを表しています。
Atom/RSSには必須タグを記載すると、Google検索以外のフィードを利用するものでの表示の手助けになりますので、お勧めいたします。
ベストプラクティス
重要なフィールド
XMLサイトマップ・RSS/Atomフィードの本質は、URLのリスト+それに付けられたメタデータです。
その中でもGoogleにとって特に重要なのは、URL自体と最終更新日時です。
URL
XML サイトマップ・RSS/Atomフィード内のURLは以下のガイドラインに従って記載してください。
Googlebotでクロール可能なURLのみを含む。
よくある間違いとしては、robots.txtで”disallow”になっているURL=GooglebotがクロールできないURLや、存在していないウェブページのURLが含まれているケースがあります。
 canonicalなURLだけを含むこと。
よくある間違いとしては、canonicalなページの重複ページを含むケースがあります。
皆さんのサーバーへの負荷を増すだけで、インデックスにも何一ついいことはないです。

最終更新日時
XML サイトマップ・RSS/Atomフィード内の各URLについて、最終更新日時を明記してください。
最終更新日時は、ウェブページのコンテンツに対して意味がある更新があった時でないといけません。
更新内容が検索結果上に目に見えて反映されるものである場合、最終更新日時にはその更新の日時を記載して下さい。
・XMLサイトマップの場合
・RSSの場合 
・Atomの場合 

最終更新日時は正確に記載してください。
・時間を正しいフォーマットで確定してください。
XMLサイトマップ…W3C Datetime
Atom・・・RFC3339
RSS・・・RFC822
・最終更新日時の更新は、コンテンツに意味のある更新があったときだけにしてください。
・最終更新日時をサイトマップやフィードの送信時間にしないでください。
XMLサイトマップ
XMLサイトマップにはサイト内の全URLを記載してください。
サイトマップは大きくなることが多く、あまり頻繁に更新されません。
以下のガイドラインに従ってください。

・単一のXMLサイトマップを利用する場合:
サイトが定期的に変化する場合、一日に一回はサイトマップを更新して、更新後にはGoogleにpingを打ってください。
・複数のサイトマップを利用する場合:
各サイトマップには、できるだけ多くのURLを記載してください。
上限は50000URL、またはサイトマップが未圧縮状態で10MBになるまでのいずれか一方です。
(補足:GWTヘルプ(上限値50MB)との違いについてジョン・ミュラー氏の解説
「Googleは50MBまでサポートしているが、皆がそうというわけではない。よってベストプラクティスとしてはsitemaps.org準拠の10MBを推奨する。」)


各サイトマップの更新後には、Googleにpingを打ってください(但しサイトマップインデックスは一回だけ)。
よくある間違いとしては、各サイトマップにたった数十個のURLしか乗せないケースがあります。
Googleが全部のサイトマップを素早くダウンロードするのが難しくなるだけです。
RSS/Atom
RSS/Atomフィードは最近の更新だけを伝えるようにしてください。
両者とも通常は小さく、頻繁に更新されます。
これらのフィードについて、以下の事項を推奨します

・新しいページの追加・既存ページの意味がある変更の場合には、フィードにURLと更新日時を書き込みましょう。
Googlebotに更新を見逃させないようにするためには、RSS/Atomフィードには前回Googleがフィードをダウンロードした時以降の全更新を含んでおく必要があります。
一番いい方法はPubSubHubbubを利用することです。これによって、RSSリーダーや検索エンジンなどフィードに関係するもの全体に対して、フィードの中身を最も速く・効率的に伝えることができます。
XMLサイトマップ・Atom/RSSフィードの両方を作成することは、Googleや他の検索エンジンによるクローリングを最適化するのに大いに役立ちます。
XMLサイトマップ・Atom/RSSフィードの主要な情報は①canonicalなURL ②サイト内各ページの最終更新日時です。
これらを適切に設定し、サイトマップならping・フィードならPubSubHubbubでGoogleなどの検索エンジンに通知する。
そうすれば皆さんのサイトは適切にクロールされ、検索結果にもそれに応じて表示されるようになります。

ご不明な点がございましたらコメントや、ウェブマスター ヘルプ フォーラムのサイトマップカテゴリをご利用ください。
------------------------------------------------------------------
翻訳者:内田 榮四郎 @http://allforallinternetusers.blogspot.jp/ twitter: https://twitter.com/UchidaEishirou