2018年7月26日木曜日

Google品質評価ガイドライン(2018年7月版)解説  

Google Genenral Guidelinesが2018年7月版に更新されました。
前回のバージョンは2017年7月版だったので、約1年ぶりの更新。
後ほどしっかりした解説も書く予定ですが、取り急ぎ要点を整理しました。

品質評価ガイドラインの役割やら用語の解説やらは、以前書いたこちらをご参照あれ。

いろいろと細かな変更があったのですが、以下の3パターンに分類できます。

① 方針変更
 …評価の対象や基準が変わるもの

② ニュアンス変更
 …対象・基準は同じ。
  「この点をもっと意識してね」という事を明確にするために、解説や事例を追加

③ 説明強化
 …対象・基準は同じ。
  Raterが誤解しやすい点について、解説や事例を追加。

今回は②が大半、①と③が少々といったところ。
それぞれについて、要点を解説します。

==============
① 方針変更
「7.2.7 Obstructed or Inaccessible Main Content」(40P)の評価が厳格化。
既にアルゴリズムにも組み込み済みの、邪魔なインタースティシャルやらポップアップやらのアレ。
これまでは下から2番目のLow評価止まりだったのが、悪質なものは最低のLowestになるように追加変更されました。

妥当な変更かと。

② ニュアンス変更
    と話題になりがちな検索結果の「品質(Page Quality)」に関する記載が強化されました。主旨は3点。

1:品質を評価するときは、E-A-Tを重視してね!
 例えばLow Qualityの判定基準。 旧バージョンでは6.5と後半に配置。
 

 新バージョンでは6.1と、先頭に配置されました。

 他の項目でも配列変更や記載追加で「E-A-T大事に!」ということが主張されています。

2:E-A-T判断するときに「人」も気にしてね!
 以前から記載されていた事ではあるのですが。
 新バージョンでは「Content creator(コンテンツ作成者)」という用語を用いて、E-A-Tの判断対象を「掲載サイト」「Content creator」「双方」のいずれに置くべきかを解説する条項を追加(56P)。

「Content Creater 」を意識しようという注意喚起も、複数の条項に追加されました。

3:フェイク・ヘイトはダメ。
 こちらも以前から記載されていた事ではあるのですが。
 フェイクニュース・ヘイトスピーチの定義・解説を多数追加。

 特にフェイクニュース絡みの解説は旧バージョンから…

 大幅に増加。
  

 フェイク・ヘイトを排除するために、重要概念である「ページの目的」の説明も更新しました。
”「Beneficial(善意の目的)」でないページや、「Consensus(一般常識)」と一致しないページを低評価にする”という点を、以前よりも強調しています。

 旧バージョンでは、品質評価の目的を「”ユーザーの役に立つ”ページの目的があり、それを達成しているページを評価する事」であると定義していました。図にするとこんな感じ。


問題は「真面目に”ホロコーストはなかった”と主張するページ」「真面目に”地球空洞説”が正しいと語るページ」などをどう評価するか。上の定義だと、少なくともこれらの説を信じる人にとっては「役立つ」目的を達成できていると判断できなくはない。

こうした場合、「Beneficial」と「Consensus」の視点が役立ちます。
「真面目に”ホロコーストはなかった”と主張するページ」は、人道面から見てもホロコーストの被害者から見ても「善意」であるとは言い難い。
「真面目に”地球空洞説”が正しいと語るページ」にはBeneficialかもしれないが、Consensusに合致しているとは言えない。

「ユーザーの役に立つ」だけではなく、「世間一般の常識に照らして正しく」、「特定の思想・信条・人物・団体を害する意図がない」という要件も満たさないと、低品質とみなされます。


③ 説明強化
 常識的な内容。
 「商品クエリだからって、購入意図だけとは限らない。比較検討に役立つ画像リストとか、すごい役に立つ(149ぺージ)」とか…
「”Youtube”で検索してるなら、サイトに飛ばせばいいよね。YoutubeアプリとかDLの時間かかるし…」とか。

==============
主な変更点は以上。

■所感
とても常識的な変更しかないので、まっとうにSEOやってきたサイトであれば特に対応不要かと。「Googleさんも、いいことやってるサイトをしっかり評価しようとしてるんだ」と安心していい内容です。

一点だけ注意するなら、EATの担保情報。
まっとうにやってるサイトでも(社内事情とかで)外から見ると「どんな人が」「どんな根拠で」書いているのかが分かりにくい所が多いので、これを機会に著者情報の明示をすすめるのが良いかと。

寂しかったのは、高品質の例として昔から載っていたこのページが消されたこと。

内容はこんな感じ。
「コロンブスは1952年生まれ。1942年にフロリダに到達。1939年にはスペインに凱旋。1906年没。」
…タイムトラベルできたんですねこの人。あるいは紀元前の話かも。

一見するとウソしか書いていないスパムページですが、このサイトは「学生にインターネットでの情報収集を教える」ためのページ。有益なページの目的があり、それを達成できている高品質なページです。

Consensusとの関係で消されてしまったのでしょうが、こういう「よくわかってる」事例が消えてしまうのは、ちょっと寂しいです。

2018年1月4日木曜日

品質評価ガイドライン(音声検索版)

品質評価ガイドライン(音声検索版)が出たので、内容の整理と考察など。
全7ページ、かつ大半が評価例なので、英語が苦手でなければ原文見たほうがいいかも。

ここで言う音声検索(search speech)は、Google Assistantの音声回答のことを指す点に注意。Google Homeとかスマホのこういうやつ

評価は大きく分けて、クエリとの関連性を評価する「Needs Met評価」と、長さ・文章構成・発音などの発話品質を評価する「Speech Quality評価」の二軸。
「クエリとの関連性が高く」「適切な長さで」「自然な文章で」「聞きやすい発音・速度」の回答が高く評価されます。

両者の関係は明示されてません。
関連性のNeeds Metが主で、品質のSpeech Qualityが従、といった感じではないかと推察。本家品質評価ガイドラインがそうだし。
関連性と品質の関係については、本家の15.0「The  Relationship  between  E­A­T  and  Needs  Met」に詳しい解説があります。

ウェブサイト管理者側で対処するべきこととしては「コンテンツの質を高めること」、「構造化データ・HTMLでのマークアップを正確にすること」そして「文法に気を遣うこと」ではないかと思います。
1つ目は「関連性」を高めるために。
2つ目はGoogleが「適切な長さ」かつ「関連性のある」回答を抽出しやすくするために。
そして3つ目はGoogleが「自然な文章」の回答を作りやすくするために。

以上で概要の解説と考察は終わりです。
以下は各評価の詳細なので、気になる人だけ読むといいでしょう。

■Needs Met評価
詳しくは品質評価ガイドラインを参照。
…手抜きじゃないんです。Googleさんがそう言ってるのだからしょうがないんです。

大体こんな感じの5段階評価。
例はガイドライン内のものを、適宜日本風に。
==========================
① Fully Meets…
ほぼ完璧。
大半のユーザーがこの結果だけで満足。追加情報とかいらない。

例:
クエリ:「ダーウィンの身長は?」
回答 :「180㎝です!」

② Highly Meets…
上出来。
大半のユーザーにとって、とても役に立つ。追加情報が必要なユーザーもいるかも。

例:
クエリ:「平清盛」
回答 :「Wikipediaによると、平清盛は平安時代の武士、政治家。」

一見物足りないような気がするが、「Wikipediaによると」と出典を明示しているのがミソ。
この回答からは出典のWikipedia記事に移動できるので、ユーザーの需要を十分に満たしている、という考え方。

③ Moderately Meets…
まあまあ。
人によっては満足するし、ちょっと足りないと思う人もいるかも。

例:
クエリ:「東京の週末の天気」
回答 :「15℃、晴れです」

間違いじゃないけど、週末という長い期間の天気の解説としては不十分。


④ Slightly Meets…
かなりダメ。
ほんの一部の人にしか役立たない。

例:
クエリ:「今のアメリカ大統領は?」
回答 :「アメリカの大統領は、選挙で選出されたアメリカ合衆国の長です。」

完全に違う、というわけではないけどずれてる。

⑤ Fails to Meet
ダメ。役に立たない。

例:
クエリ:「今日は雨?」
回答 :「すみません、その件についてはお役に立てません。」
==========================

■Speech Quality評価
以下の3軸で評価。

① 長さ(Length)
 適切な長さであること。
 冗長でもいけないし、簡潔すぎて内容不足になってもいけない。

例:
クエリ:「BMIの意味は?」
回答 :「Body Mass Indexの略で、肥満度を測る基準です。ノギスを使った測定や水中での体重測定などのように、実際の脂肪量を計測するわけではありません。」
うん、くどい。後半いらない。

② 構成(Formulation)
 文法が正しい、自然な文章であること。
 ウェブサイトの内容を利用している場合、「~によると」といった具合に出典サイトを明言すること。

例:
クエリ:「皮膚の一番表の部分の名前は?」
回答 :「表 表皮 中央 真皮 内部 皮下組織」
文章としては意味が取れない。

③ 発音(Elocution)
 発音・イントネーション・読み上げ速度が適切であること。

例:
クエリ:「世界の人口は?」
回答 :「69億9999万9989人です」
Formulationと合わせて課題がある例。
文字としてみると概要がつかめるが、読み上げられると理解しにくい。
「約70億人です」と丸めてあげるのが正解。