2015年1月28日水曜日

私訳:地域別コンテンツ提供ページのクロール・インデックス

モバイル検索にも「この結果の説明は、このサイトのrobots.txtにより表示できません」が出るようになったり、多言語ページに対するクロールがちょっと親切になったり更新が多い。
・・・月末進行?

てなわけで後者のブログ記事を翻訳。
解説ページが日本語訳されてるし、近いうちに日本ブログに公式訳出そう。
でも無駄にスピード競争したくなることってあるよね。

要約すると
①同じURLで言語や場所に応じてコンテンツ切り替えてるサイトあるよね。
Google側でできるだけしっかり見るようにするよ!
②でもできれば別URLにしてhreflang使ってね!

===================================================

地域別コンテンツ提供ページのクロール・インデックス

  “地域別コンテンツ提供ページ”は、ユーザーの言語や場所に応じてコンテンツを変化させます。GooglebotAccept-LanguageHTTPヘッダを指定せず、米国内のIPアドレスを利用するため、地域別コンテンツ提供ページの一部バージョンをインデックスできないことがあります。

本日、Googleは“地域別コンテンツ提供ページ”と判定したページに対する新たなGooglebot による地域認識クロール設定を公開しました。以下の設定が含まれます:

地域分散クロール: Googlebotが現在利用している米国IPアドレスに加え、米国以外の国と認識されるIPアドレスを利用するようになります。
言語依存クロール: GooglebotAccept-Language HTTPヘッダを使用するようになります。.

このクロール設定はGoogleで“地域別コンテンツ提供ページ”と判定したサイトに対して自動的に適用され、ウェブマスターの皆さんがCMS/サーバー設定などを変更しなくてもGoogleのクロール・表示方法に変化が見られることがあります。

ただし、「Google では、地域ごとに別々の URL 設定を使用し、rel=alternate hreflang アノテーションで注釈を付けることを今後も推奨いたします。」という点は変わらない点にご留意ください。ユーザーがコンテンツを利用・シェアし、全地域バージョンのインデックス・順位を最適化するためには上記推奨設定が最善です。


質問やフィードバックなどございましたらフォーラムにお寄せください。

===================================================

2015年1月25日日曜日

マット先生講義「初期のGoogleで学んだこと」

昨年末のマット先生講演とスライドが公開されました。
長期休暇中のマット先生が久々にGoogleのお話を!
とてもいい講義なのでお勧めです。
以下は概要。これを見て興味を持っていただければ幸い。


■枕① 3万ドルをおじゃんにして唸るマット先生
「昔はCD焼くのとか"満月の夜に鶏の生き血を捧げて儀式を行う"みたいな感じだったじゃない。

Linuは特にひどかった。鶏の生き血が倍は必要な感じ。
なんでLinuxでのCDの焼き方を書いたことがあったんだ。

そのご縁で「VA Linux株(当時はIPO前)100株を無償提供するよ!添付のpdfに記載してね!」
ってメールをもらったんだ。でもpdfいじる方法なかったから放置プレイしてたの。

IPOしたら一株320ドル!
・・・返信忘れてた・・・
ちなみに当時の年収4万ドル。そりゃこうなるよ!」
=======================================================
いい唸り声を上げてます。そりゃねぇ・・・
CDの焼き方の話がすごい懐かしい。CloneCD×太陽誘電!これね!


■枕② マット先生とエロス
その後Googleに入社して、静かにコード打ちにいそしむマット先生。

ある日、マネージャー(女性)がマット先生に近づいてきて…
(灬╹ω╹灬) ねえマット、あなたえっちな画像とかどう思う♥
(´・ω・`) !?・・・どゆこと?
マット先生に貞操やらキャリアやらの危機が!

…ということではなくセーフサーチの開発お願い♥されたマット先生。
その後数ヶ月でマット先生が研究したこと
①19言語でセッ○スを認識する方法
②○○(えっちすぎて言えない)の書き方480通り
…マット大先生に詳しく教わりたいです。

でも数ヶ月もすると、一人でやることの壁にぶち当たるマット先生。
同僚にご助力願ったら、自分では想像もしなかったポルノがどんどんでてくる。
そりゃまあ十人十色の性的嗜好があるものねえ…

なのでメーリスで「皆さんちょっとポルノ系のワード打ったりポルノ探すの手伝ってくれない?」
と助力を募ったけど全スルー。先生自身言ってるけどそりゃ罠だと思うよね・・・
そこで先生の奥さんが考えた解決策が素敵。
①奥さんがクッキー焼く
②ポルノ探しを手伝ってくれた人にクッキーあげる
これが大当たりして、後にはスパムクッキーとかも出来たそうな。こんなの。
=======================================================
こうした個人的な「創造的な手法での問題解決」から、次のGoogle全体・ビジネス全体での「創造的な手法」に演繹していくあたり、やっぱり先生は話がうまい。



■レッスン① 難問に直面したら、創造的な解決法を模索しよう
Googleが初期に直面した大問題の話をしよう。
「more evil than satan himself(サタンよりも邪悪なもの)」でここが1位になってたこと
…ではなく、DMCAによる削除申請問題。

某宗教団体が批判的な批評家を抑圧するためにDMCA申請をしたことがあり、批評家は米国での訴訟に巻き込まれたくないので異議申し立てをしなかったというケースがあった。
私はFred Brooksの言葉を参考に、「二律背反する状況下では、良い経営者は明確な対立点を満足させるような創造的な解決策を編み出すことが多い」と提案した。
その結果単に削除するのではなく、「削除申請に基づいて削除した」点を検索結果上に記載し、chillingeffects.orgに申し立て内容を掲載するようにした。
ユーザーに「どういう状況があって表示されなくなっているのか」という情報を提供したわけだ。

「難問に直面したら、創造的な解決法を模索しよう。」
=======================================================
「某団体の言い分どおりに削除する」「批評家に異議申し立てをするように働きかける」といった現状の枠組み内での解決策にとらわれず、根本である「害を成さない」「必要とあれる情報を届ける」といった点に立ち戻って判断してるあたりが流石です。
ちなみに昨年度のDMCAによる削除申請件数は3億5000万件だそうな。ご苦労様です。


■レッスン② やりたいことがあるなら、主張しよう
セーフサーチ担当後、広告部門に移ったマット先生。
広告の仕事をしつつも、スパムの加熱が気になってしょうがなかった。
ある日、意を決してエンジニア担当副社長に「スパム対策の仕事がしたいんです」と申請。
「いいよ!いつからやる?」とあっさり許可されてびっくり。

「周囲の人々は、君の行動・仕事以上のものを見ていない。自分がやりたいことがあるなら、自分から要求しないといけない。」
=======================================================
「俺の秘められた力を何でわかってくれないんだ!」とか言ってても始まりませんしね。


時間切れなので後半は要点+エピソードを抜粋で
■要点
・自分の仮説・仮定を疑おう。
「データが多くなると、計算が難しくなる。」本当か?
音声認識・画像認識などは大量のデータを活用するという逆の発想で進化している。

・トレードオフを考えよう。以下のどちらがインデックスの置き場として適切?
「安いがスループットが低いHDD」「高いがスループットの高いRAM」

・企業・キャリアを成功に導くのは、多数の細かい成功の集合。一つの派手な成功ではない。
・いいことばかりが起きる訳ではない。Googleも多くの訴訟や聴聞を受けてきた。
悪いことがおきることもある。心構えをしておこう。
・写真を撮ろう。変わった事が起きたとき、年中行事、楽しいことを思い出に残そう。

Fred Brooksの言葉より。
「ツールメーカーの成功とは、ツールを使ったユーザーが成功することだ」

■エピソード
・入社前にPageRankについて、レア文献・特許も含めてガッチリ勉強したマット先生。

文献・特許よりも遥かに洗練された真のPageRankにびっくり

・ペナルティを与えたスパマーからクッキーの贈り物が。

一見普通のクッキーだけど、大きさがピザ並み。愛が重い。
ちなみに、「毒入りなんじゃないの」とかワイワイ言った後食ったそうです。

・Googleでは週に一度、ラリーとセルゲイへの質問タイムがあるそうな。
入社者の紹介や先週の振り返りの後ってことなので、朝礼みたいなイメージでしょうか。
マット先生いわく「億万長者を"なんでこんなことしちゃったの?"とか"他の方法のが良かったんじゃないの?"とか質問攻めにするのって楽しいよ!」
・・・いや普通の人は胃に穴が開きそうなんですが先生

・エープリルフールの一幕。
エンジニア担当副社長はサンタバーバラ(有名なリゾート地)出身

「彼のお部屋をサンタバーバラにしよう!」

砂90kg購入

執務室が素敵なビーチに(ぺんぺん付き)


隣室の人
「海沿いになってうちの部屋の地価上がった!」

最後にマット先生からの素敵な言葉を。
ポルノ探すのが仕事とか最高だぜ!
以上、切れ味健在のマット先生でした。
英語わかる人はオリジナル見ることをお勧めします。楽しいから。



















…実は続きがありまして。
スライドにはAppendixが付いてて、その内容がいい。

①成功と幸福の秘密(スライド70~72)
「人々が求めるもの」かつ「有用なもの」を提供する。
片方ではダメ。

②自分の責任範囲(スライド73~75)
全ては、自分の責任範囲に含まれると考える。
・ユーザーがつづりを間違える?それはこちらで対処すべき問題だ。
・ユーザーが検索の仕方がわからない?それはこちらで対処すべき問題だ。
・十分なコンテンツがない?それはこちらで対処すべき問題だ。
・ユーザーはその言語が使えない?それはこちらで対処すべき問題だ。
・インターネットが遅い?それはこちらで対処すべき問題だ。

本来責任を負うべきでない範囲もおのれの責任範囲と考え、①に該当する仕事を増やしていこうという攻めの姿勢。

上から順に
・オートコレクト
・ハミングバード、コンテキスト理解
・ナレッジグラフ
・Google翻訳
・サイトスピードのランキング要素化
で実行に移してるのが素敵です。



2015年1月18日日曜日

2015年1月16日オフィスアワー(よりぬき)

あけましておめでとうございます。今年もよろしくお願いします_(- -)_
・・・お屠蘇気分抜けるの待ってたら一月も後半に。
こんなだらーっとしたブログですが、本年もお引き立ていただければ幸い。

新年一発目は16日のオフィスアワーから大切そうなところをよりぬきで。
















背後霊の消えたむーさんはちょっと寂しげ。


================================================================================
むーさんからお知らせ
( ´∀`)
・構造化データ周りでいろいろ更新したよ!
・検索全般+ウェブマスターツールへのご意見ご感想募集中!
あて先はこちら
================================================================================
年始から静かだったぶん、ここに来ていろいろと嬉しい更新が。
企業のナレッジにソーシャル垢表示は言語設定を英語にするといろいろ確認できます。
音楽・お笑いイベントのはTicketmaster内のイベントでいろいろやってみたけど、現時点では表示できず。
構造化データテストツールは見やすくなりました。このブックマークレットで試してみてください。
もっともまだ作り立てで、エラー報告も来てるみたいです。皆さんも気づいたら送ってあげて。


================================================================================
モバイルフレンドリー項目?今はランキングには使ってないよ
(´・ω・`)
WMTに最近「モバイルフレンドリーじゃないページは、モバイルユーザーには適切な位置に表示されるかも」ってメッセージが来るようになったよね。将来の話をしてるんだと思うけど。
モバイルフレンドリー項目のランキング要素化について新しい話はない?

( ´∀`)
現時点では使ってないよ。
でもブログで発表した時から試験は続けているし、今後も続けるはず。
そして適切な方法が見つかったら、スマホユーザーにはスマホ向けサイトをちょっと優先ってこともあるんじゃないかな。

Googleがモバイルフレンドリー項目のランキング要素化に向けて実験しているのは間違いない。
ウェブマスターの皆さんがモバイルフレンドリー化の方法を学ぶ意義は十分にあるはずだ。
現時点でもモバイルユーザーは多いし、将来的にはGoogleがランキング要素に反映させる度合いも増えるかもしれない。

もちろんモバイルユーザーに影響することであって、「モバイルフレンドリーだからデスクトップ検索でも優先しよう」ってのはないんじゃないかな。
===============================================================================
モバイル推し推し。
WMT云々はバリーさんが「”適切に表示しランク付けする”ってなんだよ!”順位下げる”って言っちゃえよ!」、と言ってた例のメッセージ。
モバイルフレンドリー項目をランキングに使う云々はまだまだ先の話だけど、やる気は十分ってとこです。

まあHTTPS同様、ごく軽微なシグナルとして試しにお出ししていく感じになるんじゃないかと思います。
「このサイトのボタン配置とか文字サイズいい・・・でも中身はまあまあ」というページと
「このサイトスマホだと拡大しないと見られたもんじゃないけど、中身はいい・・・」というページ
前者が優先表示されるようになるとかなかなか世紀末チックだと思うので。

そして最後がさりげなく気になる。
デスクトップのサイトスピード初めいろんなシグナルをモバイルに流用してる現状では、これって無理なんじゃ。
割と近いうちにシステム改革する気なのでしょうか。


================================================================================
■不自然リンクはちゃんと否認したほうがいいよ
( ´∀`)
ペンギンさんにつつかれないためにも、否認なり可能ならリンクの削除なりしたほうがいいのは当然。
「問題点があるのを知ってて、それが解消されるのを祈るだけ」とかビジネスのやりかたとしてはアレだよね。
================================================================================
なんでこんな今更の話をしてるかと申しますと、年末のオフィスアワーでこんな感じのやり取りがありまして。

(´・ω・`)
あるサイトに不自然リンクが付いて、ペンギンさんで順位が落ちました。
でも管理者の人は否認とかリンク削除とか知らないので、そういうことはしません。
かわりにがんばってサイト運営して、結果自然リンクがたっぷり付きました。
この場合、ペンギンの元になった不自然リンクはそのままだけど、ペンギンから解放されることってある?

( ´∀`)
ありうるよ。ちゃんとサイトが良くなってるシグナルが出てるしね。

注意すべきは「ありうる」だけということ。
どうやらぺんぺんは自然リンクと不自然リンクの比率も勘定に入れているので、自然リンクが増えればいずれ解放されることもあるのでしょう。
でも大抵の場合、否認・削除を行ったほうが効率いいですよというお話です。

例えばぺんぺんの解放基準が自然:不自然=9:1だとしましょう。そしてあるサイトに自然リンク100本:不自然リンク100本があるとしましょう。
リンクの否認・削除担当である私はへっぽこなので、否認したリンクの6割が不自然リンク・4割は実は自然リンクだとします。
9:1をクリアするにはいろんなパターンがあります。
①否認・削除0の場合。自然リンク900本獲得で解放
②否認・削除100本。残るリンクは自然60本・不自然40本、自然リンク300本獲得で解放
③否認・削除150本、残るリンクは自然40本・不自然10本、自然リンク60本獲得で解放
どれが簡単かは人によりけりでしょうが、①はだいぶ難易度高い気がします。
もちろん「そんな単純な仕組みじゃないだろ」「③とかペンギンから解放されたとしても自然リンク減ってるじゃないか」
といった問題はあるのですが、ざっくりとした説明ということでご容赦を。

そして、それなりの精度で否認できるのが前提のお話なので、間違えても「否認とかよくわからんけどやっちゃえ」
みたいなのはダメ絶対。
オフィスアワーでのむーさん発言は、聞き手が全員それなりにSEOのことをわかっている前提なので。


================================================================================
今回のダメ質問
(´・ω・`)
検索品質評価ガイドラインに載ってた○○○○ってアルゴリズムにも反映されてるの?
================================================================================
ここではネガティブな発言をしたくないのだけど、あまりにひどかったので記載。
あまりにひどかったので質問のキーワード・むーさん回答省略。

検索品質評価ガイドラインってのが何かはこちらを参照。
公開されてるからいいじゃない、と思うかもしれませんが、こちらで公開されているのはGooglej自身が公開した、2012年バージョンの一部。
で、この中には「○○○○」とかありません。
この質問者の言っている「○○○○」ってのはその後に流出した、本物かどうかも怪しい海賊版に記載されてたという噂のものです。

「あなたの会社の流出資料っぽい怪文書にこんなこと書いてあったんだけどどうなの」とか質問としてどうなんでしょう。
善意で情報提供の場を設けてくれてるぐぐるさんに対して、ちょっとあまりな仕打ちじゃないかなと思った次第です。



================================================================================
株価を表示するワンボックスの扱い
(´・ω・`)
検索結果に株価を表示するワンボックスが出ることがあるけど、表示を拒否できないの?

( ´∀`)
できないのごめんね。
でも、フィードバック送ってくれたりむーさんに送ってくれたりすれば、もちろん検討するよ。
================================================================================
そんなに何でも送ってね!しちゃってKAROSHIしちゃうんじゃないかいむーさん。
メタタグでnoknowledgegraphとかnositelinksとか作ってくれてもいいのにな・・・
ということで「サイトリンク拒否タグ欲しい!」と要望出してみました。
ご賛同の方は上のリンク先からチェックマークを押してやってください。


================================================================================
■ネガティブSEO受けた時は鏡も見よう
(´・ω・`)
競合が他のドメインにうちのサイトをコピーして大量のリンク貼って、結果うちのサイトが検索から消えたんだけどどうしよう。

( ´∀`)
フォーラムとかで具体的にURL上げて相談してくれるとありがたいな。
そういうやりかたで偽者が表示されちゃう場合、本物のほうにも問題点があることも多いから気をつけてみてね。
アルゴリズムが本物と偽者見比べて、迷った上で偽者を選んじゃったわけだから。
================================================================================
ここいらのやり取り見てるとむーさん頭いいな、と思います。
相手の言うことを鵜呑みにしないで、相談者自身も理解・認識してない問題も考えて答えを出すとか素敵。


================================================================================
画像には最低限の説明を
( ´∀`)
画像が「これは何のための画像なのか」がわかる程度の最低限のテキストは入れたほうがいい。
良くあるダメな例は、写真に対して使用機材・撮影設定しか書いてない場合とか。
被写体に付いての説明も入れようね。
別に画像一枚一枚に小説書ける位の説明入れてってわけではないよ。
================================================================================
特許周りのニュース見てると画像判別技術は大分進んでるようですが、それを品質評価までしないといけない検索機能で実用化するのはまだまだ先のようです。
以前フォーラムで見かけた例だと、太陽光発電に関する自分のデータを全て図表(alt文なし・本文なし)でウェブページに掲載していたというもったいない例がありました。


================================================================================
SSL証明書の発行者とか気にしてないよ?
(´・ω・`)
最近「お手ごろなSSLどうぞ!」って業者多いけど、Googleから見てこの業者のはダメとかってあるの?
( ´∀`)
ないよー。
暗号強度は見ているけど、別にランキングとかには使ってないよ。
業者とか見てないです。最近は無料の発行者も出てきてるし、どんどん使うといいよ。
================================================================================
強度については、HTTPSシグナル導入直後に「今後十分な強度があるかどうかをシグナルにする可能性」については言及していたので、そのために見ているのでしょうね。
そういえばHTTPSならどんなものでも優遇。暗号として実質機能してなくても優遇。という初期のザル状態は今もそのままなのかな。


今回のめぼしいところはこんなところかと。
モバイル推しがいろいろ強い一年になりそうです。