2015年10月7日水曜日

アルゴリズムで遊ぼう

シリーズ化しつつある「不正ハッキング対策アルゴリズム」への突っ込み。
膨大な数の不正なハッキングを削除した結果」と面白い冗談をおっしゃっているので突っ込まざるをえない。

    なんでも削除しすぎ
「ぐっぐるさんぐっぐるさん、ヘッドホン買いたいです。通販で送料無料のところある?」
「よしきた」

ぐっぐるさんの世界ではヨドバシカメラビックカメラコジマソニーも存在しないようです。
リンク先ではちゃんと条件にあてはまる商品売ってるのにね。
世間知らずなぐっぐるさんかわいい!

でもそういう子にはお買い物する時に相談しないんじゃないかな。 
Bing兄さんのほうがいろんなお店知ってそうだし。
あひるさんも…と思ったけどもっと頑張ってほしい。コンセプトとかUIとかは好きだよ。


② ふわっとした判定基準
前々回も言ったんですが、キーワードごとに点数持たせて一定値に達したらアウト!みたいな単純な判定してる感がありあり。
「プラダ」「激安」あたりは危ないから50点!
「しまむら」「販売」あたりはそうでもないから10点みたいな。

だってこうだもの。
  • 「グッチ バッグ」23
  • 「グッチ バッグ A28
  • 「グッチ バッグ X17
  • 「グッチ バッグ あ30
  • 「グッチ バッグ わ28
  • 「グッチ バッグ 甲」59
  • 「グッチ バッグ 乙」86
  • 「グッチ バッグ 寿限無寿限無五劫の擦り切れ」12
「グッチ バッグ」でスイッチが入ったらあとは何でもOK?
最後のは全表示しても873件でした。そりゃねえ…

なんでこんなクエリにも効く。
  • 「グッチ バッグ 着こなし」16
  • 「グッチ バッグ 愛用 芸能人」47
  • 「エルメス ケリーバッグ 由来」69
  • 「財布 種類 国別」52
ちゃんと役立つページが残っていればいいのですが、そこは前回触れた理由の通りでえもいわれぬぽんこつ感。
「グッチのバッグに合う着こなし」とか「世界の変わった財布」とかをちっちゃなサイトでまじめに書いても拾われないんでしょうねー

あとこんなのにも効く。
  • 「グッチ裕三 レシピ 通販」89件
  • 「シャネルズ ランナウェイ CD 通販」118件
ここを狙ったスパム多いんですかねー(しろめ)
前々回に「エンティティ理解してるえらい!」って褒めといたけどちょっと怪しい感じ。


③ 言語テストしたの?
パンダアップデートの英語版開始と日本展開に結構な間があったように、ほかの言語の内容まである程度踏み込んで判断するアルゴリズムを導入するときは結構試験してから投入することの多いぐっぐるさん。
むーさんも「ほかの言語をシステム的に理解するのは難しい」「Googleは基本、未完成のものを本格運用することは避ける」って言ってましたしね。素敵。

今回その法則守ったのかな?
だって効き方が極端に違うんだもの。
例えば同じ「グッチ バッグ 赤」でも
  • 日本語・Google.co.jpで「グッチ バッグ 赤」 6件
  • 英語・Google.comで「Gucci bag red」 143件
  • ドイツ語・Google.deで「Gucci Tasche rot」 181件
なんでドイツ語かというと今回の発表がドイツだから。
少なくとも英語では、10件近くまで落ちるみたいな極端な効き方見たことないです。
まさかドイツ語や英語だけで効果測定して「ほかの言語でもやっちゃおうぜ!」とかいうことないですよね。
杞憂だといいのですが。

こんな感じにいろいろと不思議な挙動の多いこのアルゴリズム。
これが通るとなるとSEOとか必要ないですね。いろんな意味で。