Google Chrome とランキング学習。検索エンジンの進化には人手が重要

諸事情により最近 Internet Explorer を使っていたのだが、あまりに起動(や操作)が遅くて我慢ならなかったので、最近は Google Chrome を使っている。(現時点では Windows 用しかないが)

Firefox でもほとんどアドオン使っていなかったせいかどうか分からないが、これはいいなぁ。マウスジェスチャがないのがちょっと使いにくいが、まあ必須というほどでもなかったので……。

高速なのがいちばんストレスにならないのだが、普通ゴテゴテつけるであろうさまざまなボタンやテキストエリアがなく、すっきりしているのがよい(Google のページも最近まではそうだったが……)。検索窓もないのは最初びっくりしたが、自分もよくアドレスバーに検索クエリを入れて検索するので、確かにこれでいいな、と思った。けっこう考えられている気がする。

そういえば 昨日のセミナーで知らない人もいたようだったので書いておくと、Google 英語版は検索結果のタイトルの横に検索結果のランクを上げる「↑」ボタンと、この検索結果は不適切であるという「×」ボタンがあり、これを押せば検索の順位をいじることができる(アニメーションがおもしろいので自分もしょっちゅう押してあげている)。

自分が次回以降に同じクエリで検索するとき当然これを反映した結果になると思うが、他人がしこしことクエリのランキングをつけてくれていれば、他の人が同じクエリで検索したとき、より適切な結果を返せる可能性が高い。

また、なんらかの処理をすることで、同じクエリでなくても検索精度を上げるデータに使える可能性がある(たとえば機械学習に関するクエリばかり検索ランキングを上げるフィードバックをくれる人は、他の検索結果より機械学習に関するエントリに興味があると考えられ、デフォルトでそういうのが上位に来やすいように出してあげるといったことができる)。

こういうのって Learning to Rank と言って、Microsoft Research (Asia) の人とか Yahoo! Research (元 Overture Research) の人とかここ2,3年積極的に取り組んでいるようで、これが流行るかどうか分からないが(個人的にはどっちでもいいんだけど……)、ランキング学習の問題として定式化できるタスクはいろいろあるので、発展性はありそう。

とはいえGoogle はクリックスルーのデータを使って品質を判断するのではなく、さまざまなランキングアルゴリズムを用い、ランダムサンプリングした検索結果を人手で評価する人々を雇って評価している。人手の評価が Google のランキングアルゴリズムの評価と進化を推し進めているという話だそうで(サマリーはHow Google Measures Search Qualityから抜粋)、クリックスルー(どの検索クエリでどのアドレスがクリックされたか)のデータはほぼ無尽蔵に手に入るという利点はあるが、やっぱり人手がかなり重要であることは間違いない。

ということを自分が言っていたら自己矛盾っぽいかもしれないが……。

言いたかったのは、Google Chrome まだ使ったことない人いたら、ちょっと使ってみては、ということ。

そういえば ChaIME のページ、昔は Internet Explorer, Firefox, Safari で動いていた気がするのだが、いつの間にか Safari で動かなくなっていたらしい(教えてもらって気がついた)。あと、Google Chrome で試してもだめだったのだが、なにがいけないんだろう……(入力部分のコードをお借りしている Ajax IME も同じみたい)