百度との共同研究

いくつかリンクというかメモ。

百度、早稲田大学との検索技術に関する共同研究に合意だそうだ。百度(日本法人)というか水野さんにはいろいろと期待しているので、アカデミック御用達検索エンジンになるくらいでがんばってほしい。少なくとも日本語百度で動くシステムならあまり変えず中国語百度でも動くなら、一気に日本語版と中国語版は作れるわけで、それはそれで嬉しい。(まあ Google みたく全言語一気にできるのが理想だが)

あと masayu-a さん情報でGoogle Search REST APIを知る。自分も昔あった Google SOAP API のほうを使っていてライセンスキーも後生大事に持っていたのだが、JavaScript 以外からも使えるようになったので、これで置き換えられるかな? しかし上位32個の結果しか取れないというのは研究にはちょっと使いづらい。Yahoo! の検索 API が研究・開発で使われるのも、GoogleAPI よりはまだ使いやすいアクセス形態になっているからかな、と思うし。Yahoo!Google百度と(あと個人的にはLiveSearchも)競争し合っていい刺激が相互にあるのが望ましい。

最近 ChaIME のほうはクラスベースの言語モデルを作るかということで tkng さんが Class N-gramモデルとHMMについていろいろ書いてくれた。しばらく研究としてはクラスタリングかなと思っているので、そのあたりの手法を考えてみたい。