いろいろ書いたのだがはてなダイアリーの不具合で全部消えてしまったので、紹介だけでやめておく。
id:takahi-i さんがいろいろ Hadoop について書いていたのでなにかなと思っていたら、mixi Engineers’ Blog » 検索クエリログからのスペル訂正辞書の自動生成としてエントリを書いたらしい。Mixi の検索クエリ(+セッション)ログからスペル訂正辞書を作っていたのね。
Mixi の研究開発グループの人たちは、こうやってソフトを公開しながら研究成果を還元していく姿勢を打ち出していて、どこの企業もこんなふうにできるとは思わないが、すばらしい。
今後の展開にも期待!