ブログ検索サービスみんなの経験

やや手前味噌だがブログ検索サービス「みんなの経験」が今日一般公開されたそうだ。自分は全く関わっていないが、自分の所属する研究室(奈良先端大自然言語処理学講座)の「みんなの経験」チームが開発していた。

なにができるのか例を見てもあまりピンと来ないが、説明によると

「みんなの経験」は、商品やサービスなどさまざまなトピックについて、 みんながどんな経験をしているか をブログ1億5千万記事から集め、みんなの 「知の宝庫」 にするサービスです。例えば、ボルドーワインとブルゴーニュワインを比較することができます。「良かった」のような感想だけではなく、「実際に商品を買った」とか「トラブルに遭った」のような様々な経験を検索できるのが特徴です。

だそうだ(たぶん見せ方の問題だとは思うが……)。肯定的・否定的な評価が検索できるのは最近ブログ検索でよくある話だが、新しいのは「実際に買ったか」「買おうと考えているだけか」「自分が試したのではなく知り合いから噂を聞いただけか」といったような違いにフォーカスを当てて、これらを区別して検索できる点である。Amazon でもまだ発売されてもいない商品のリビュー記事を書いたりする人がいて腹立たしいのだが、そういう記事のフィルタリングにも使えそうな技術である。

科研の情報爆発プロジェクトの一環として実施されており、こういう少し深い解析を使った(広い意味での)検索エンジンでリードしようという方向性は合っているように思う。逆説的だが、こういう「検索エンジン」というインタフェースで揃えていくと、クエリにキーワードしか使えない現状どうにかしたほうがいいんじゃないの、というところを真面目に取り組む必要性があったり、クエリ(インデックス)の正規化や、一般的な検索エンジンの(定跡的な)基礎技術、といったところがどんどん共通化されていくのであろう。

昨日のエントリにも関係しているが、大規模データを扱うときのノウハウとか、分散処理を簡単にするパッケージとか、やはり分野外の人まで(実務で)使い始めるようになると、研究段階から一つ先のステージに進むのかなと思った(研究の時に出てくる問題とはまた別の問題が出てきて、それはそれで重要)。

(追記) 日の丸検索エンジン情報大航海のほうだと id:aramaki さんからご指摘をいただきました。どうもありがとうございます。