Migemo について補足

昨日のエントリについて補足だが、Migemo も仕組み上初歩的なかな漢字変換に相当することはやっているので、Google サジェストのローマ字検索機能は Migemo の拡張、と言うのはそこまで変でもないか……。

ただやっぱり辞書を重み付けなしに全展開するのと、あと完全に単語辞書を引いているだけで、複合語になるだけでお手上げ(連文節変換なんか言うまでもなく……)というのが、やっぱり単なる辞書引きだけでは使い勝手がよくないのではないかと思う。そして Google サジェストでは複合語でも引けるので、単なる辞書引きではなさそうである。(いや、文章も含めて全部単語登録していれば単語辞書引きだけでいけるのだが、さすがにそれはないと思う)

あとデスクトップ検索(やエディタ・ブラウザ内検索)でもほしいのは曖昧検索機能、というか多少のスペル誤りがあっても頑健にマッチしてくれる機能かな? Google では少なくともかなり強力なスペル訂正機能があるし、特に英語を入力するときは Google の機能に非常にお世話になっていて、これが英語の検索で Google 以外にあまり代替がないという問題ではあるのだが……(でも英語版 Yahoo! のほうが適切な文書がヒットすることが多いような気もする。まあ、Google で検索してうまく行かなかったのを引いているので、Yahoo! でうまく行かないのを Google で引いたらうまく行くのだろうけど)

(追記) 蛇足だが ローマ字のまま日本語をインクリメンタル検索できるツール Migemo を書いた高林さんは現在 Google で(だからみんな「Google サジェストのローマ字検索は Migemo か」と思ったのだろうけど)、元々いま自分が所属している奈良先端大の松本研究室(自然言語処理学講座)出身である(つまり、自分の先輩筋に当たる。滞在は被っていないけど……)。←宣伝。