ドッグフードは割とおいしい。-- ChaIME は続くよどこまでも

ChaIME というのは Preferred Infrastructure の @tkng さんと自分が作っている統計的かな漢字変換エンジンなのだが、コアエンジンだけ作って時間が取れず放置していたら、tkng さんがちょくちょくいじってくれていて、最近は進化して日常的に使えるようになったそうで、新バージョンの ChaIME で生活を始めたらしいので、自分も乗っかってみる(Eat your own dog food. という表現があるそうだが、自分で作ったものを自分で使わないとだめだ、という意味らしい)。

注: 現在まだリリースもコミットもされていません。古いバージョンは上記のリンクからデモが試せます。

tkng さんグッジョブ!!

と思って書いていたら「季節」という単語が変換できないので tkng さんに調べてもらったら、どうもこの単語、NAIST-jdic には収録されていないらしい。NAIST-jdic の前身である IPADic には入っている。@taku910 さんによると NAIST-jdic は基本語彙がポロポロ抜けていることがあるそうなので、ちょっと注意して使わないといけないのかもしれない。(もしくは IPADic を使い続けるか、いっそのこと UniDic に切り替えるか)

変換精度を上げるにはいろいろ直しがいがある感じ(どこを直せばいいのかも分かっている)なので、ぼちぼち直していきましょー。元からの個人的な関心としては、かな漢字変換エンジンの開発をしつつそれに関する論文を書くことなのだが、論文にするとなるとまだまだやることありますなー