今年の抱負 in 人工知能学会誌

2009年1月の人工知能学会誌が届いていたので目をざっと通す。編集委員の方々の「今年の抱負」がそれぞれ40人分、1人ちょうど1ページ書いてあるのだが、論文と違ってみなさん好きに書かれているのでおもしろい。前から何回か人工知能学会誌はおもしろいということをこの日記でも取り上げているが、人工知能学会に入っている人(あまりいないのかもしれないけど……)は毎号読まずに捨てたりするのはもったいないので、パラパラとめくることをお薦めする。

自然言語処理的な内容としては奥村さんが書いた「新語義の発見 --意味解析における新しいタスク--」という記事(p.5)で、たぶん3月の年次大会でも同じようなタイトルの発表があるのでこの内容について話されるのだと思うが、日本語書き言葉コーパスに対して語義を付与しているそうで、特徴としては「辞書に載っているどの語義にも当てはまらない」というラベルをつけているところだそうだ。どの語義を取り得るのか全部分かっている場合、語義曖昧性解消は分類問題になるのだが、分かっていない場合(特に分野が限定されない場合は新しい語義も出てきそう)はどうするのがいいんだろう。そして、Semeval 2010 でも「Japanese WSD task that includes new senses by using BCCWJ corpus」というワークショップとして採択されたらしい。2009年度モニタ版のコーパスが出るそうなので、出たらちょっと見てみようと思う。

あとは松尾さんが書いている「意味知識の抽出」(p.23)は先日の Symposium on Semantic Knowledge Discovery, Organization, and Use というシンポジウムの感想が1ページびっしり書いてあった(詳しくは手元にある人は参照されたし)のだが、Google の Marius Pasca らのチームの検索クエリログを用いた研究に関するコメントやらとともに、

ベイエリアで人と話していたら,意味的な処理は日本は強いよね,ということを言っていた.例えば,マイクロソフトに買収された PowerSet (ママ) は,日本でずっとやってきた技術がベースになっているとのことである.本当かどうかは知らないが,少なくとも,海外の人がそう思ってくれているというのはチャンスである.日本の第五世代コンピュータのことを覚えている人もいるし,Web上の情報技術が,意味的な領域に入ったときに強いのは日本,というブランドイメージを植え付けるチャンスでもあると思う.

と書かれていた。確かに日本語だと単語分割の曖昧性、かな漢字変換でも「同音異義語」の問題で昔からものすごい積み重ねがあるわけで、意味的な領域に入ったとき強いとアピールするのはイメージ戦略として優れていると思う。

最後は機械学習の話だがしましまさんの「転移学習に転移中」(p.7)というのもおもしろかった。やっぱり論文だとかっちり書かないといけないので、こういう「哲学的」というかメタな議論(あと「研究していて得た経験則・実感」「こういうのはうまく行きそう・行かなさそう」みたいなの)って、学会の雑談とか酒の席とか、もしくはいまならブログとか Twitter とか、そういうところ積極的に聞きに・見にいかないと、自分が関心のある領域以外は知ることも難しいと思うのだが、野次馬的な自分としてはこういう文章が読めると非常にしあわせなのであった :-)

あと同じくしましまさんの「データマイニングと統計数理研究会」の紹介(pp.162-165)もおもしろい。データマイニング(データ分析・データ科学)とはなにか、という話から、科学における帰納や理論とはなにか、というトピックまでまとめてある。もっと特定のトピックとしては DMSS というワークショップのサマリ(津田さんのグラフマイニングの話、佐久間さんの「プライバシー保護データマイニング」の話、Wang さんの Boosting の汎化性能に関する話)も参考になる。

人工知能学会の全国大会、これまで参加したことなかったけど、今年は高松らしいので、都合ついたら行ってみようかな?