情報処理学会 2010 全国大会本会議3日目: 若手研究者に向けて

結局ほとんど言語処理学会年次大会には出ないままであったが、今日はお昼を構内のドトールで食べて、情報処理学会のイベントのほうに顔を出す。出たのはJSTさきがけセッション パネル討論
http://www.jst.go.jp/kisoken/presto/img/ssakigake.gif

話的には @ymatsuo さんがさきがけでなにをやっているのか知りたかったので聞きに行ったのだが、他の方々の報告もおもしろかったので大満足。やっぱり新進気鋭の研究者の方々だけあって、どの方の発表も刺激がありますなー。

@ymatsuo さんには内容について質問があったのだが、どうも飛行機の時間があって早く出ないといけないということで直接質問できなかったのが残念。そろそろ哲学的な議論を収束させて、我々は工学屋なんだから実際に使えるものを作ろう、という意見には賛成なのだが、無邪気に精度が出ればいいや、という流れも少し引っかかるものがある。そのあたりはどう考えればいいのかよく分からない。一応発言したのは (1) 精度が必ずしも実際の使用感を反映したものにならないことがあるが、精度をよくすることを第一の目標にするのはよいことなのだろうか、(2) 記述的な研究と予測的な研究の他にも、たとえば「日本語はこういうふうに書かれなければならない」というような規範的な研究もあると思うのだが、記述的な研究から予測的な研究への転換を強調すると、データから言えることしか言えなくなるのではないか、の2点。別の方が代わりに答えてくださったが、@ymatsuo さんとは違う文脈で回答していただいたので、話としては分かるのだが、もやもや感がある。

セッションの後半は、「さきがけ」プロジェクトがどういうものなのか、という話。けっこういいプロジェクトなんじゃないかなーと思う。一言で言うと、研究者版未踏、という感じかな。研究統括をやってらっしゃる中島さんと石田さんの人柄がよく出ていて、若手を育てようという雰囲気に溢れている(博士号を取得してこれから自分の研究を始めようという若手研究者に対する愛を感じる)。もっとガツガツした肉食系の研究者が集結しているのかと思った(採択率は10%前後)が、案外そういうものでもないようであった。

ともあれ、自然言語処理の分野でこれから10年くらいかけて開拓すべき、チャレンジングなテーマというのはなんなのだろうか、ということについて考えさせられた(この問題はここ半年ずっと考えていることだが)。本当にチャレンジングなことは研究の場ではなく開発の場でこそ起こっているのではないか、というのがこの5年間で得た感触ではあるが、採算をあまり考えず(全く考えないのも問題だが)投機的なことができる、というのは研究のよいところだとも思う。

自然言語処理エンジニアの養成は簡単だが、計算言語学研究者の養成は大変という話を自分なりに解釈すると、すでに存在する(正解つき)データを使って機械学習なりなんなりのツールを使って現実的な問題を解決する技術者を育てるのは容易でも、コーパスをじっくり見て問題発見し、エラー分析して自分でコーパスを設計していける研究者を育てるのは難しい、ということだろう。正解がついていないデータは大量に手に入るのだが、人手で正解をつけるのはなかなか大変(人間ですら、うまくタグを設計したり、ツールを便利にしたりしないと、全然一致しない)で、ものすごく時間がかかる。もしくはもっとプログラミング寄りの話でも、chasen を使う人を育てるのは容易だが、chasen を作る人を育てるの難しい、ということである。「こうやればできる」というマニュアル通りにやれる人は多いが、自分で優れたマニュアルが書ける人は少ない、というか(学校教育でそんなもの書く経験が少ないから仕方ないけど)。

乾先生奈良先端大に来る前の九工大時代からじっくりコーパスや辞書を設計できる人を育成されて来られて、すごいなぁと改めて思う。いまでいうとnaoya-iくんが修士のころからずっとコーパスの照応表現(英語で言えば he/she/it みたいな代名詞がなにを指しているか)タグづけ作業に取り組んでいるので、今後の活躍が楽しみである。ちなみに、乾先生も昔さきがけの研究費をもらっていたことがあるそうで。