泥臭いことをして研究を着実に前に進めるのも大事

科研の書類の必要事項を埋めてみたり。いまのところ外部資金に申請しているエフォート(全仕事時間に対してその研究に割く時間の割合)の合計が40%で、60%は大学の仕事かなと思っていたのだが、分担分を入れるのを忘れていた。結局60-70%くらいの充足率(大学の仕事は30%)になるのだろうか? 出したの全部は通らないだろうから、適当なところで収まるのだろうけど……

しかしいい加減研究費書きと論文読み(勉強会の準備、査読、etc...)以外の研究に関係することがしたくなってきた。今日情報処理学会 第199回自然言語処理研究会の締切で、共著で2本発表するので、そのチェックをするのが小さなオアシスである。みなさん研究進めていてすごいなぁ。@smlyくんなんて新しい実験結果が毎回入っていて、がんばっているなぁ、と思うのであった。

昼過ぎ、@jmizunoくんと erlyn-m さんの中間発表。松本先生もいま招待講演で海外に行っているところなので、さすがに行かないとまずかろう、と思って行ってみる。erlyn-m さんの話は研究会で聞く話と大きく変わっていないので普通だが、@jmizuno くんの話はだいぶ進展があったようで(あるいはスライドがかなり分かりやすくなったので)聞いていておもしろい。結局どこが問題なんだろう、というところがよく分からなかったが、聞いてみたらちゃんと教えてくれて、ロードマップもしっかりしているので、あとX年がかりで続けて行く線路が引かれているようだ(笑) ちゃんと前に進んでいるというのはよいことである。

午後、意味談話解析勉強会で(いまさらながら)

  • Hirotoshi Taira, Sanae Fujita, Masaaki Nagata. A Japanese Predicate Argument Structure Analysis using Decision Lists. EMNLP-2008.

を紹介。実はこの論文、

  • 平 博順, 永田昌明. 構造学習を用いた述語項構造解析. 言語処理学会第14回年次大会発表論文集, pp.556-559 (2008年3月)

と同じかと思っていたのだが、読んでみたら全然違った (勘違いしていて申し訳ない)。ちゃんと事態性名詞の話を大きく取り上げてもらっていて、むしろ感謝しないといけないくらいなのに……。ポイントは、述語(動詞や形容詞)と事態性名詞の項構造を同定するモデルを分けるか一緒に解くかというものだろうが、自分は分けた方がいいと思っている。恐らく項と述語の共起に関しては(サ変名詞のように形がほとんど同じものが多いので)共通にしたほうがいいが、統語的な振る舞いが全然違うので、混ぜるとよろしくないのではないかな (たとえば項の存在確率の計算とか)。

もっとも、こういうのも「うまく行きそう」「うまく行かなさそう」と印象論で語るのではなく、自然言語処理分野にせっかくいるのだから、両方実装して比較して実験結果で示すのが筋。誰か述語項構造解析の実験手伝ってくれる学生さん、募集しています!(笑)

機械学習ではなく自然言語処理の研究となると、(言語学の研究とも違うが)どこかでは泥臭いことに手を染めるしかなくて、それがコーパス作成か、辞書構築か、あるいは素性エンジニアリング (機械学習のときに使う特徴量をいろいろ試行錯誤することをこう表現する) か分からないが、新しい問題を設定して解く、という記念碑的な仕事以外はこういう地道な仕事がたくさんあり、これはこれでこの分野を前に進めている重要な仕事だとも思っている。みんながみんな華々しい、クリエイティブな仕事をしなければならないわけではないし、着実に研究を進めるのも大事である。