新人が取り組みたいテーマがその分野の特徴を決める

GW直後なのだが朝一で研究室へ。

昼から笠原先生のゼミナール1へ。MapReduce的な話をお伺いしたりする。分野が違うと使う分布も違うなぁ。自然言語処理で一番使われるのは指数分布だろうか。まだ研究室のウェブサイトはできていないが、新しい研究室は大規模システム管理研究室というらしい。5月のオープンキャンパスでもブースを出すそうなので、興味のある受験生の人は訪れてみるとよいと思う。

来週同じ時間に[twitter:@shuyo]さんに招待講演をお願いしているのだが、けっこうM1の人たちも楽しみにしてくれているようでなにより。学外の方も聞きに来られてかまわないので、ご自由にどうぞ。(と気軽に来られる距離の人はほとんどいないかもしれないが……)

午後は今年からの新しい試みで、研究室のM1の人たち全員の自己紹介。これまでM1の人は最初の研究発表の回に自己紹介をすることが多かったが、過去に何をしたかとか延々話す人もいて、結局 NAIST に来て、研究として何をやりたいか、何をやっているかが全然分からない人もいたので、今年はそういう時間は1日にまとめてしまい、自分の研究発表の時間は自己紹介なしで直接研究の話ができるように、というアイデアである。

この段階で具体的に研究をどう進めて行こうというのが固まっている人はいないと思うが、今日自己紹介した人のうち文書要約をやりたいという人が6人、機械翻訳をやりたいという人が3人いて、たまたまなのかどうか分からないが、時代を感じる。文書要約を特別に扱うこれといった勉強会はないのだが、これだけ人数がいたら新しく作ってもいいのかもしれない。テーマとしては自分も興味があるものの、自分は引き受ける余裕はないが……。(松本研究室では各学生は最低一つの勉強会に所属し、その勉強会には基本的に毎週参加し、そこで論文紹介や進捗報告することになっているので、自分の研究テーマに合致する勉強会があれば話は早いのだが、そうでない場合、どこか別の勉強会に便宜的に所属することになる)

しかし現代の文書要約と機械翻訳というのはけっこう似ていて、自動評価尺度が発達し、公開データセットが使えるので、数値最適化や細かいエンジニアリングとか、機械学習の世界で大いに発達している印象があり、こういう分野に新しく自然言語処理の研究を始める人が興味を持つというのは、そういう時代の流れなのかもしれないなぁ。今年の新入生はけっこうコード書くの好きそうな人が揃っているし……。(逆に言うと、ある分野が消滅するのは、その分野に興味のある新人が来なくなり、こだわりを持ってやっていた人が全員定年などでいなくなったときである)

夕方は言語教育勉強会。

前半は[twitter:@shirayu]くんが

  • Baldwin T, Kordoni V, Villavicencio. Prepositions in applications: A survey and introduction to the special issue. Computational Linguistics. 2009;35(2):119-149.

を紹介してくれる。やっぱり勉強会の限られた時間だと、論文誌の論文は手に余るというか、けっこうボリュームがある。(自分もM1の最初の勉強会で論文誌を紹介したが、いろいろと無理があった) こうやって読むと、いかに論文誌に書くというのが大変か、と実感する……。

後半は[twitter:@keiskS]くんが今週木金開催のNL研 (情報処理学会自然言語処理研究会) の発表練習をする。発表自体は20分ほどなのだが、スライド以外にも実験設定などコメントがたくさんあり、結局1時間以上延々と……。発表練習というより進捗報告になってしまった。M1の人たちには門前の小僧状態かもしれないが、スタッフや先輩が取り組んでいるリアルな研究の話をしているのを聞くのも勉強になるので、最初はちんぷんかんぷんかもしれないが、出てみるといいと思う。