最先端の研究は大学院生とポスドクが担っている

第6回最先端NLP勉強会のため、東大本郷キャンパスに行く。最近あまり論文を読めていないので、こういう機会はありがたい。

最初の担当だったが、なんとか終える。自分が紹介したのは

  • Baroni et al., Don't count, predict! A systematic comparison of context-counting vs. context-predicting semantic vectors, ACL 2014.

という論文。スライド(質疑込み)はこちらで公開している。

事の発端はnlp blog の読書会の記録を読み、たとえば word2vec のような深層学習を用いた最近の分散表現の研究は、意味処理のこれまでの蓄積の上に成り立っているように見えない、と疑問に思っていたのは自分だけじゃなかった、と安心したからである。そして、実際これまでの研究と比較しても、分散表現には意味がある、ということを示した論文であるということで、読んでみた。

内容的には理論的でも示唆的でもなく、単にいろんなタスク、いろんなパラメータで比較しました、という、あまり ACL っぽくない(EMNLP 向きな)論文であったのだが、そういえば今年の ACL は NAACL なのでそんなものかなと思ったりする。まあ、少なくとも自分的には、これまでなら pLSI や LDA を使うところに word2vec を使ってもいいかな、と思えるようになったので、読んでよかったとは思う。

ただ、いくつもの論文紹介を聞いて思ったのだが、どんどん研究の「最先端」から離れているように思う。深層学習(deep learning)などは、追いかける気が最初からあまりなかったのだが(GPGPU用のGPUは買ったけど)、松本研を離れて1年半最先端から遠ざかると、そもそも最新の論文を理解するだけの基礎知識が少しずつ失われてしまっているような気がするのである。教員1人だけで研究室を回している人たちは、いったいどのようにしてこの問題を解決しているのだろうか。

お昼は最初カポ・ペリカーノという学内のレストランに行ってみたのだが、あいにく座席がほぼ満席だったので、2グループに分かれて FIRE HOUSE  というハンバーガー屋さんに行く。学生やポスドクの方々から研究の話を聞いたり、研究室の話を聞いたり、だいぶ若返ったように思う。というか、研究の話ができる(自分が知らない研究について教えてもらえる)のは、想像以上に幸せなことなんだなぁ。しかし自分は彼ら・彼女らに有益な情報を提供できているのだろうか……。

午後の部も盛りだくさん。去年に引き続き今年もうちの研究室からは自分だけの参加だったが、来年はこういう勉強会に出たいという学生がいるといいな(まあ、博士後期課程の学生、もしくは博士後期課程に進学したいという学生でもなければ、1日中研究の話を聞くのはしんどいと思う)。