午前中はオフィスアワー2件。全然研究の話を聞かない人がいると少し不安になってくるが、自分が博士後期課程のころは、松本先生と自分の研究の話をするのは(論文を書いている間を除くと)数ヶ月に1回くらいだった気もするし、自分で自分の研究の進捗を管理するのも必要な能力なので、良くも悪くも主体的に動いてもらおうと思っている。
最近は研究室で構文解析の研究をしているので、少しずつ勉強しているのだが、この世界もやはり深層学習の海が入ってきていて、なかなか難しい。今年の自然言語処理の国際会議はどこも self attention あるいは data augmentation ばかり。まあ、工学的には使いやすいこなれた手法が確立してくれればいいというスタンスで付き合えばいいと思っているのだけど。
あと、深層学習の登場以降に自然言語処理の研究をスタートする人は、基本的には深層学習以前の手法はひとまずスキップして深層学習登場以降の手法を学んでから研究なり開発なりに着手すればいいと思うのだが、論文を書くとなると深層学習以前の話を無視するわけにはいかないし、特にジャーナルやフルペーパーを書くにはちゃんと歴史を押さえる必要がある。しかし深層学習以降に入門した人は、深層学習以前の論文を読むのが大変なようで、ハードルを先に体験するかあとに体験するかの違いではあるが、基礎体力をつけるというのもなかなかしんどい。自分自身、深層学習以降に取り組んでいるタスクについて、深層学習以前の研究について詳しいかと言われるとそういう訳ではないので、しっかり時間を取ってインプットしないといけないのだが……。
夕方は研究室見学の対応。うちに来るとしても入学は2020年4月予定なので、まだ先のことであるが、これくらい期間があると入学までに何をすればいいか、ということを準備できるので、最近はちゃんと考えるべきかという気になっている(これまでは、特に意識していなかった)。
結局、大学院入学前にできるようになっていてほしい能力としては
- 自分でサーベイする能力(英語力と数学力、自主性)
- 自分で実験する能力(コーディング能力、計画性)
- 自分で論文を書く能力(アカデミックライティングスキル、忍耐性)
の3つで、これまで博士前期課程の入学希望者でチェックしていたのは大学院入試で聞かれる英語力と数学力だけだったが、今年からは研究計画書をちゃんと出してもらって自主的にサーベイができるかどうか、アカデミックライティングができるかどうかは見るように変えた(コーディング能力は伸び代も含めた評価が難しいので、まだ見ていない)。特に、1文単位では文を書けても段落単位で文章が書けない人がいるので、そういう人は厳しいかなと……。
夕方は NAACL の原稿を見る。最初はフルペーパー1人、ショートペーパー1人くらいのつもりだったが、少しずつ投稿予定の人が増えてきて、最終的に何人になるか分からないのだが、嬉しい悲鳴である。しかし自分のキャパシティを考えると、フルペーパーとショートペーパーを合わせて同時に見られるのは20ページから30ページの間で、余裕を持って見られるのが20ページまで(フルペーパー2本とショートペーパー1本、またはフルペーパー1本とショートペーパー3本、またはショートペーパー5本)なので、ちょっとだんだん厳しい領域。