学生のコードはちゃんと管理する

朝、電車の乗り換え待ちでお店に入って少し時間を潰したのに、結局乗り逃してしまった(汗)30分くらいゆっくりするつもりでないと、慌ただしいなぁ。

出勤してひたすらメール処理。1日で100通増えたりして、いやもうこれは……という気分になる。とにかく溜まっている……。

お昼から進捗報告を聞くが、学生が何人も体調不良と聞き、心配になる。自分と同じ症状だろうか。

B4 の研究テーマが決まったこともあり、着々と進んでいるようだ。今年は(ニューラル)機械翻訳の研究をする B4 が3人いるので、基礎勉強も含めて特訓が始まっているみたい。しかし技術の進歩が速すぎるので、ものすごい勢いで(しかも常に)論文を読まないといけないのが大変そうである。M1 になるとまた少し時間ができるが、B4 のうちは(読んで書けるだけの基礎知識があるかどうかという問題もあるので)ほとんど時間がないのである。NLP 若手の会シンポジウムが9月3-5日に沖縄で開催されるそうなので、それに間に合うといいなぁ。研究テーマの決め方について、今年は去年と少し変えてみたのだが、やっぱり B4 が5人来ると多い(研究室最初の3年は4人の配属で、去年と今年は5人の配属)。同じコースの他の教員の方々がおっしゃっているように、(助教のいない研究室は)4人がちょうどいい気がしている。

進捗報告が3人で早く終わったので、学生の研究相談に乗る。タスクは割とクリアだと思うのだが、どのようにアノテーションに出すべきかが自明ではないのである。研究では、学生に考えてもらいたいと思っているので、こういう場合はこう、などとオプションをいくつか提示していつも自分で考えて決断してもらっているのだが、ここで選択の自由なく「こうこうだからこうやりましょう」と指示した方がいいのだろうか、と悩んだりする(指示するので、もちろん責任は教員にある前提)。

Chris Manning さんが日本に来てトークをしたとき、学生のコードはきっちり管理する、という話を聞いたことがあって(大学は学生に自由にやらせるイメージがあったので)意外だったが、論文は教員がしっかり面倒を見るのと同様、外に出す前提のデータセットやソフトウェアもしっかり面倒を見たほうがいいのかな、と思ったりする。まあ、そこまでコントロールするなら、B4 は2-3人でいいかな……。(改めて読み返すと非常に有益なことが書いてあった)