クリスマスイブに年内最後の進捗報告

今日は本来授業のない日(補講日)だが、先週のシンポジウム参加のために1日休講にせざるを得なかったので、情報工学アルゴリズム)演習の補講をする。クリスマスイブだからかなんなのか、参加者が少なく、50人の授業で20人強の出席率だろうか(そもそも出席を必須としていないので、毎回の参加も30人強だが)。

これまでの授業経験上、出席率が低ければ低いほど、やる気のある人が残るので教えやすいのだが、教えるのが困難な学生たちを相手に教えることも(というか、それこそ?)教育かと思うときもあり、逡巡する。ただ、娘が小さいうちはどうしても仕事に使える時間が少なくなってしまうので、申し訳ないがしばらくこのようなスタイル(出席しないことを選んだが、結局出席しないとついていけず、脱落してしまう学生が出てくることは必要悪として許容する)で続けさせてもらうかな……。結局語学と一緒でプログラミング言語も習熟度別にクラスを編成しないと、いちばんできない学生に合わせてしまいがちで、とても初歩的なことしか扱えなくなるし、せめて真ん中のボリュームゾーンに合わせた授業(発展的な課題も出す)ができればいいかなと……

昼から研究会。研究室メンバー全員の進捗報告である。だいたいみんな順調に進んでいるようで、一安心。学部生は全員卒論的には OK で、言語処理学会年次大会も発表できそうな雰囲気である(年末年始完全に何もしないと、卒論はともかく年次大会は厳しくなると思うので、実験あるいは原稿あるいはサーベイのいずれかは少しでもやっておいてほしいけど)。院生はインフルエンザで進捗報告できない学生を除き、2名が言語処理学会での発表希望だったが、1名は実装したベースラインに問題があるようなので発表を見送ることにし、もう1名はワークショップへの投稿も視野に入れて本会議に投稿する予定で準備する、ということでゴーサイン。

結局5〜6件(研究室メンバーの約半分)の発表になりそうで、松本研にいたときどれくらい発表していたっけ?と思って見返すと、2012年には8件発表、2013年には6件発表していたので、それと同程度の模様。添削する時間を考えると確かに8件くらいが限界かな?

夕方は問題のありそうなベースラインについてトラブルシュート。precision と recall を逆に報告していた、というのがおかしさに気づく発端だったのだが、正解ラベルの入っているのと違うデータで評価していたり(結果はシャッフルしているので、ほとんどランダムに出力しているのと同じ……)、実験の出力結果を見れば一目でわかるので、数字のみを見るのではなく、ちゃんと出力を確認するよう伝える。数字が上がったとか下がったとかに一喜一憂しがちなのはみんな同じだが、そこで実例を見に行くかどうかで、ちゃんと教育を受けたかどうかが違うのだ(独学でも、実例をしっかり見る人もいるけど)。

結局本来ベースラインであったと思われるものを確認してみると、今回のタスクに合わないということが判明し、ストーリーから考え直しになる(いずれにせよ、言語処理学会年次大会は見送り)。研究ではこういう手戻りがしょっちゅう発生するので、手の動く速度が速ければ速いほど有利なのである。逆に言うと、手の動く速度が遅いと、たまたま実装したものがうまくいけば研究になるが、そうでないと取り返しがつかない状況に追い込まれるので、できるだけ早くから動いてその危険性を減らしておくか、幸運を祈願するくらいしかないのではなかろうか……(もっとも、どんな困難に直面しても、なんとか論文という形にまとめるのが、アマチュアではないプロの研究者のスキルだと思うので、最高の食材があれば完璧なフルコースが作れるのは当然なので、不完全でも手元にあるものでおいしく料理する、というのも必要な能力ではある。)