実際のデータを見ずに進めない

午前2時半に起きたので、言語処理学会年次大会の原稿チェック。第3稿である。まだ結果が埋まっていない人もいるので少し心配だが、結果が埋まっていない段階から見ておかないと、最後時間がなくて添削できないので、早目に準備してもらっているのである。第3稿まで来るとチェックにすごく時間がかかるわけではなく、1時間で3人分見られるのだが、10人以上いるとそれでも4時間かかるので、1日では終わらず、数日に分割(1日に2時間を限度としている)。

午前中、言語学習支援勉強会のアドバイザーを残りの年度内は [twitter:@moguranosenshi] くんに託したのだが、まだ帰省中ということで今日まで小町が担当することに。間が悪い。

お昼は B3 の人の研究相談。授業の一環で論文を書いているのだが、彼女はまだ他の授業も取っているので、自分の予定と AND を取ると昼休みしか都合がつかないのである。M1 の2人が論文の添削やプログラムのデバッグLaTeX の指導などいろいろ面倒を見てくれて助かっている。B3/B4 の人に「メンター」をつけるのはよいなと思った。研究的に面倒を見てくれる人と、それ以外の相談ができる人は、分けた方がいいのか、それとも同じでいいのか、悩ましいが……。

午後は機械翻訳勉強会。新しく来たサーバで Chainer を動かすとある人だけプログラムがハングする、という現象があるようなのだが、どうも勝手に GPU がオンになり、GPU(/dev/nvidiactl)にアクセスするとフリーズするようなのだ。strace すると、このデバイスファイルを open するところで死んでいて、自分も昨年末にこれを確認していた(納入直後は使えたのだが、RAID の設定をしてからなぜか GPU が使えなくなった)のだが、解決策が分からず、業者に問い合わせ。論文投稿シーズンなので、おいそれと止めることができず、とりあえず GPU は忘れて CPU で使ってもらうしかないが(汗)

実験に関して、論文を読まないよりは読んだ方がよく、最近は論文を読む学生も多いのは素晴らしいのだが、アイデアを思いついたら次はデータを見てほしい。アイデアがおもしろくてもデータがどうなっているかは別問題だし、データが予想(期待)と違うとうまくいかないわけのである。データを見るのが嫌な学生も少なくないのだが、どうしても見たくない人は自然言語処理はあまり向いていないと思うので(こればかりは、仕方ない)、機械学習的なテーマの方がいいのかな、と思ったりする。機械学習でもエラー分析すると実データを見るわけだけど……。