アイデアはデータ次第でお蔵入り

午前3時に起きて2時間ほど学会関係の仕事。正直この時期にこれはしんどい……。他の人でもできる仕事は積極的に他の人にお願いしたり、あるいはやらなくてもよさそうな仕事は意図的にやらないのであるが(そうでもしないと仕事が回らない。というか、そうしても回ってないけど)、引き受けると2時間以上かかる仕事は、自分にとっての重要性をもう一度検討するべきだと思った。

午前中は情報抽出勉強会。言語処理学会年次大会組で、年末年始に実験を回していた人たちの進捗を聞く。予想通りうまくいっているケースはいいのだが、予想通りにいってないとき、予想が正しくなかったのか、あるいはやり方のせいか分からないのが悩ましい。やり方については実装力との兼ね合いもあるので、さらに複雑である。結果がかんばしくなければ、お蔵入りにせざるを得ないのには変わりないが、あと少しで結果が出るところまで追い詰めているのか、あるいはブレイクスルーはまだ先か、という判断が難しいのである。

午後は深層学習勉強会。こちらはどうやってもあと1週間(5日間)では〆切に間に合いそうにない1件が投稿見送り。アイデアは悪くないと思うのだが、データの量に比べてモデルの自由度が高すぎて、ちゃんと学習できていないのではないか、という気がする(あるいは、使えるはずの教師データを捨てていることに起因)。最適化の仕方とも関係するのだが、実際に入手できるデータとモデルがマッチしていないと、いくらよさそうに見えても性能が出ないので、タスク自体を再検討するか、モデルをもっと簡素にする必要がありそうに思っている。

夕方は1時間ほどメール処理をするが、まだ全然追い付けない。これどうすればいいんだろうか……。