大学の中でハードに揉んでおく

朝6時に起きてメール処理。朝に仕事ができると(少なくともメールが溜まらないので)調子がいい。

午前中は古典論文紹介で以下の論文を紹介してもらう。

  • Amittai Axelrod, Xiaodong He, Jianfeng Gao. Domain Adaptation via Pseudo In-Domain Data Selection. EMNLP 2011.

これは(統計的)機械翻訳の分野適応をするという話で、クロスエントロピーを使ってデータ選択をするという手法。単純な割に効果はかなりあるので、いい話である。ただ、論文が読みにくいし、実験結果に若干の疑問が残る。ソースとターゲットと両方使うのがいいのか、それともソースだけ使うのがいいのか、という問題、両方使う方がいいんだろうが、ソースだけ使うのでうまく行く理由がよく分からない(あと、dev はよくなるのに test がよくならない理由も、単に過学習というだけでは説明できない)。評価を BLEU でやっているからかなぁ。

午後は研究会。まず ACL Student Research Workshop の発表練習。研究室の中でもいろいろコメントがあり、練習の甲斐がある。NAIST 松本研にいたときも、共著者(指導教員)からのツッコミが一番厳しくて、次に厳しいのは研究室の内部でのコメントで、学会に行ってもらうコメントは優しい、とみんな口を揃えて言っていて、うちも研究室内のコメントがもっとも厳しいような環境にしたいと思っている。

チュートリアルは以下の3点。

NumPy と Chainer のチュートリアルは去年もあったのだが、新入生向けのチュートリアルなので新入生は初めて聞く内容も多いのではないかな。正則化は今年新しい話だったので、いくつか質疑応答もあり、理解が深まったのではないかと思う。しかしチュートリアルに関しては、研究室の中でやるより講義室を借りたほうがよさそうな気がしている。後期にどうするか考えておこう。