研究のアイデアだけはいい勝負

今日は NAACL 2018 読み会で3本の論文を紹介してもらう。その中で一番興味があったのは以下の論文。

  • Marcin Junczys-Dowmunt, Roman Grundkiewicz, Shubha Guha, Kenneth Heafield. Approaching Neural Grammatical Error Correction as a Low-Resource Machine Translation Task. NAACL 2018.

これは文法誤り訂正を機械翻訳タスクだとして解く話の発展で、ニューラル機械翻訳はデータ量が少ない(十万文あたりに分岐点)場合は統計的機械翻訳の方が精度が高いという事実が知られており、ニューラル文法誤り訂正も同様に単純に sequence-to-sequence の問題だと思ってやるとフレーズベースの統計的機械翻訳に及ばない、という研究があったのだが、言語資源が十分にない言語のニューラル機械翻訳で使われているような手法をいろいろ入れたら、ニューラル文法誤り訂正が最強になった、という話。

ちょうどうちも同じような目的意識で研究をしているので、ここで試されているようなことのうちのいくつかは去年から取り組んでいるのだが、なかなかうまくいっておらず、こうやってうまくいく設定を見ると、そうか、こうやらないといけなかったのか、と思ったりする。アイデアは間違っていなかったが、やり方が間違っていた、という(汗)しかしこれ、ポスドクレベルの人がやらないと、機械翻訳より文法誤り訂正はまだ研究の速度が遅いとはいえ、なかなかこのスピード感で研究するのは難しい。世界の最先端と比べると、半年から1年弱の遅れくらいだと思うのだが、ニューラルの世界は半年遅れでも致命傷なのである(英語で論文を読まない人は、そもそもスタートラインにすら立てない)。

午後はメールの処理をしつつ、教務委員会に出席。全学の教務委員会(学部教務委員長業務)に引き続き、基礎教育部会にも出て、そして教務委員会の打ち合わせ(学部教務委員長業務)。木曜日は委員会三昧である。

帰宅前に少しだけ時間を取って国際会議の原稿にコメント。自分がボトルネックになっていてはいけないのだが、時間を取るのが難しい……。投稿シーズンではないので、まだ余力がある方だとは思うけど。