研究は相談すれば倍進む

午前中は古典論文紹介で以下の論文を紹介してもらう。

  • Alla Rozovskaya and Dan Roth. Training Paradigms for Correcting Errors in Grammar and Usage. NAACL 2010.

文法誤り訂正を教師あり学習で解きたいとき、擬似的に言語学習者の書いたデータを生成して学習に使うことがあるが、その場合は言語学習者の実際の誤り方を考慮した方がいい、という内容。その後自分たちも Lang-8 を用いて何度も同じ現象を確認しているので、確かに古典として押さえるべき論文である。

入れ方に関しては、このあと現在は NICT の今村さんたちが Frustratingly Easy Domain Adaptation を使えば入れる割合はあまり気にしなくていい、ということが ACL 2012 で示された他、うちの研究室でも深層学習で文法誤り訂正をするなら単語分散表現の学習に使えばいい、ということを IJCNLP 2017 で報告したので、リソースとしては言語学習者の誤りパターンは確実に有用なのだが、使い方は考えないとその有効性が発揮できないようである。まあ、今やるなら(深層)強化学習ではないかな……。

午後は研究会。なんとなく全員、うちの研究室に来てからの年表的なもの(この時期は基礎勉強会をしていたとか、この時期はインターンシップだったとか、ここでは国際会議の原稿を書いていたとか)を発表の最初に自己紹介としてつけてくれているのだが、それを見ると「確かにみんなもう1年(なり2年なり)経ったんだなぁ」と、しみじみ感慨深いものがある。これ、割と新入生向けに重要な情報だと思うので、来年度は全員にまとめてもらうようにしてもらおう。

かれこれ研究室も6年目になり、どういうケースで研究が停滞するのかはほぼ分かるようになったのだが、それを防ぐ方法がよく分かっていない。研究が停滞するのはほぼ100%周りと相談していないことに起因するのだが、そもそもメンターがいないので相談できないというケースと、メンターをつけているのに相談しないというケースがあり、後者は(相性の問題はあると思うが、それを除けば)本人の問題で、そういう人はうちの研究室に来ない方が全員のためだと思うのだが、前者は研究室運営システム上の問題なので、今年度は博士後期課程に進学希望の外部受験生および博士後期課程の学生にも、本人の希望を聞いてメンターをつけることにした。

ちなみに、うちの研究室だとメンターがついている人(学部生は全員、それ以外は一部)は半数以上が(メンターや教員、共同研究等でアイデアを出したテーマで)査読付き国際会議で発表しているし、逆にメンターがついていない人はほぼ査読付き国際会議では発表できていないので、うちの環境とメンター制度はかなり密接に結びついており、メンターを必要としない人はそもそもうち以外(東大や東工大等)に進学すると思うし、うちに来ることにしたということは、メンターを必要としているように思っている。

博士後期課程に進学するつもりの人は、M1 で年次大会でどんな形でも発表して自然言語処理のコミュニティの雰囲気を見た方がいいと思うが、就職するつもりで大学院から専門を変えて来るなら、2年かけてしっかり研究した成果を NL 研あたりで発表する方がいい(発表も、必ずしも国際会議で発表しなくていいので、修士論文相当のものを M2 の年内に和文論文誌にきっちり出してほしい)と思う。