午前中は共同研究のミーティング。COLING 2020 (自然言語処理分野のメジャーカンファレンスの一つ)の査読結果が返ってきていたので、査読コメントを見ながら今後の対応について議論したりする。
COLING 2020 には共著の論文を6本投稿していて、フルペーパー1本ショートペーパー2本の合計3本がアクセプト、そしてそれ以外のフルペーパー3本がリジェクトだった。内容的には文法誤り訂正に関する研究3本は全てアクセプト、機械翻訳に関する研究3本は全てリジェクトで、なかなか厳しいものがある(リジェクトされた論文でも、査読コメントは結構丁寧にくれているものも多い)。先日の AACL でも採択されたのは文法誤り訂正に関する2本だけだった(文法誤り訂正については、投稿したものは全部採択された)。機械翻訳で投稿していた3本のうち1本は WMT という機械翻訳の難関国際会議にも double submission で投稿していて、こちらは(査読者3人とも高評価で)アクセプトになっていたので、それはよかった。多大な貢献をしてくれた @kanekokaneko123 くんのツイートから引用。
COLINGに以下の論文が採択されました!
— kaneko (@kanekokaneko123) September 30, 2020
・Autoencoderを用いて単語分散表現を改善(主著)
・多言語文法誤り訂正 @yamyam_gori3
・文法誤り訂正における多様な出力(M2甫立)
・文法誤り訂正の自動評価 @microkoke
WMTにも以下の論文が採択されました!
・画像情報を用いた同時翻訳モデル @aijanit
ちなみにこの日記とか Twitter ではあまり内容について書かないのは(書いてほしいという人がいるのは理解しているし、書いた方が研究の宣伝にもなるというのは分かるのだが)、内容について書くのは実際に研究をした学生が書いた方がいいと思うので(本人の宣伝にもなるし)、自分は遠慮しているのである。あと、社会人博士を含めてうちの研究室の学生が筆頭著者として投稿していたのは全部で8本で、それも含めると8本中5本が採択されていたようであるが、研究室としても COLING なら安定して通せるようになってきた、ということで、少し自信がついてきた。
Hot off the press! #COLING2020 acceptance rates!!https://t.co/WWA68U4ANf pic.twitter.com/iUif6AJMzy
— COLING2020 (@coling2020) October 2, 2020
本当はショートペーパーではなくロングペーパーをもっと通したい(ショートペーパーは全部採択された)が、今回の文法誤り訂正の多様化の研究のように、〆切の2週間前から書き始めて(英文校正に出す時間もないが)採択される、というのはショートペーパーならではの気もするし、全てロングでないとダメ、とまでは言いにくい。ちなみにロングで通っていた文法誤り訂正で転移学習をする話(多言語文法誤り訂正)は自分も好きな話なので、ロングで採択されてよかった。
今後のことを言うと、ACL 系や EMNLP にも(特にフルペーパーを)安定的に通せるようになりたいのだが、これには大きく2つの方向性があり、
- 新規性が高く斬新でおもしろいテーマに挑戦する
- 独創性が高く他の追随を許さないテーマに取り組む
という感じかなと思っている。うちの研究室は環境的にどうしてもインクリメンタルな研究になりがちなのであるが、インクリメンタルに行くなら新規性で勝負するのではなく独創性で勝負したほうがよくて、自分たちのグループ以外にこんなことをやっている人たちは世界にほとんどいない、というような戦略にしたほうがよいだろうな、と思ったりしている。海外の PhD の学生なんかも、前の年の研究の続報、みたいな形で(タスク設定からデータ作成も含めて)毎年トップカンファレンスに通し、博士論文はそれらの集大成、みたいな学生が時々いるので、そういうスタイルもありかなと。新規性についても、こうやったらいいかな?と思うことはあり、去年から仕込んでいて、今年も続けているので、あと数年するとこれが良かったのかどうか分かってくるだろう。
10月1日になったので研究室の学生数を数えたところ、新しく研究生 1人とインターンシップ研修生2人が増えたので、32人の大所帯になった(ちなみに情報科学科の研究室あたりの平均学生数は14人弱)。NAIST 中村研や渡辺研より学生数多いのに、うちはスタッフ1人でカバーしているので、なかなかやりようが難しい。中村研・渡辺研とも、教員・スタッフは5人以上いるので、かなり手広く・手厚くできそうだが、1人だとどうしても分野的に手薄になったり、あるいは時間がかけられなかったりするので……。学生数が平均の2倍いるのだから、教員も2人ほしいところなのだが、本学的には大型外部予算を取ってきてポスドクを雇用しなさい、という雰囲気で、そういうことじゃないんだけどな、と思ったりする。まあ本学はお金があるわけじゃないので仕方ない。
夕方は共同研究のミーティング。そろそろ国際会議に向けて動き始めようというところだが、国際会議ごとにどういうテーマが好まれる、みたいなのは少しあるので(独自路線を行く COLING と LREC みたいなのは明らかに別として、*ACL 系と EMNLP はほとんど同じといえば同じなのだが、分野ごとにプログラム委員として誰が選ばれるか、みたいなので少し違ったり、ACL だけはやはり別格だったり)、投稿先の選択戦略について考えた方がいいかも。