公開の期末評価が口頭に

今日も在宅勤務で、午前中は論文紹介。以下の論文を紹介してもらう。

  • Mengzhou Xia, Xiang Kong, Antonios Anastasopoulos, Graham Neubig . Generalized Data Augmentation for Low-Resource Translation. ACL 2019.

これは言語資源が豊富ではない言語対で機械翻訳をするという設定で、データ増強をどのようにするか、というお話。言語資源がたくさんあって言語的にも似ている言語をピボットにして、教師なしニューラル機械翻訳の手法を使いながら翻訳する、というアプローチで、それ自身はよい手法だと思うのだが、低リソースの言語対で翻訳するときそのような言語が存在する、という仮定があまり "Generalized" ではないのでは、という議論があり、確かにそうだなと思う。あと、言語的に似ているのでうまくいく、というのは語彙が共通している(cognate など)のでうまくいく手法になっているのではないかという気がしている。最近興味あるのは統語的な転移学習で、語彙を超えたところで何が転移されているのかが知りたい(色々な実験結果を総合すると、文くらいの粒度の情報も、少しは転移できているのではないかと思うのだが)。

昼からは研究室の全体ゼミ(研究会)。今日は M1/M2 の学生の公開期末評価の発表練習である。修士と博士の大学院生は、半年に1回複数の研究グループをまとめて公開の進捗報告をしているのである。

2年前まではグループごとの口頭発表だったのを去年は全体で合同のポスター発表に変更し、かなり楽になった(日程調整の手間がグループ単位ではなく全体になったので、大学院教務委員の負担だけになった)のだが、今年は生憎新型コロナウイルスの影響でまたグループごとの(オンライン)口頭発表に戻ってしまった。これ、絶対ポスター発表の方がいいと思うし、後期はせめてもっとインタラクティブな発表にできないものかだろうか(今回は発表8分 QA 4分だが、発表4分 QA 8分でもいいような?)。

結局10人以上の発表練習をしていると、3時間以上を発表練習に使い、結構疲れる。とはいえ、以前は研究室全体では発表練習をしておらず、M1 ごと、あるいは M2 ごとに発表練習をしていて、発表スキルの全体での共有や、研究内容についての情報共有ができていなかったのが、今は少なくとも誰がどんな研究をしているのかは半年に1回は同期することができるようになったので、このようにやる意味はあると感じている。