着実な研究をする積み重ね

午前中は論文紹介を聞く。研究テーマを追いかけていると、今年のこのグループの研究成果はこれ、みたいな論文があったりして、地道に着実に研究しているなぁ、と思ったり。最近ようやく自分がどういう研究がしたいのかが分かってきたのであるが、今の研究室のスタイルでそれを実現するにはどうすればいいか、ということを考えないといけない(ほぼ分かっているが)。

興味深かったのは以下の論文。スライド

  • Po-Yao Huang, Junjie Hu, Xiaojun Chang and Alexander Hauptmann. Unsupervised Multimodal Neural Machine Translation with Pseudo Visual Pivoting. ACL 2020.

これは教師なしにマルチモーダル機械翻訳(画像キャプションの翻訳)をするというものであるが、画像をうまく使って教師なし機械翻訳の性能を向上させている。結果も教師なし機械翻訳にしてはかなりよい。ただ一つ注意点があって、encoder-decoder モデルは(対訳コーパスは使われていないものの、大規模データで)事前学習されているので、Multi30K だけ使っている他の研究と素直に比較してよいかは微妙。この研究だけではないが、うちの研究室でも文法誤り訂正に BART を用いた encoder-decoder モデルの初期化を行っていて、複数の言語で有効性を確認しており、かなり効くという印象(しかし MASS で初期化してもそんなに効かなかったのだが、何でかはよく分からない)。

昼からは研究会(研究室の全体ゼミ)。今週はチュートリアルが3件で、Docker の使い方、Amazon Mechanical Turk の使い方、そして量子コンピューティングに関するチュートリアルがあった。内容は全くコントロールしていないのだが、プラクティカルな内容もそうでない内容もあって、割とおもしろい。研究室では Docker を使う人が少しずつ増えてきた印象だが、去年の大学院の講義で Docker 使ってもらった効果、あったかな。

午後は共同研究のミーティング。実験が間に合うかどうか不明で少し心配だったが、実験的には書けそうな内容が揃いつつあるので一安心。あとは執筆が間に合うかどうかだが……。

夕方は博士前期課程の受験希望者と Google Meet で面談。今年は面談する前に研究計画書を出してもらうことにしているので、その点での話は割とスムーズ。しかしうちの研究室は(内部進学生が毎年3-5人いて)ほとんど外部受験生を取ることができないので、どう調整すればいいのか本当に難しい。