いつまでも届かぬメール待っていた

午前中は論文紹介に出る。以下の2本を紹介してもらう。両方博士の学生による紹介だったので、安定感がある。聞いていて勉強になるが、本来教員が出るべきは、まだ読み方をよく分かっていない学生の論文紹介に出て、ちゃんと読めていない場合に指摘してあげることのような気もする(1年半くらい研究室にいると、さすがに読めるようになってくるのだが)。

  • Mallinson et al. Paraphrasing Revisited with Neural Machine Translation. EACL 2017.
  • Specia et al. QuEst - A translation quality estimation framework. ACL 2013.

前者はこれまで統計的機械翻訳の枠組みで言い換え抽出を行なってきたところをニューラル機械翻訳を用いたらどうか、という話。そこそこアーキテクチャを工夫しないといけないようで、なるほどなと思う。ただ後半の実験に付け足し感があり(実験設定も微妙に違うし、古いし)、これ EMNLP か何かに一度落ちて EACL に来たのではなかろうか、と思ったりする。周遊翻訳を使って言い換えを取りたいときは確率の積を見るのがいいというのが take home message だろうか(そこそこ分量ないとちゃんと取れない気がするが)。

後者は機械翻訳の品質評価のお話。機械翻訳の自動評価は参照訳を用いて行うのがこれまで一般的だったが、参照訳を用意するのも大変だし、参照訳を作らなくても(入力の文と出力の文だけで)評価できると嬉しいよね、というのがここ数年のトレンドかと思っている。大前提として、システムは入力からかけ離れたおかしい翻訳は出さない、という紳士協定がある(そのため、参照訳を使わなくていい)と思うのだが、その前提が満たされるのであれば、そこそこいい評価はできるのではなかろうか。しかし問題はニューラル機械翻訳の評価で、これは出力だけ見ていても(なまじっか流暢なだけに)品質を推定するのは難しいのでは……。

お昼は研究安全倫理委員会のお仕事をする。なぜか GMail に転送しているメールがエラーになっていて(多分添付されているファイルのせい)、大学メールにログインして読んだりする。メール審議ではあるが審議案件がたくさんあるので、それなりに時間がかかる。自分は倫理委員会に申請したことは1回しかないが、今後は自然言語処理人工知能でも倫理委員会を通さないといけないような案件が増えてくるのではないかな。

夕方は進捗報告を聞く。研究アイデアの話から実装の話まで色々。現在のようにグループを分割して毎週1回1人あたり20〜30分の進捗を聞くというスタイル、研究室で進捗報告をする人数が10人強であれば最適だと思うのだが、進捗報告する人が20人いると最適ではない気がしてきている。かといってどうするのがいい、という対案があるわけではないのだが……。毎日ミーティングをする、というアイデアも考えてみたが、あまり研究と相性がよくないと思って実施していない。開発案件とは相性がいい気がするので、デモを集中開発する、みたいなイベントをするならやってみてもいいのだけど。