サーベイをちゃんとしないと落とされる

午前5時に起きて2時間ほどメール処理をしたり、研究室のウェブサイトを更新したり。受験の問い合わせが増えてきて、もう定員に達したので受け入れない旨を追記したりする。

午前中は古典論文紹介。以下を紹介してもらう。

Joshua S. Albrecht and Rebecca Hwa. Regression for Sentence-Level MT Evaluation with Pseudo References. ACL 2007.

これは擬似参照訳を用いて機械翻訳の自動評価を行うという研究だが、去年からうちの研究室で @microkoke くんが（回帰のタスクではないが、それ以外はほぼ同一の手法で）取り組んでいた手法で、国際会議に投稿したところ、過去にほとんど同じものがある（ので新規性がないのでリジェクトする）と査読者に教えてもらった研究である。実際読んでみると確かにほぼ同じで、これは新規性なしと言われても仕方ない。ただ、10年以上前に思いついていれば ACL にフルペーパーが通っていたネタを独立に思いついたのは偉いと思う。この論文があることを知ると、確かにウェブ検索するとすぐ見つかることは分かるのだが、こういう研究をスッと出せるかどうかが専門性なのかなと思ったりする。

結局、我々はこれを改良した手法を WMT 2019 の機械翻訳評価タスクに出すことにした。ACL のフルペーパーに通るほどではないが、改善としては良好な結果を得ているし、着眼点は悪くない。最初に研究をしていたとき、アイデアが被っているとそれだけでアウトなので、十分サーベイしてほしい、と何回か念を押したのだが、自分たちでは先行研究を探し切れていなかったのが無念。ACL にそのものズバリのタイトルの論文があるとすると、これを知らないというのは言い訳できないし、こういうアイデア一発の研究はちゃんと自分も時間を取ってサーベイすべきだと思った（ときどきランダムに見かけた・思い出したものは、「これ関係あるかもしれないから調べてみて」とメールしたり、進捗報告のときに口頭で伝えたりして教えたりしているのだが）。

午後は共同研究のミーティング。色々事務的な手続きのためにミーティングがリスケジュールされてきたが、ようやく新年度になってスタートできた。話してみるといろいろできそうなことがありそうで、これをどう研究にしていくかが腕の見せ所になりそう。