研究をちゃんと仕上げていくために

午前中は出勤して ACL 2019 読み会。3本紹介してもらったが、以下の論文が一番よかったかな。(スライド

  • John Wieting, Taylor Berg-Kirkpatrick, Kevin Gimpel, Graham Neubig. Beyond BLEU: Training Neural Machine Translation with Semantic Similarity. ACL 2019.

機械翻訳の学習をするとき、参照訳との意味的な類似度(言い換えかどうか)を使って学習するとよい、という話なのだが、ちょうどこの論文を紹介してくれた @microkoke くんも今年の WMT の Metrics タスクで意味的な類似度(言い換えかどうかの判定)を使った機械翻訳の評価手法の研究をしていたので、やりたいことは一緒だった。こういうアイデアをちゃんと ACL に通すのがすごいと思うのだが、自分もこういう感じで論文を書きたいものである。

実は最初 NAACL 2019 に投稿して先行研究の調査不足によって不採択で、そこから手法的に新規性のある形にする、という展開で考えたのが、この論文のような参照訳との類似度を(いま風の深層学習に基づく手法で)取り入れる、というものだったので、あと1年早く取り組んで論文を書けるなら戦えそうなのだが、全体的に半年から1年遅いのでダメなのである(事実として遅いのは仕方ないのだが、何をどうすればここがスピードアップできるのかが分からない)。

昼は M2 の進捗報告を聞く。あまり時間がないので駆け足だった。論文誌に投稿していた論文が不採録で返ってきたので、査読コメントを見ながら方針を相談したりする。査読コメントを見ると「ちゃんと指導教員が指導するように」というような感じのメッセージで、内容というより体裁の部分にクリティカルな問題がいくつかあったりして申し訳ない感じである……(ベースとなる国際会議の論文が2本あり、そこから日本語の論文にしたのだが、時期的にこのタイミングで投稿しないと奨学金の返還免除に間に合わない、というので、細かく見ることができなかった)。

午後は南大沢に移動して B1 の人工知能・自然言語処理概論の授業。ニューラル機械翻訳入門を話したのだが、専門的な話だということで興味を持って聞いてくれる人と、専門的な話だから撃沈する人に分かれてしまった模様。情報科学科になってモチベーションの高い学生が来てくれるようになったとは思うのだが、研究・開発能力があるかどうかは来年度以降にならないと分からないなぁ……。

夕方は日野キャンパスに戻ってきて事務室でいろいろな手続きを済ませる。次大学に来るのは11月14日の予定で、2週間以上休むつもりなのである。長女のときは1週間休んだのだが、2週間出勤しないのは初めてで、NAIST の助教時代も2週間出勤しなかったのは退職前の(引っ越し等をしたり、東京で新生活の準備をしたりしていた)有給消化のときくらいだと思う。

帰る直前、サーバ室にいったん寄って SMART error が出ていた HDD を交換したりする。しばらく大学には来ないので、来ていないうちに RAID が死ぬと困るし。先週は突然ミラーラングをしていた HDD が数個一気に死亡して(5台の HDD でミラーリングしているのに、そのうち4個が立て続けに死亡)、これはおかしいと思ってサーバ室に駆け込んだら、サーバ室の蛍光灯の交換の養生のためにサーバにビニールがかけられていて、空気の循環機能がほぼ失われていて、ラックの上の方に熱がこもっていて死亡したようで、ビニールを外して再起動したら復活した。本学の計算機環境は極めて劣悪であると思うのだが、個々の研究室でいくら頑張っても全学的には計算機の重要性が理解されていないので、突然こういう対応をされたりするのである(前は勝手にうちの研究室のサーバの IP アドレスを他の研究室が使って IP アドレスが重複してサーバが使えなくなったりする事件もあったが)。