誤りが伝播するってそれ本当?

午前中は B2 データ構造とアルゴリズムの授業。ソートの話なのだが、B1 の授業もソートの内容なので若干混乱する。B1 の授業の方はソートのアルゴリズムを丁寧に追うのに対し、こちらは2回しか使えないのでかなり駆け足でやらざるを得ないが……

お昼からは論文紹介。EMNLP 2018 から。(スライド

  • Wu et al. Beyond Error Propagation in Neural Machine Translation: Characteristics of Language Also Matter. EMNLP 2018.

これはニューラル機械翻訳では(というかニューラル言語生成では)文頭から順番に単語を生成するので、どこかで間違えると誤りが伝播してしまうとまことしやかに伝えられているが、本当にそうですか、というのがリサーチクエスチョン。実際には言語の特徴(left-branching つまり head final か right-branching つまり head initial か)が関係しているようだ、という考察。ちょっと言語的な分析のところが弱い気がするが、ネットワーク構造をいじって精度がどうだとかいう論文よりはるかに読んでいて興味深いので、読みがいのある論文であった。

午後は研究会。インターンシップの参加報告3件と国立国語研究所(アルバイト先)の紹介、そして外部発表の発表練習と盛りだくさん。インターンシップの参加報告は毎年違う内容が聞けるので自分も楽しみである。今年は結局6人がインターンシップに行き、うち3人は研究室の紹介で3人は自ら応募したものである(研究室からの紹介でも、ちゃんと課題を課すような選考があった企業もある)。そろそろ海外の企業のインターンシップに行くような学生が出てきてほしいなと思ったりしているのだが(応募している学生はいるが、まだ通っていない)、やはり博士後期課程に進学するくらいでないと、海外のインターンシップはなかなか厳しい。

夕方は学部教務のお仕事で履修の手引き(情報科学科)を書いたり、TA の書類を準備したり。一つ一つは大きくないのだが、地味に時間を奪ってくる……