直感に反していてもそれが真

午前中は最後の NAACL 2018 読み会。

  • Xin Wang, Yuan-Fang Wang, William Yang Wang. Watch, Listen and Describe: Globally and Locally Aligned Cross-Modal Attentions for Video Captioning. NAACL 2018.

今回ももはや内容が思い出せないので学生のスライドを見てほしいが、最近マルチモーダルに興味があって毎年1-2名の学生がやっていて、画像の情報を入れたら言語処理もよくなるのではないか、と直感的に思うのだが、やってみると一筋縄ではいかない、ということの繰り返し。語義曖昧性解消をしたら統計的機械翻訳の精度が上がるのでは、と思ってみんな挑戦するのに、ことごとく結果はネガティブ(直感に反する)、というのに似た何かを感じる。人間が生成する言語(離散的な記号)と画像(連続的なパターン)の相性が悪い(言語がかなり歪んだ入出力)のだろうが、どちらかに寄せて処理したら解決するのかな。

夏休み明けには ACL 2018 読み会、COLING 2018 読み会、EMNLP 2018 読み会を予定している。もっと自然言語処理以外の論文も読んだ方がよいのだが、研究室の体制的に難しいかなあ。スタッフが複数いる研究室だと、オーバーラップしつつも違う部分もあるような運営ができるのだが、教員1人だと自分で興味を変えていかないといけないので難しい。博士後期課程の学生くらいのシニアな学生が、新しい分野を開拓してくれることに期待(他力本願)。

午後は大学院の公開期末評価の発表練習の合間を縫って、共同研究のミーティング。とにかく時間がない。

夕方は共同研究先の方々と懇親会。自分の時間が遅いのは困るということで、早めの時間(お店によってはまだ開いていない時間帯に開けてもらって)に開催してくださるので、いつもありがたい。