無い袖は振れないわけじゃないけれど

朝は共同研究のミーティング。研究内容の詳細の打ち合わせで、30分ほどで終了。これで先に進めるといいのだが……。希望する研究費をお伝えすると、どうも先方の想定予算の2倍ほどであったようで即決できなかったようだが、さすがに仕事量に応じて予算は変わるので、折り合いがつかなければまたの機会に、ということになりそう(汗)予算に合わせて内容を半分に(あるいは期間を2倍にして、今年度は最初の半分だけやる)ということもできるけど、事務手続きにかかる時間が馬鹿にならないし……。

午前中は少しだけ最先端 NLP 読み会に参加。

  • Ling et al. Finding Function in Form: Compositional Character Models for Open Vocabulary Word Representation. EMNLP 2015.

を紹介してもらう。文字から単語の表現を学習する、という話で、文字分散表現から双方向 LSTM で単語の分散表現を合成する。出てきた単語の分散表現をさらに LSTM に入れて言語モデルにしたり、品詞付与をしたりして評価。こういうのは当然できるよな、と思っていたが、実際英語、ポルトガル語カタルーニャ語屈折語)、デンマーク語、トルコ語膠着語)の両方でちゃんと動いているようでおもしろい。日本語だと単語の切れ目をどのように認識するか(文字から単語、複合語に至るまでの階層構造が扱えるか)、というのがチャレンジングだと思うが、こういうのをしっかり解決できるといいな。

午後はひたすら事務処理。今週の火曜日までは週に2回の実験があって死にそうなくらい忙しく、何もできなかったのだが、月末かつ明日は休みなので、今月やるべき紙の書類を淡々と始末。

合間に執筆中の書籍の担当者の方が見えたりして、こちらも遅れててすみませんと平謝り。年度内には終えたいのだが……。