緩急をつけて読むまで丁寧に

午前中はアルゴリズム演習。授業の教室が教員の ID カードがないと開かないので、教務課経由で自動解錠の設定をしてもらったのだが、有効になっていないようだった。確かに有効にしたそうだが、次回確認してもらうことに。なんでだろうなぁ……。

授業自体はプログラミングのできる学生が周囲の学生に教えてあげたりしていて、いい感じの循環ができている。1学年50-60人なので、その年の学年のカラーにもよるのだが、こういう授業を低学年のうちからもっとできるといいんだけどな〜。(「オートマトンと言語理論」の授業ではなかなかこうはいかない)

午後は ACL 2016 読み会。1人発表15分、質疑5分のつもりだが、なかなかこの時間では終わらず30分はかかる。多読のために国際会議の読み会をしているのだが、緩急をつけて重要なところはじっくり読む機会も必要なのである。関連研究をしっかり踏まえて読まないと紹介する論文だけを読んでも説明できなかったり、あるいは数式や擬似コードを読み解くときこの関数は何を受け取って何を返すのか、といったような基本的な読み方だが、ただ「読んで」と言ってもなかなかそうは読めないので、こうやって寺子屋形式で論文読解に付き合うのである。

もっとも、他人の論文紹介もしっかり聞いている人は、自分以外の論文紹介も肥やしにできるので、自分の論文紹介しか真剣に聞かない人と比べて10倍から20倍くらい研究力の差が開いてしまうのだが、こればかりは勉強が好きかどうかにもよるので、強制はしていない。(論文紹介は原則全員参加にしているが、出席を取っているわけではないし、出席して他のことをしていたり寝ていたりしていても、特に咎めたりするわけでもない)

今日紹介してもらった中では

  • Luong and Manning. Achieving Open Vocabulary Neural Machine Translation with Hybrid Word-Character Models. ACL 2016.

がおもしろかった。ニューラル機械翻訳で、未知語の処理のために未知語は文字モデルで処理するという手法で、全部文字ベースでやると訓練に3ヶ月かかるという数字もびっくりしたが、分けることでいいとこ取りができるというのは納得(あとで知るが、他にもたくさん文字ベースや単語と文字の間のモデルがあるのだが)。しかし気になるのはやはり単語の境界が自明ではない日本語や中国語、タイ語のようなケースで、これらはハイブリッドにするのは無理だから、最初から文字ベースとなるような手法、あるいは単語の境界を自動的に獲得するような手法でないと対応できないのではないかな。

夕方は研究会として、研究室でやっている共同研究の紹介をしてもらう(3件)。やはり複数年やらせてもらえると(あとがっつり組んでやらせてもらえると)紹介できる内容もあり、対外発表につながることもあるし、ありがたく思う(今回紹介した共同研究3件のうち、2件は査読付き国際会議に採録された)。研究費というより研究に関するインプットをもらえることの方が今は重要に思う。(研究に適宜コメントやアドバイスをいただけるのがありがたい)