全員で一緒にするとおもしろい

朝6時に起きて情報理論の試験問題を作成。泥縄であるが……。来年は持ち込みを禁止にして問題の量を減らしたい(持ち込み可にするといろいろ出せるのだが、採点が大変)。

午前中の試験を終え、午後から深層学習勉強会と機械翻訳勉強会の進捗報告。

深層学習グループは、実際に実装に取りかかっている学生が1人しかいないので深いい話ができないが、毎回サーベイ内容について教えてもらえるので、勉強になる。みんな実装力はあるので、タスクをうまく設定すれば、結果が出そうではある。

なにをどのようにするか、が問題だが、ある程度類似する手法を、それぞれ異なるタスクに適用し、それらでおもしろいことが分かれば楽しいだろうなー。NAIST 松本研でも、黄金時代を支えた手法として当時登場して流行し始めた SVM があり、SVM 勉強会を開催してみんなで勉強し、学生がそれぞれ違うタスク(現在 Google の N 川さんが形態素解析、JX 通信社の D 山さんが固有表現認識、Google の K 藤 さんが係り受け解析、東工大の T 村さんが文書分類、など)に適用してうまくいった、というエピソードをよく話されていて、こういうサイクルができると大きい。

自分も、助教になってから関わった言語教育勉強会も、Lang-8 からの言語学習者コーパスのマイニングが予想以上に効果があり、それぞれの学生が異なる言語・タスクに取り組んでくれて、いずれも成果があったし、何より当時最大の20人近くの研究グループになり、みんなで勉強会をするのは楽しい経験で、そういう時期がどの研究室(教員)にもあるのだろう。

うちの研究室もとりあえず deep learning に興味のある学生が多いので、いろんなタスクにそれぞれ適用してみて、知見を研究室内で蓄積していければ嬉しい。

機械翻訳グループは逆に、毎回実験に関する報告をしてもらえるのだが、誰もほとんどサーベイをしていないので、こちらはどうなることやら……。機械翻訳ほど、ちゃんとサーベイしないといけない分野はないと思うのだが、ワークショップベースで動いているとこうなるのも仕方ない気もする。フォーカスを絞って、その中だけはちゃんと読む、というようなことをしないとだめかな?

夜は国際会議の原稿の添削。まだ終わりが見えない……。