10年で使う手法が様変わり

午前6時から1時間メール処理。土曜日に仕事ができると週上げがだいぶ楽。

朝9時から拡大学部教務委員会。少しずつ重たい仕事が増えている……。

午前中は古典論文紹介。以下の論文を紹介してもらう。

  • Yulia Tsvetkov, Shuly Wintner. Extraction of Multi-word Expressions from Small Parallel Corpora. COLING 2010.

相互情報量を用いて対訳コーパスから複単語表現(MWE)を抽出するという、古き良き時代の自然言語処理の研究っぽい。筆頭著者の Yulia Tsvetkov さんはいま CMU でニューラル手法の研究をバリバリやっていることを考えると、たった10年弱なのにかなり隔世の感がある。自分も10年前にタイムトラベルして、10年後には自然言語処理ではみんなニューラルネットワークを使っている、と言っても絶対自分は信じなかっただろうと思うが……(10年前は D2 で、オンライン学習で大規模データを扱える、実装が簡単などという利点からパーセプトロンを使っている人はいても、今のように猫も杓子も深層学習、みたいな感じではなかった)

午後は2時間ほどメール処理をしてから国際会議の原稿を1時間ほど添削したあと、南大沢に移動して B1 の基礎ゼミナール。連休中の宿題として連休明けの次の授業でビブリオバトルをするから本を選んでおいて、と伝えておいたら、今日だと思って準備していた学生が複数いたようで、申し訳なかった。今回の基礎ゼミナールは他人に対して何かを説明する、というスキルの訓練をひたすらしてもらうつもりで構成している。ライティングのトレーニングに使える時間が少ないが、これは仕方ないかなぁ。