若手なら年一回は出せるはず

午前6時からメール処理。朝はエアコンをつけておくと娘が7時過ぎまで寝てくれるので、その隙に仕事をしておくのである。7月に入ってから保育園でも毎日プールなので、夜は疲れてぐっすり寝てくれるのである(あまり昼寝をしてくれないらしいが)。

今日は補佐員さんがいらしてくださる日なので、一気に業務を片付ける。今日はたくさん仕事があったので、研究室でお仕事をしていただいたり(直接やり取りすることが多いので、いつもは自分の居室で仕事をしてくださっている)。書類の束を事務室に持っていったところ、職員の方から「数がありえない」と言われたそうだが、1ヶ月分をまとめて出しているせいだとはいえ、学生が20人もいると書類もたくさん書かないといけないのである。

たぶん、他のコース(たとえば航空)の方々は、数千万円の実験器具を購入したり、という事務仕事が多いのだろうが、情報系は人件費と旅費が主な研究費の使用用途で、単価が小さいかわりに数が多い、という構造をしていて、こればかりは諦めていただく他ないと思う。器具を購入するのが研究の一環、という分野もあれば、出張でどこかに行くのが研究の一環、という分野もある、ということ。国際会議で発表するのが主な研究業績、という文化も、なかなか分かってもらえなさそうだが……。

午前中は来週開催の国際会議の発表練習。共著者の方々に揉んでいただいたおかげで、かなりスライドが分かりやすくなっている。自分はほとんどペースメーカーというか、細かいところをコメントするのが主な役目で(しかも、一般人の感覚からは相当細かいが、研究者スタンダードで言うと、実はそんなに細かくない)、適切に教員を活用してもらっていて、すばらしい。こちらから督促しないといけない人と、逆に学生から適切なタイミングで相談してくる人がいて、学生は練習期間なのでどちらでもいいと言えばどちらでもいいのだが、できるだけ前者を後者に近づけていきたいものである。(だいたい、1回一緒に対外発表すると、なんとなくサイクルが分かってくるようだけど、自分自身コツがつかめたのは助教になってからなので、人のことは言えない)

午後は研究会で、NLP 若手の会シンポジウム(YANS)で発表したい人の進捗報告。[twitter:@moguranosenshi] くん率いる読解支援勉強会グループはD/B4の全員が発表で、それ以外はM1が1人(進捗状況によっては発表しない)、という寒い状況。いくらなんでも修士の学生の発表が(14人もいるのに)1人というのは少なすぎるので、こちらから指名して発表してもらおうかな。去年は研究室メンバー全員で参加したので様子も分かっているだろうし、それで発表しないということは、参加したくないということかもしれないので、無理強いもできないけど……。

夕方は論文紹介。

  • Neubig et al. An Unsupervised Model for Joint Phrase Alignment and Extraction. ACL 2011.

を紹介してもらう。17時になってしまい途中で退席したので詳しく分からないが、(普通は2段階に分けてやる)フレーズの対応と抽出を同時にやる、という話のようだ。最初にこのあたりのことをやっている研究は2001-2002年くらいまで遡るが、その当時は計算機的な環境のせいで、遅くて精度もよくなかったので、パイプライン的に分けてやるのが主流だったが、その後計算機が高速・大容量になり、フレーズ抽出にも制約をかけて計算量を減らす試みが成功したりして、現在に至る、という流れである。

機械翻訳は前提とする知識が多く、かつ英語力(論文数が膨大)と数学力(教師あり、教師なし両方)と実装力(高速・省メモリ・並列処理)も要求されるので、なかなか研究テーマにしにくいのが難点である。研究グループとして毎年2人くらい新人が来て定着するのであれば、なんとかなりそうな気もしているが、問題は、継続的に研究テーマとして取り組む学生がいるかどうか、だが……。