評価するデータをまずは用意する

午前中は情報抽出勉強会である。今回は見学者あり。冬季の受験を希望しているそうだが、正直冬季の受験は人数も読めないので厳しいところがある。夏季の合格者のうち、他大学進学で辞退する人の補欠募集的な感じで、何人辞退するかが年によって違うのである。うちの研究室を希望する人は、他の大学院を受ける場合でもかまわないので、夏季入試を受けてもらいたい(そもそも受験しようと思ったら夏季入試が終わっていた、という人もいて、そういう人は受かるのだが、夏季には他のところを受けて落ちてから他を探す、という人は、なぜか全員落ちる。合否とは関係ないはずだが……)。

午後は深層学習勉強会である。実験結果の報告が入ってきたりして、活発になってきている。これは来年の国際会議投稿シーズンには戦えそうである。現段階でもタスクが決まっていない人は、来年間に合うかどうかあやしいけど……。タスクが決まったら評価用のデータを用意する、というのが最初にやるべきことだと思う。自然言語処理では、手法の実装は数週間でも、データの用意や前処理で1ヶ月以上かかることが珍しくないのである。データを用意せず実装に入る人もいるけど、先に作らないとデータを作るモチベーションが湧かない人もいると思うので、あまり何度も言わないようになったが、うまくデータができなかった場合、実装をやり直すか捨てる羽目になるので、ちょっと心配。

夕方は論文誌(採録決定)の最終チェックと、国際会議の原稿の添削。首都大に来てから初の論文誌なので、感慨深い。とはいえ、強力な共著者がいてこその研究だったので、次はうちの学生と自分の2人での論文誌が出せればな、と思っている。これは来年度になりそう。

夜は保育園の全体会(保護者と保育者のミーティング)である。子どもたちの様子を保育者が説明してくれるのだが、1年間出席してみてようやく、なんとなく親の名前と子どもの名前が一致してきた。女の子は全員名前と顔が一致するのだが、3歳以上の男の子はもやもやとしていて、誰が誰だか分からない。名簿を見れば名前は分かるので、名前と顔のマッチングをすればいいのだが、なんで男の子だけ名前が覚えられないのだろう?(娘と遊んでくれないので、連絡帳に登場せず、イメージする気がないからだろうけど)