研究のスタートをスムーズにすると後々効果が出てくる

午前中、2時間くらいひたすらメール処理。メール処理は大学でなくてもできるので、せっかく大学にいる時間を有意義に使いたいという気持ちもあるのだが、家に仕事を持ち帰りたくないので、だいたい毎日午前中にメールの返事を集中して行い、午後は固めて時間をかけないとできないことをしている感じ (必ずしも集中力が必要な仕事というわけではない)。

昼から研究会。今日から学生のひとりひとりの論文紹介と研究テーマの報告 (7月以降やりたいことの表明)。論文紹介では感情極性に関する論文を説明してくれたので、

などを紹介。今年も hirotsugu-e くんが感情推定に関する研究をしていたし、これはこれで興味深いのではあるが、辞書かコーパスかなにか、スタートするとっかかりがないと厳しいので……。

基礎勉強会では対話処理と談話処理について学ぶ。Emacs の中で M-x doctor をして対話するの、とても懐かしい (笑) つい人工無能うずらを紹介する。ブロセスサイズが1.5GBらしいが、相当な量のログを溜め込んでいるな〜。とりあえず大規模にデータを取得するところがこちらはスタートだと思うのだが、一朝一夕で対話のログが手に入るわけではないというのが悩ましいところ。あと、これもシステムを作るというところと研究というのとギャップがあるのも難しい。もし仮になにか作るにしても、企業で使うとなると対話内容が完全に制御できないのは困るだろうし、論文にはなりにくいがかといってプロダクトにもなりにくい、という微妙なところがなんともいえないところである。

夕方は共同研究関係の書類を埋めたり、予算計画を立てたり。50万円あったらどれくらいメモリが載った計算機が買えるのかを調べたりする (たぶん64GBは余裕で、恐らく128GBが厳しい)。いま研究室にある計算サーバ、メモリが16GBくらいしかないので、ちょっとした実験をしようとするとあっさり足りなくなると思われるため、なんとかもう少しメモリのある計算機を調達しておきたいのである (そもそも各人の Mac mini がメモリ8GBあるので、メモリを使わない計算ならローカルでやればよいし)。

夜はプログラミングチュートリアルの問題を解く。ギブスサンプリングを実装するのは初めてなのだが、チュートリアルの資料がよくできているのでほとんど紛れなく実装できる。しかしなぜか答えが合わない。コードを1行1行チェックして、おかしいところはないと思われるのだが、実装開始から2時間経ってもバグが直せなかったので断念。なんでだろ〜。(翌日見返したら5分で解決して、変数名の1文字のスペルミスだった……)