運営にかかる費用をどうするか

朝6時半から1時間ほどメール処理。

午前10時に学部長室に呼び出されて20分ほどミーティング。この会、自分が出る必要はあるのだろうか……(出ないより出た方がいいのは分かるのだが、そもそも出る必要がないというか開く必要のないミーティングのはずなのに)。

午前中は @forthshinji さんとミーティング+ランチ。やはり第一線で研究している人とディスカッションすると楽しい。自分も仕事の時間が週60時間くらいあればもっと研究に時間が使える(予算を獲得したり、少し手を動かしたりなんだり)と思うが、なかなかそうも言ってられないし、週40時間で今くらいのアウトプット(研究的にも、教育的にも)を出し続けるのが、いまの自分が取り組むべき内容であると考えている。

午後は 統計的音声合成変換と近年の発展 についてトークしていただく。中々自分が外にトークを聞きに行く時間が取れないので、こちらにどなたかがお越しいただけるときには無理のない範囲でトークをお願いしようと思っていて、今年度はこれが最初である。自然言語処理と音声情報処理は分野としては違うが、気にしないといけないところは似ていたりして、大いに参考になる。うちの研究室ではプロジェクトを立ち上げたりすることをしていない(学生が勝手に研究をして実験して論文を書くので、学生が卒業するとだいたいそのテーマごと消滅する)が、プロジェクトチームのようになっていると、継続感があってよい。

午後は機械翻訳グループの進捗報告を聞く。段々と計算機サーバをみんな使うようになってきているのだが、いま GPU もけっこう使われている一方で、明らかに足りないのはハードディスクで、数 TB の容量が1ヶ月くらいでなくなってしまうので、対応に苦慮。Google Drive が無制限に使えるので、少しずつデータを退避しているのだが、1ファイル 750GB まで(プラス1日の転送量の上限が750GB)という制約があるようで、split したりして置く必要があるのかなぁ。以前はコーパスが大規模データの大部分を占めていたと思うのだが、いまは深層学習のモデルファイル(中間結果)が占めている……。

夕方は共同研究のミーティングと懇親会。この共同研究は実際のデータと突き合わせて仕事ができるので、おもしろい。懇親会も早めの時間に設定させてもらって、さらに途中で抜けさせてもらったので、1時間ちょっと参加することができ、興味深いお話がたくさん聞けてよかった。競争的な大型研究費を取りにいく代わりに企業との共同研究や受託研究で研究室の運用費(今年度の予算の半分以上は学会の旅費と参加費)を捻出しているため、こういう企業の方々とのお付き合いは重要なお仕事だと思っている。研究費申請にかかるエフォート(研究計画書1本書くのはファーストオーサーで論文を1本書くのと同程度の負荷と言われている)を削ることで学生の論文を添削したりする時間を捻出しているので、今の環境に最適化するとこうなるかなぁと。