年末になると壊れる RAID かな

水曜日はお昼から出勤。上の子を朝に保育園に連れて行ったあと、1回自宅に帰ってきて、1-2時間してから出勤するのである。フロー的にはそのまま出勤した方が楽だし、一度帰ってくるのに使う時間で他の日の仕事を減らした方がいいと思うのだが、妻の希望によりこのようになっている。

昼から出勤して、オンライン会議。来年どこの国際会議に投稿するか、という話と、博士論文の話をしたりする。この日記でも書いたことがあるが、自分が修士から博士に進学するとき、NTT コミュニケーション科学基礎研究所(CS研)の永田さんとお話しする機会があり、「小町さん、博士ではどんな仕事をするのですか?」と聞かれて、当時の自分的には博士論文にと思ったネタをお話しして意見をもらったところ「おもしろそうですね。ACL(自然言語処理のトップカンファレンス)くらい通りそうですね。で、博士論文はどういうことをしたいんですか?」と返されて虚をつかれたことがある。

今ではその意図はよく分かり、博士論文はジャーナルあるいは国際会議のフルペーパー換算で3本分くらいのボリュームがあるものなので、ACL 1本分のネタだと全然足りず、合計3本分の(関連して1本の博士論文にまとめることができる)ネタが必要なのである。ただ、そのときは(それ以降も、准教授になるくらいまでは)意味が分からず、ACL 通るネタならいいんじゃないか? と思っていたもので、赤面するばかりである。なので、最近は博士後期課程に進学希望の学生には、博士後期課程の受験の際に「フルペーパー2-3本分の内容を考えてください」と明示的に伝えることにしている。

午後はサーバ管理。どうも GPU サーバ1台の調子が悪く、RAID 5 を組んでいる6台の HDD のうち2台が壊れてしまったので、その復旧作業。1台は完全に死んでいて、もう1台は死にかけ(SMART エラーが出ているが、RAID 的には1台だけが死んでいるように見えている)で、タイミングが悪く新しい HDD も手元にないので、なんとかデータを復旧できないかと試行錯誤。結局 HDD を新しいのに入れ替えてリビルドしたりというのを先週からやっているのだが、リビルドしては xfs_repair などとしてもどうにも直すことができず、mount -o ro,norecovery でマウントすることだけはできたので(ジャーナル機能があるので mount -o ro だけではジャーナルの書き込みが発生してマウントできない)、なんとかこれでデータを救出することに。しかし GbE ではなく 100 Mbps でネットワークが遅いので、6TB のデータのコピーに1週間くらいかかりそう。RAID だけでなくバックアップも取っていれば、というのはその通りなのだが、大規模ファイル置き場はサーバ1台あたり 10TB くらいずつあり、/home のようにバックアップを取る領域とバックアップを取らない領域を分けて運用している。まあ、本当は全部クラウド化して、サーバ管理業務は全部外に出すのが正解なのだろうけど。

夕方は研究会。研究室の年内のセミファイナルで、修士論文の進捗を聞いたりなんだりする。あと、Kaggle Days Tokyo というイベントに参加した学生(B4)がいたので、その報告を聞いたり。Kaggle Days Tokyo で NAIST 松本研の卒業生とランチをした、と聞いたが、誰かと思えば fransisco-s くんだった。彼は乾グループ所属だったので、自分はあまり研究的なつながりはないのだが、至る所に松本研関係者がいるなーと思う。うちも将来至る所に首都大(都立大)関係者がいるなーと思われるようになりたいものである。

夜は研究室メンバーは忘年会に行ったようだが自分は帰宅。今年度から来年度にかけてはほとんど出歩けないのであるが、これはこれで仕方ない。言語処理学会年次大会も、茨城大学開催であるが、全日不参加の予定である(学生は10人以上参加するのだが)。