ワークスペースのバックアップ

木曜日研究室に行ったら kosuke-s くんがするすると寄ってきて「bean が止まったんですぅ……なんとかしてください」と涙目なのでなにかと聞いてみると、彼ががんばって実験していたデータが入っている bean という計算機が起動しなくなったらしい(ここまでは木曜日書いた)。今日ようやく時間が取れるので詳しく見てみることにした。

で、別の計算機(同じ型番のが4台ある)に HDD つないでみたところ、どうもシステムディスクが昇天したらしい。単に電源入れただけでそちらの計算機まで起動しなくなるので変だなあ、と思って耳をすますと「カツーン カツーン」という恐怖の音がシステムディスクからしているし……。どうやら1.5TB(750GB+750GB)のワークスペースは無事らしいので、データを生きている計算機にコピー。

ついでに HDD の増設作業もしてみたのだが、ケーブルが逆に挿さっていたり(どっちでも動くけどさ……)、使っているネジが間違っていたり(ミリネジの穴のところにインチネジのピッチのもので強引に留めていたり……)、なんとも言えない作業であった。

システムディスクにデータ置いていた人は復旧できなくなってしまったのだが、まだみんな研究そんな必死になっていない時期でよかった。12月から2月にかけてくらいにこんなことがあると悲惨。(一応念のために書いておくと、バックアップが取られる領域と取られない領域があって、ホームディレクトリやコーパス・辞書などの共通データ、そして一部のワークスペースは毎日バックアップされるのだが、巨大なデータを置いてあるところやほとんどのワークスペースはバックアップしているとディスク領域が足りないのでバックアップしていない。)

ワークスペースRAID 5 とか RAID 1+0 とかにしておいたほうがいいんだろうか。もっと根本的に分散ファイルシステムなんかを真剣に検討した方がいいのかもしれないけど。(と言うと noah-a さんに「9fs 使いましょう」と言われるのだけど……)