週末に決まって止まるサーバたち

週明けなので、午前中はメール処理ばかり。

昼から深層学習勉強会の進捗報告。週末にサーバが止まっていたようだが(そのため進捗報告に影響が出るのだが)、これでこのサーバが止まるのは今月に入って2回目である。GPU サーバではないのだが、サーバのラックを変えた影響で熱がこもりやすくなっているのかもしれず、lm-sensors を入れて定期的に温度をチェックすることにしてみる。そんなに酷使しているわけでもないのだが、研究室に来た年に買ったので、CPU ファンが寿命だったりするのだろうか……(最初の2年間はサーバ2台を学生室に置いていて、昨年退役したもう1台も熱暴走でフリーズすることが頻発し、GPU を外さざるを得なかったが)。

年度末に余る予算でサーバを1台買えると思うが、もう2月までサーバ設定に時間を使う余裕はないので、稼働させることができるのは2月くらいなんじゃないかなと思ったりする。LDAP サーバとファイルサーバを導入することができたのが、今年の計算機関係の進捗。これまではアカウントの認証は個別対応(/etc/passwd のコピペ)だったし、ファイルもサーバごとにローカルに置いていたのである。そもそもサーバが2-3台しかなかったし、共通化する手間とのトレードオフで、あえてしない選択をしていたが、現在はサーバが5台になったし、たぶん6台になるので一応共通化するメリットが上回ると思う。

計算機のパーツを渡して組んでもらったりすること、全く無駄ではないが、そこに時間を割くのはちょっともったいないし(他にやることがたくさんある)、すぐにクラウドでやる時代が来るのではないかと思っているので、あえてうちの研究室では計算機係以外は学生が計算機を直接触らないようにしている(全員 Mac で統一しているのもそのため)。計算機管理関係は、やっているとそれだけで何かしている気持ちになってしまうのが、研究的にあまりよくないと思っているので……。

勉強会は早めに終わったが、メール処理と事務処理で1日が終わる。