GPU 故障してても止められず

深夜に起きて授業の準備。今学期は基本的に金曜日の2〜5時に起きて3〜5時間授業の準備をする、というサイクルになった(ちなみに、目覚ましはかけていない)。90分の授業の準備が3時間より短くなることはないが、6時間より長くなることもないので、ちゃんと時間さえ確保できればなんとかなる感じ。体調不良や機材のトラブルが一番の心配で、予想外の出来事があると即刻休講にせざるを得なくなりそうだが(汗)

午前中は共同研究のミーティング。今年度は言語処理学会で発表しそうな雰囲気になっているので、詳細を詰めたりする。来年度の調整もしないといけないのだが、3限は南大沢に行かないといけないので時間切れ。

南大沢での授業を挟んで日野に戻ってきて進捗報告を聞いたりする。12月〆切の NAACL に向けた実験の相談だが、最近は GPU も混んできていて厳しいようだ。あるサーバは、8枚ある GPU のうち2枚が死んでいるようなのだが、残り6枚で動かしている実験のために交換もできないようだし(使っていない GPU はあるので、交換した方がトータルの性能的には早いと思うのだけど)。昨年度の経験から、この時期はサーバ争奪戦になるというのは分かっているのだが、どうしようもない(〆切前なので、緊急度が低い人に空けてもらっているようだが)。できることといえば、こうなるのは自明なので早めにみなさん実験しておきましょう、ということだけである。

ちなみにこちらうちのサーバラックなのだが、一番上の GPU サーバ(GIGABYTE の 8GPU 入るシャーシ)が曲者で、GPU と HDD の故障率が高い。Supermicro の GPU サーバのシャーシも、型番によって不安定なものがあるし、ベストなものはないのだが、最初に導入したものと2番目に導入したものは故障知らずなので、新しくなればなるほどメンテナンスに手間がかかっている。サーバ管理は学生の仕事ではないと思うので、非定常業務はできるだけ教員でやっているのだが、クラウドにした方がいいのかなぁ。計算機管理の専任スタッフがいればいいのだが、学内にそういう人を置いておける余力は本学にはないので……(あっても本学の待遇では来てくれないだろうけど)

夕方は保育園の保護者会と、そのあとに保育園のウェブサイトリニューアルに関する打ち合わせ(運営会議)。やはり Google Sites で一度モックアップを作って見てもらうということになる。見えるものができるとそれに縛られてしまうという欠点はあるのだが、見えるものがないと議論が進まず時間だけが過ぎてしまうので……(情報系の人はイメージ図を見ればどういうサイトになるかは想像できるだろうが、一般的にはそうではない)。