GPU 電源足りずお蔵入り

午前中は B3 の研究室インターンシップ。だいたいアノテーションが落ち着いてきたので、言語処理学会年次大会までのロードマップを決める。少し初動が遅かった気がしていたが、大丈夫そう?

お昼は研究相談に乗る。教授会の開催時刻が繰り上がったせいで、木曜日の午後が使えるのが第1木曜、第4木曜の2つになってしまい、あまり嬉しくない変更。コース会議から教授会までの時間を2週間空けたくないだろうから、仕方ないのだけど。

午後は GPU サーバの業者に来てもらい、故障していた GPU(代替品を借りていた)とエラーの出ていたメモリの交換。GPU の方は交換するだけでよかったのだが、問題はメモリ。違うメモリのはずなのに、交換してもまたエラー。刺す場所を変えてもそのメモリがエラーなので、壊れたメモリの交換に壊れたメモリを持ってきているとしか思えない挙動……。これ、GPU 交換と一緒だったからよかったものの、メモリの交換に来ててダメなメモリを持ってきていたら目も当てられなかった。今度正しいメモリを交換に来てくれるそうだが、次サーバを落とせるのはいつのことやら。

サーバ室の電源が足りない問題のため、とうとう Tesla K40 を2台外して GeForce GTX 1080 Ti に入れ替えることにする。メモリは12GBから11GBに減るのだが、動作速度を考えると GeForce GTX 1080 Ti の方が速いので、一度に渡せるデータの量(ミニバッチサイズ)が減ることを考慮に入れても、後者の方がよいと判断したためである。購入したときの価格を考えると何とも言えないものがあるが、性能の向上のペースを考えると、高い GPU を買う理由がないな……。

計算機資源に関しては、需要が逼迫するよりそこそこ早めに動くようにしているので、これまで壊滅的に足りなくなったことはないのだが、自分が早めに動いても大学的な事情でどうしようもないことがあったりして、四苦八苦している。今回も、電源の増設については夏前から依頼しているし、そもそも昨年度の工事でうちの研究室専用に引いてもらったコンセントに刺した UPS に新たにサーバを増設するのに待ったがかかっていて、昨年度に増設した電源の使用許可が今年度にまだ降りていない(昨年度に新設したサーバには、もうすでに使っているのに)、という状況に苦しめられている。

だいたい本学で「え、なんでこんなふうになっているの」と思う(しばしば時代遅れで不可解な)事項、だいたい都立大由来または都立科技大由来のどちらかに行き着く。後者の場合は経緯を知ると「時代にはそぐわないけど、当時の議論を知ると仕方ないか(議論してベストな方法を模索した結果、そうなった)」と思うのに対し、前者の場合は経緯を知っても理解不能(組織を超えた意思疎通の難しさによってちゃんと議論をしていないか、あるいは議論をした上で別の明文化されてない謎の事情によって、はたから見ると不可解な決定をしていると思われる)であることが多く、歴史のある大きな組織の運営は大変だな、と思ったりすることが時々ある。

自分は大きい組織には向いてないなぁ、とよく思うので、細々とやっていきたい……。