電源の確保が大事 GPU

午前中は共同研究のミーティング。ニュースを見ているかぎり台風の影響はないと思ったが、9時半発の電車が来ないと思っていたら次は11時だと案内があり、急遽通勤経路を変更。けっこう電車が遅れているようで、早めに出たのだが、結局乗り換えに次ぐ乗り換えでタクシーに。最近豊田駅からはタクシーが最も多い……。

午後はサーバ室に 8 GPUGPGPU サーバを設置してもらう。筐体は Supermicro の 4048GR-TR という 4U のシャーシで、CPU は Xeon E5-2660 v4、メモリ256GB、システム用の SSD (480GB+800GB) に加え、NVIDIA GeForce GTX TITAN X が8枚である(GPU 以外の部分は130万-150万程度で買えるようだ)。

8 GPU いけるシャーシはいくつか出ていて、これ以外にも TYAN(4U)GIGABYTE(2U)のものがあるようで、TYAN のは3.5インチのHDDが載せられる(Supermicro のは2.5インチのみ)、GIGABYTE のは 2U でコンパクトである、という利点があるものの、両者とも日本で取り扱っている業者が少なく(ウェブで調べたところ、少なくとも確実にこれらを使っていると思われるのはそれぞれ1社ずつ)、複数の業社が取り扱っている Supermicro 製のものにした次第である(業社に聞いたら、過去に同様の構成で納入したことがあるらしい。TITAN をこの筐体に挿すのはメーカー推奨ではないらしいが。)。GIGABYTE のは小さいのはいいのだが、これ発熱どうなんだろうか……(前面の GPU の排気が後面の GPU に行くような?)。

新型の TITAN X が発表されたのでもう GeForce GTX TITAN X は購入が困難なようだが、夏休みにはほしかったし、まだ新型の TITAN X は日本で買えないようなので、7月中に旧 GeForce GTX TITAN X を押さえておいて古いのにしたのである。しかし、自分で組んだりする手間とか、パーツ同士の相性とかで発生する手戻りを考えると、自分でパーツごとに買い揃えた方が1-2割安くても、全部組んでもらったほうが楽だな……(数十万円程度であれば、マシンの設定だけで1ヶ月かかったりするリスクを考えると、時間のほうが貴重)。

もっとも、自前で計算機を持つより、クラウドでやったほうが楽だと思うし、そろそろさくらのクラウドサービスみたいなのを使うことを考えたほうがよさそうな気もしている。自然言語処理だとテキストデータをけっこう置いたりするので、ちょっと料金体系に合っていないかもしれないが……。MS Azure がようやく GPU インスタンスを使えるようにしたという話なので、これが使えるようになったら乗り換えたいなぁ(3月くらいから、心待ちにしている)。

あと、そろそろ問題なのがサーバ室の電源であり、自分が使えるサーバ室はなんちゃってサーバ室で、あまり電源がたくさんないので、GPU の数も電源の数で上限値が決まりそうである。とりあえずこれでうちの研究室で保有する GPU 数は16枚(Tesla K40 が4枚、GeForce TITAN X が12枚)になったが、たぶんうちの研究室で使える電源の上限が8,000Wくらいだと思われ、GPU が1枚250W使うことを考えると30枚は置けないので、学生1人につき1枚(使わない人もいるだろうから、実質的には2-4枚くらい?)は行き渡る程度が限界だろうか。それを超えたら、古い GPU から退役してもらわないと。(松本研にいたときも、最後の1-2年はサーバ室の電源を計算して、電源を食うマシンから退役させていた。まだまだ使えるマシンでも、新しいマシンを入れるためには退役させないといけなかった)

午後は修士論文のポスター練習。お盆前にだいたい見たので、がんばらないといけない数人にはっぱをかけるという趣旨である。その後、大学院の公開期末評価の発表練習。こちらは内部的な発表なのでそこまでがんばって資料を作らなければならないものではないが、せっかく他研究室の先生方にコメントをもらえるチャンスなので、分野外の人にも通じるような話にしてもらう。自分の大学院生時代を思い返すと、教授の方々は専門分野でなくても本質を捉えた鋭いコメントをくださることが多く、割と意味があると思うのだ。

しかし長期の休みのあとに出勤するとやることだらけで、全然終えることができなかった。今週1週間は厳しい(汗)