学生にサーバ管理は役不足

午前中は最先端論文紹介で以下の論文を紹介してもらう。

  • Antonios Anastasopoulos, Alison Lui, Toan Q. Nguyen, David Chiang. Neural Machine Translation of Text from Non-Native Speakers. NAACL 2019.

これは非母語話者の書いた文章を翻訳するというタスクの提案で、確かに自分も Facebook に英語で投稿して日本語に自動翻訳されるというアプリケーションを使っているので(日本語=母語で書いて英語に翻訳すればいいのでは、と思うかもしれないが、英語で書きたいところは英語で書きたいのである)、なるほどと思う設定。実験自体はノイズを入れたりだとか転移学習等しているものの、前半部分はあまりおもしろみはないのだが、後半部分はしっかりデータを作って分析しているところはよい。やっぱりこういう感じで long paper をちゃんと書いていきたいなぁ。

午後は機械翻訳グループの進捗報告を2時間ほど聞いてからサーバ管理。どうも GPU の刺さったワークステーションが1台立ち上がらないのだが、起動途中に VEGA のフレームバッファが有効になり、NVIDIA のドライバでは画面が見えなくなってしまうという症状。これまでも同じ症状は確認できていたのだが、画面が見えなくてもネットワークが上がれば接続できるので、特に困っていなかったが、今回はネットワークに到達する前にどこかで止まっているようで、画面の問題を解決しようと悪戦苦闘。GRUB から init=/bin/sh で起動すればシングルユーザモードで操作できるので、mount -o rw,remount / して書き換えて再起動したりなどして色々試してみたが、よく分からずタイムアウト。うーむ。

一度間違えて GRUB を壊してしまい、一回戻る。Ubuntu の minimal ISO を USB メモリに dd で書き込んで起動し、mount --bind で /dev や /proc、/sys をマウントしたあと chroot して grub-install で復旧。壊してしまった元の Linux が Ubuntu 16.04 なので 16.04 の minimal を使ったら HDD を認識してくれず、18.04 の minimal を使ったら認識してくれた。

しかし自分は何千回と Linux や *BSD のインストールや復旧をしているのでそんなに手間取らず何をすればいいか分かるが、LDAP の設定とか Web サーバのメンテナンス等含め、研究と直接関係ない計算機管理は、自分は大学院生のときはやっていたけど、今どきの学生にやらせることではないよな……(お金を払ってやってもらうのならまだしも、ボランティアでいくらやっても業績になるわけでもないし)。というわけで、全部クラウドでできるのが楽なのだが、コスト的に見合わないので少し自分が計算機管理のエフォートを出すことで対応している。