サーバ管理も誰かがやらないといけない

朝 [twitter:@tom_shibata] さんと軽く雑談。研究を続けるというのも大変だな〜

昼、業者の方から連絡。突然電源が入らなくなったサーパがあり、点検をお願いしていたのだが、結局マザーボード交換になったのである。ずっと立ち会う必要はないそうだが、作業開始時に作業する内容の確認と、終了時に作業した内容の確認をする必要があるので、計算機係の人を探したのだが誰もおらず、結局自分が担当になる (勉強会中に何度も電話がかかってきて閉口するが、仕方ない)。

昼過ぎ、機械翻訳勉強会の時間で [twitter:@neubig] さん、Kevin さん、katsuhiko-h くんの ACL/EMNLP 発表練習。katsuhiko-h くんの話と @neubig さんの話の2個目はそれぞれすでに聞いたことのある話だったが、Kevin さんと @neubig さんの1個目の話は初めて聞く内容で、とてもおもしろい。そして Kevin さんはプレゼンテーションがものすごくうまい!(プレゼンテーションに関するコメントも的確) 自分も発表能力と研究能力上げたいな〜……

ちなみに ACL/EMNLP というのはどちらも自然言語処理の最難関の国際会議で、松本研と中村研と合同とはいえ (@neubig さんと Kevin さんの仕事はどちらも NAIST に来られてからの仕事ではないが……)、4本も NAIST から発表があるというのはすごいなぁ。言語処理に関しては少なくともいまもっとも研究環境が整っている時期なので、学生 (特に博士後期課程) の人たちは研究どんどん進めてほしいものである。

午後、NAIST情報科学研究科のネット広報に関する打ち合わせ。自分の発案ではないことを進めるのもなかなか難しい。仕事だと割り切ってやるしかないのだろうか (最近こういう仕事が多いのだけど……)。

夕方前、松本先生から直接雑用を頼まれる。こういうのは実は珍しい (けっこう松本先生自らがやってくださることも多いので)。まあ、頼まれるだろうとは思っていたけど、金曜日は東京出張なので、それって今日中にやらないといけないのでは……ということに気がつき、30分ほどで片付ける。最近2時間なにかに集中できる時間があるだけで「今日は固まった時間がある」と感じるのだが、そういう時間に限って時間があるからと些末なことに使ってしまい、結局細切れの時間しか残っていなかったりして……。

夕方からソーシャルメディア解析勉強会。hiroshi-t くんが進捗報告。サーバ関係の電話が2回かかってきて集中できなかったり、なんだか申し訳ない感じ。論文紹介は hiromichi-s くんが

  • Arjun Mukherjee and Bing Liu. Improving Gender Classification of Blog Authors. EMNLP 2010.

を紹介してくれる。品詞列のパターンマイニングと素性選択をするとブログの性別分類に効くという話。あと、分類はナイーブベイズより SVMSVM より SVR のほうが効果が高いと。正直なところ、アルゴリズムはもう少しなんとかならなかったのだろうか……。あと、エラー分析もないので、提案手法のなにが効果があったのか、どういう問題が残っているのか分からない。データがノイジーかつ分量が少ないからこの手法が相対的にうまくいく、とかそういうことではないかなぁと予想するのだが、詳細が書かれていないのでなんとも分からない。せめて「こういう品詞列が取れたからうまく行った」というような定性的な評価くらい入れてもよかったのではなかろうか。

勉強会後、サーバ室にて作業内容の確認。結局当初予定の2時間では終わらず、4時間かかったそうだが、原因も突き止めてくださり、サーバも無事起動。今日直らなければ月曜日になる可能性が高かったので、直していただけてよかった。これが止まっていて実験ができない、ということにならないで済んで……

@tom_shibata さんとも午前中話したが、サーバ管理は最近できる学生も少ないし、もし仮にできる学生が入ってきてもボランティアでやってもらうことになるし、管理自身が就職や研究につながる分野ならいざ知らず、言語処理ではそういうことはほとんどないし、たまたまときどき入ってきてくれる学生頼みで管理するのも不確定要素が多いので、なるたけ研究室での管理が必要な部分は減らしたほうがいいと思うのだ。(好きな人がやることを否定するものではないし、減らそうとしても研究室の機能的に管理しないといけないサーバは残るので、結局学生有志にお願いすることに代わりはないのだが)