研究室公開に見る研究室間の研究テーマの類似性

朝、メール処理してから機械学習の基礎勉強会。演習問題が1問残っていたのだが、無事終了。丁寧にやったので小一時間かかったが、これでみんな EM アルゴリズムは記憶に残ることだろう。結局、時間がかかって(少ししか進んでいないように見えて)も、ちゃんと身に付くことが大事なのである。

午後は学生の研究相談。実験もサーベイも中途半端に数ヶ月ごとに研究テーマを変えるのはよくないと思うのだが、研究テーマを選ぶに当たり、新規性がある研究の中で、世の中的に意義があり、あつ自分の能力で実行可能なタスクを選ぶ必要がある。

新規性がない開発案件では研究としては成立しない(注意してもらいたいのは、これがダメというわけではなく、研究にはならないだけで、開発的には非常に意義がある場合は往々にして存在する)し、自分がやりたいと思っても評価も不能・意義も不明であれば趣味でやれば、という話だし、自分の能力で実行不能(研究的に難しい場合もあれば、プログラミング的に難しい場合もあるし、そもそもデータが存在しないのでデータ作成からやらないといけない場合まである)ならそもそも取り組めないのである。

研究テーマの相談ののち、別の学生とプログラミングの相談。割と実装が進んでいてすばらしい。ちゃんとチュートリアルをやったようで、vi を使いこなしていてかっこいい(笑)自分も学部4年生くらいのときに練習したな〜。

少し合間を縫って python-matplotlib (というか networkx)を用いて研究室公開の希望者がどことどこの研究室を希望しているかで、研究室の関係性の可視化。Jaccard 係数で重み付けし、類似度0.25以上の辺のみを描画(ちなみにうちは14研究室中2番目の人気)。ちなみに研究室一覧を合わせてみるとよい。色は通信システム分野、情報システム分野、メディア情報処理分野の3分野で分けてみたが、情報システム分野(ライトグリーン)は見てお分かりのように教員もごちゃまぜの分野である。首都大の研究室に興味があるのは内部の人だけかもしれないが……

見た感じ、石川研、高間研、貴家研、片山研とうちあたりが密なグラフ(というか完全グラフ)を形成しているが、ウェブ・ネットワーク系の研究室と画像・言語メディア系の研究室の希望者が重なりあっているようである。福本研・三浦研・岩崎研あたりは論理回路系で固まっているようで、阿保研・長澤研・柴田研・大久保研・田川研は通信・波動系で固まっているので、学生も研究テーマの重なりで研究室の見学先を選んでいるようである。

結局のところ、研究室公開に来てくれた人のうち、どういう人がうちを希望してくれるか、というのが気になるわけだけど……

(2013-12-05 追記)辺の重みを逆に解釈していたので、作り直した。(具体的には、Jaccard 係数の逆数を重みにするように変更した)