これからの研究室の話をしようか

朝の5時に起きて、やおら DSIRNLP(データ構造と情報検索と自然言語処理)勉強会の資料を作成する。そう、今日は DSIRNLP で招待講演を頼まれているのである。招待講演の当日にならないと資料を作る時間が取れない、というのは由々しき事態であるが、先日の NLP 若手の会シンポジウムで講師を頼まれてから今日まで、仕事をできる時間の半分くらいは事務処理、残りは研究室の勉強会と授業で埋まっていたので、予想外に10月11日までに時間がなかった、ということであろう。

タイトルは「スーパーローカル自然言語処理研究室をつくる」というもので、個々の内容はこの日記や Twitter で書いてきたことなのだが、まとめて話すのはこれが初めてだし、お声がけくださった [twitter:@overlast] さんと [twitter:@uchumik] さんに感謝、である。

60分のトークと30分の質疑のつもりだが、スライドが100枚を超え(ただし20枚は非表示)、一時はどうなることかと思ったが、なんとかなりそうな雰囲気である。

吉祥寺経由で渋谷に行き、会場のデンソーITラボに向かう。今回のトークは(いつもそうだが)割とガチの技術的な話が多く、勉強会をどのように立ち上げて回すか、というようなゆるい話は自分だけで、ちょっと空気を読み損ねた感はあるが、思い返すと別にこれまでの DSIRNLP 勉強会でも自分はテクニカルな話をほとんどしていない(NLP 若手の会シンポジウムの紹介をしたり)ので、別にいつも通りであった。

結局スタッフ1人でそれまで全く縁のない大学に研究室を立ち上げるのはいろいろ試行錯誤の連続なので、自分がこうやって日記に書いたりすることが、同じような立場になった人の参考になればいいなと思って日々書いているのであった(恐らく日本に数十人程度だろうけど)。いまでも毎年「ああすればよかった」と思うことだらけだが、そう思えるうちがきっと楽しいのである。ちなみに今でこそまだ対外発表件数は少ないが、首都大から目立つ学生がどんどん出てくるようになるのは時間の問題だと思っている(うちの研究室の学生だけではなく、自分としては首都大の情報通信コースの学生全体の底上げをしているつもり)。

うちの研究室からも学生が10人中4人が自主的に参加してくれ、全体で50人ちょっとの参加者中の1割弱を占めていた(学生は全部で10人弱)ので、研究室の人数がほぼ倍になる来年以降は固定的にある程度の数の学生が各種勉強会に参加してくれることを期待している(それこそが、研究室が東京にある最大の利点の一つであると思うので)。今回、ライトニングトークでうちの学生は4人全員なにか話したようであるし(まだディープな話はできないと思うけど、学部4年生の2人もトークに挑戦していて、偉い)、そのうち発表者としてもプレゼンスが上がっていくだろう。

こういう勉強会に参加したときは、全部のトークを紹介するのは大変だし、そういうのは若い人がやったほうが勉強になっていいのではないかと思うので、独断と偏見でいくつかだけ心に残った発表を紹介することにしているのだが、今回の勉強会はどれも甲乙付け難く、一つに絞ることができなかった。密度の濃い勉強会であった。あえて挙げればファンタジスタドール、じゃなかった [twitter:@echizen_tm] さんの「30分でわかるAdaGrad+RDA」だろうか。かなりいけてるアルゴリズムのようで、いい感じ。ファンタジスタドールを実装したくなった、じゃなくてRDAに興味を持った。

トークから離れると、今回は久しぶりにお会いする人が何人もいたのも収穫であった。東北大乾研出身の H さん、ご飯を食べていたら知り合いに会っていまの会社に転職された、というお話をお聞きして、どうされているのかと心配していたので、ほっとした。また、東大相談員時代の Unix の師匠である [twitter:@NaOHaq] くん。10年ぶりくらいだろうか? 相談員として勤務していた時期がなければ情報系に来ていなかっただろうし、Unix ツールの奥深さ(謎)を教えてくださった方々なくしては、いまの自分はないと思うので、再会できてよかった。

あと、[twitter:@unnonouno] さんたちと deep learning の話をしたり、やはり研究の話をしているときが一番楽しい。いつも新しいネタで論文を書くときは100本くらいサーベイすることにしているのだが、それくらい読んでキャッチアップしたいものである。word2vec はデモとしてはすばらしく、研究的にもいろいろ論文が産まれているが、個人的な興味はあまりそこにはなく、Theano とか pylearn2 とか使っていろいろいじりたいのであった。