研究室のコールドスタート問題

予定がいろいろ詰まっていてなんとも言えない。

午前中はひたすらメールを処理。ちょっと見ない間にやばいことになっている。

お昼は研究会。10年くらい前のNL研で発表された重要文抽出の研究を紹介してくれたのだが、ちょっと内容が微妙だったので、原則的には査読された論文を紹介してもらうよう、学生に周知する。(これ自身も、下に書くことも、彼らが悪いわけではなく、自分のインストラクション不足に起因するもので、責任を感じているのだが、どういう組織でも立ち上げのとき遭遇することなのかもしれない)

もっとも、自分も松本研に入学した直後は飛び交う SVM、CRF、ACL といった略語や教師なし学習、系列ラベリングなどといった新しい概念の理解にいっぱいいっぱいで、いわゆるトップカンファレンスの論文を紹介されてもチンプンカンプンだったのだが、M1の夏にNTT研究所にインターンシップに行き、そこで (実習内容的に必要があり) 1970年代〜90年代の NL 研の論文をけっこう読んで「なんだ、こんな程度でいいのか。これなら自分でも分かる」と勇気づけられ (?)、研究を続けることができたので、今の知識で理解可能な論文を紹介したいという気持ちも分かる。

国際会議の論文を読んで意味が分かるようになるのも、最低半年くらいはかかるように思うのだが、その半年〜1年をどうしたらスムーズに乗り切れるのだろうか……。こういうとき、NLPの研究をしてきたM2の学生がいてくれると、恐らく学生同士で聞いたりできるのでとてもありがたいのだが、そういうM2の学生が育つためには日常的に国際会議の論文を読んでいる人が近くにいる環境が必要だと思うのだが、卵が先か鶏が先か状態で、他の研究室はどうやってこの状態を乗り越えているんだろう。先輩がいなくても、自分たちでえいやと読み始めればいいのだが、背景知識がないとやはり難しい。(松本研にいたときも、[twitter:@tomo_wb]くん、[twitter:@seijik42]くん、[twitter:@pavlocat] くんたちがM2になってくれてから、言語教育勉強会がとてもスムーズに回せるようになって、ありがたかった)

もしかすると、こういう状態にならないように、研究室を立ち上げるときは元の大学から指導している学生を連れてきたり、あるいは内部で昇任する人事が多かったりするのだろうか。

午後の基礎勉強会は情報抽出と文書要約。あと1回で、自然言語処理の全トピックをカバーしたことになるかな。10月から研究室仮配属の学部3年生が4人来るのに合わせ、週1で開催予定の

  • (恐らく) 機械学習の基礎勉強会
  • 国際会議論文の勉強会
  • 定例の進捗報告

のどれかに参加してもらおうかと思っているのだが、研究室のみんなに聞いてみたら「自分が学部3年生のとき、仮配属先の進捗報告に参加させてもらったけど、ただ隅っこで聞いているだけでいまいちだった」とのことだったので、とりあえず基礎勉強会に参加してもらうこととして、B4/Mの人たちに混じって担当を当てて紹介してもらおうかな。個人的には進捗報告を聞くのが一番メークドラマがあっておもしろいんじゃないかと思ったが、そうではないらしい (汗)

夕方もひたすらメールの返事。半日以上メールばっかり読み書きしている。合間合間にBCCWJのアノテーションをチェックしたりする作業をしているのだが、タグ付けは固まった時間がないと厳しい……。