研究室公開が10時からなので、朝から準備に行く。学部3年生が特別研究(いわゆる卒研)をする研究室を選ぶための参考として、合計3回開催する必要があるのだが、各回10人が定員で、1回目と2回目は満員御礼なので、椅子を用意したりしないといけないのである。
学生募集のページ、実はときどき書き足したり書き換えたりしているのだが、いろいろ口で説明するより読んでもらったほうが早いと思うので、印刷して配布してみたり。自分でも思うが、8ページあってかなり長い。もっと短くしたいのだが、メールで質問があったり、オフィスアワーで来てくれた人の質問を反映したりすると、どうしても長くなってしまうのであった。
研究紹介は30分くらいにするつもりであったが、1時間話してしまった。水曜日はせめて40分くらいになるよう、気をつけよう……。研究室のみんなにも、それぞれ10分くらいずつ研究の紹介をしてもらったが、どういう研究をしているのか、分かったかなぁ? 研究室の学生たちは、発表の回数を重ねるごとに話すのがスムーズになっているので、頼もしい感じである。夏休み前、Googleで全員にトークしてもらったのだが、さすがに研究テーマもはっきりしないうちから、ちょっと無茶ぶりだったか……。
会場からの質問で、いま研究室にいる人たちは、共同研究やアルバイトで自然言語処理の研究開発をしていて、かなり高度なことをしているように見えるが、配属前はどれくらい開発あるいは研究ができたか、という問いかけがあった。まあ、半年みっちり基礎勉強をすれば、最低限の知識は身に付くし、卒研をクリアしてM1になれば、知らないうちにそこそこのことはできるようになっているのではないかな?
そもそも、あまり首都大では本格的な情報系の教育をしていない(あるいは、開講されているが全員が履修しているわけではない)ことが分かったので、研究室内で必要な知識が充足できるように基礎勉強会を拡充するつもりだし、そんなに事前知識を前提とする分野でもないしね……。松本研のようにスタッフが何人もいるわけではないので毎週10個の勉強会は回せないが、毎週5個くらいはなんとか(今年は前期も後期も3個しかやっていない。うち前期は2つが基礎勉強会、後期は1つが基礎勉強会)。
- Tetsuji Nakagawa, Kentaro Inui and Sadao Kurohashi. Dependency Tree-based Sentiment Classification using CRFs with Hidden Variables. NAACL 2010.
割ときれいに問題を解いていて、なるほどなぁと思う。細かい実験設定(ベースラインのヒューリスティックス)に、なんだか苦労の後が見られる……。卒論もそろそろ佳境なので、研究室のサーバが唸り出すころだろうか。
夕方は午前中にできなかったメール処理と事務処理に忙殺される。月曜日は諦めモード。しかしコースの忘年会の会場探しと予約も入れると5時間半かかり、ちょっとこれは時間を取られすぎではないかと思ったりする。