初めての研究は走り出してから考える

午前中、研究室のみんなに進捗報告をしてもらう。そろそろ授業も終わるので、毎週研究の進み具合を聞こうと思うのである。

まず Markov Logic Network で実験できるよう thebeast のサンプルを動かしてみる、という課題を3週間前に出していたのだが、先週進み具合を確認したら「ダウンロードしただけ」と言うので今週2回くらい時間を取ってみていた。しかし、どうも Mac で thebeast を動かすためには64ビット対応の lp_solve をインストールする必要があり、コンパイル済みのバイナリが配布されているかと思いきやソースからコンパイルする必要があるようで、なんだか大変そう (自分でもさくっとインストール、というわけには行かないので、コンパイルとインストールをこれまでしたことない人には相当酷)。結局、Linux (Ubuntu) のサーバでやってもらうことにする。それで気がついたのだが、まだ研究室のみんなのアカウントが作られていなかったので、全員分のアカウントを作成してもらったり、外から ssh でログインできるようにしたり (sshd も立ち上がっていなかった)。

話してみると意外と Unix のコマンドをみんな知らないようなのだが (自分も教育用計算機システムの相談員をしていなかったら知らなかっただろうし、当然ではあるが)、これってどうするのがいいんだろうか。確かにもう Unix なんて使えなくてもいいような気もするのだが、Unix ツールの考え方は身につける価値があると思うし、使えるようになっておくと何かと役に立ちそうな気もする。

また、コマンドラインからコマンドを打ち込んで操作しないといけないのか、という質問が出たのだが、自然言語処理の研究ではほとんどの場合コマンドラインからプログラムを実行するので、これに関しては諦めてもらう以外にない気がする。(コマンドラインから操作できるくらい詳しい人が、グラフィカルなツールで開発したりすることはできるだろうが、それくらい詳しいなら自分でなんとかできるだろう)

あとは順番に研究に必要なコーパスを入手しているかとか、コーパスを既に入手している人は前処理で詰まっていないかとか、それぞれ確認。大体詰まりそうなところは予想可能なのだが、1週間でどれくらい進むものなのか見積もりが難しく、多すぎたり少なすぎたりしているのかもしれない。少ないぶんにはかまわないのだが、多くなりすぎないよう気をつけないとな〜。

ちなみにいま研究室でネタを提供したテーマに取り組もうとしている人が3人、自分で考えたテーマに取り組もうとしている人が2人で、自分としてはどちらのほうがよいと思うことはないし、自分で考えたテーマに積極的に取り組む人を応援したいと思う。共同研究系のテーマをやる人には若干アルバイト代を出したり機材を優先的に配置したり、多少差がつくようにしているが、共同研究系のものをやる人ばかりだと、新しい研究テーマが生まれにくくなってしまうので、自分のやりたいことをやる人もいたほうがいいと思う。

(というのは、初めて[twitter:@1T0T]さんの伊藤研究室への配属志望学生の皆さんへを拝見したときから、自分の研究室ができたときもこうなのかな、と思っている)

昼からプログラミングチュートリアル。今回は時間が取れず shift-reduce による係り受け解析器を作れなかったのが無念。ほとんどできていると思うのだけど……。来週が最終回になる予定なのだが、最終回では全部の問題が解けているようにしたいものである。

ようやく研究室で新しい研究が回り始めて、楽しくなってきた! この数ヶ月、いったいどんな感じで研究が進むのかイメージしにくかったが、こんな感じなのかな。あと、自分はこの先にどんなことがあるのか予想できるので楽しみだが、初めて研究する人にはそのワクワク感が伝わりにくいと思うので、これもなんとかしていきたい。(考えてみると、自分は新しいことに挑戦することそのものが楽しいと思うようである。)

午後は言語教育勉強会だったのだが、ちょっと行くのが遅れてSkypeに接続してくれる人がおらず、30分ほど待ちぼうけ……。今学期最後の勉強会だったのだが、松本先生も不在だったようで、申し訳ない。来学期は[twitter:@tomo_wb]くんが復帰しているので、松本先生がいなくてもきっと彼がハンドリングしてくれるであろう。