年末ラストスパートの2週間

夜中に起き、そういえば授業の準備をしていない、ということに気がつき、慌てて資料を作成する。去年の資料があるのでそこまで時間はかからない(2時間くらい?)のだが、最近泥縄的に準備することが増えてきたので、本当にいつか大失敗しないかと、不安である。

最近見る悪夢は、翌日の授業の準備をしているが、明らかに間に合わない中泣きながら用意している、というものである。他の悪夢としては、なぜかまだ高校で体育の単位が足りず、単位を取るために高校に通う(通わなければ大学あるいは大学院が除籍になる)、というもので、年に数回見ていたのだが、東京に戻ってきてからは見なくなった。助教のときも見ていたので、学生だから見る、というわけではなかったのだが、いずれにせよ授業に関する悪夢が多いので、自分の授業は可能な限り出席しなくてよいことにしたい……(学生に出席に関するトラウマティックストレスを与えたくない)。

情報工学演習(データ構造とアルゴリズム演習)は再帰とメモ化を扱う。もう少し話してもいいように思ったが、講義と違って演習は時間が余ると思うくらいがちょうどいいのかもな〜(今年度はみんなほとんど詰まらずできているので、やっぱり年によって雰囲気が違うのかもしれない)。

昼からSLP(自然言語処理の教科書)の輪読。前期は2時間週1回だったのを、後期は1.5時間週3回にしたため、ペースが上がったのだが、ちょうど1回あたり担当者1人くらいで回るようになったので、逆にやりやすくなった気もする(進捗報告が入って時間がずれてしまったりするのが申し訳ないけど)。1.5時間週2回、というのを通年でやると、ちょうどよさそうな気がする。

自然言語処理の内容を知りたいだけなら日本語の本を読むのでもいいんじゃないか、と修士のころは思っていたものだが、英語の論文を読むとき専門用語を英語で知らないと読みようがないし、日本にはアメリカのように網羅的な教科書を読み書きする文化がないので、みっちり1年かけて一通り電話帳のような厚さの教科書を読む今重要性をいまになってようやく理解した。結局のところ、英語が第二言語である以上、ある程度の時間をかけないと読む速度は上がらないし、英語が母語であったとしても専門用語を知らないと論文が読めないのだ(言語能力の問題であれば、アメリカの小学生でも自然言語処理の論文を読めるだろうが、実際は数学やプログラミング、言語学の知識も必要なので、英語の問題ではない)。

午後は進捗報告を聞く。研究の歯車が回り始めたようで、楽しくなってきた。研究が回り始める時期に大事なのは、実験に必要なデータを速やかに得るところだと思う。データの前処理に着手するのにもたもたしていると、何もしないまま平気で1ヶ月かかったりするのだが、これは大変もったいない。もったいないと繰り返し言っても、なかなか着手してくれないのだけど……。手をつけると往々にして様々な問題が噴出するのだが、その多くは解決できたら一つ一つは(振り返ってみると)単純な内容で、頭を使う必要はなく、時間をかければいい(知ってそうな人に聞いたりするのも含む)だけで、「自然言語処理は前処理が8割」とも言われるが、前処理・後処理で気をつけることは知っているか知らないかで決まったりすることも多い。残り2割の本体の部分に頭と時間を使えるよう、可能な限り速やかに手をつけたほうがよい。

研究室的には12/24の年内最後の進捗報告で、言語処理学会年次大会に投稿できるかどうかを決めるつもりだが、あと2週間でどれくらい行けるかなぁ。12/27から1/4までは原則的に研究室に滞在できないので、12/26までに提案手法の目処がつけばいいのだけど……。