午前中は統計数理研究所へ。普通に間に合う時間に出たはずなのだが、どうも金曜日に有給をとって連休にしている人が多いのかなんなのか、田舎方向に渋滞していて全然進まない。普段は通勤ラッシュと逆方向の通勤なので平日はスイスイ行けるのだが、土日休日は通勤ラッシュと逆方向が混むのである。こうなると分かっていたら、今日ミーティングを入れるんじゃなかった……。
共同研究のミーティングを聞いたところ、これまでうまくいってなさそうに見えた手法がどうやらそうではなさそうで、そうだったのか、と思ったりする。結局(評価)データをしっかり作るところが一番大事で、手法が悪いのかといろいろ1年以上あれこれやっていたが、1年前に実装していた(最初に考えた提案)手法でよかったのではないか、という話。自然言語処理は前処理が8割、などと言うことがあるが、きちんと評価尺度を決めたり評価データを決めたりするのが大事。
午後は出勤して(ニューラル)機械翻訳勉強会の進捗報告。連休の中日だし、大学祭の開催期間で休講日なので、参加は任意としていたが、半分以上の学生が進捗報告をする(そもそも日野キャンパスは大学祭は関係ないので、当然ではあるが)。
NAIST 松本研で言語教育勉強会をしていたときに思ったが、一つの大きな研究テーマにそこそこ人数がいると、集中的にサーベイや実験ができるので、研究を進めやすい(ある言語でできたことが他の言語でもできることが分かったり、あるタスクで有効だと分かった手法が別のタスクでも効果があったり)。問題は、自分自身学生に研究テーマを与えたり割り振ったりするのが嫌なので、そのようなグループになるかは運任せということかな……。
あと、まだうちの研究室では「これが独自」と言えるだけのブレイクスルーがないので、そろそろそういうのを意識していきたい。(機械翻訳に関しては、グループでやっている京大と NAIST は両方関西なので、関東で機械翻訳といえばうちの研究室、みたいな感じにしたいとは思っている)