午前中は機械学習の最後の授業。結局分類問題でナイーブベイズもしっかり説明することができなかったので、来年度はもう少し順番を変えようかと思ったりする。(分類問題くらいまでは行きたい)
お昼は八王子の企業の方とランチ。近くでアルバイトやインターンシップができる(募集している)企業がある、というのは大学としては大きいと思うのだが、日野だとなかなかそういう機会がない。自分で立ち上げた方が早いのではないか、と思ったりするほどである(自分で立ち上げるつもりはないが)。ポジティブであれネガティブであれ、学部生のうちにそういう体験ができるといいのだが……。行って失敗したな、というような経験でも、時間のあるうちに行くのは、人生的には意味があると思うのである。例えば、自分もペンションで住み込みベッドメイキングのお手伝いをしたりハンバーガー店でアルバイトしてみて、肉体労働は向いてないだろうと思ったけどやっぱり向いてないな、と理解したし、自分には向いてないがいろんな仕事のスペシャリストがいるものだと思い、人生経験としてはやってよかったと思っている。
午後は年度内最後の機械翻訳勉強会。今年度はすっかりニューラル機械翻訳の勉強会になったが、言語処理学会年次大会でも機械翻訳になんらかの形で関係する発表が5本、ACL short に投稿予定の原稿も5本は機械翻訳関連で、日本の自然言語処理の研究室の中では割と機械翻訳を利活用している研究室になってきたように思う。
統計的機械翻訳でいえばデコーダやアライメントの研究のようなデータ構造とアルゴリズムのようなコンピュータサイエンスの基礎知識を要求されるテーマの研究はほとんどないが、今の B4 からは自分がフルに(データ構造と)アルゴリズムの演習、オートマトンと言語理論の講義をやった世代なので、そのうちそういう研究に興味がある人も来てくれるかなと思ったりする。
あと、うちの研究室はなぜか構文解析や意味・談話解析の研究をする学生が人数の割にほぼ皆無で、形態素解析レイヤーの研究か、情報抽出・機械翻訳・対話・言語学習支援のようなアプリケーションレイヤーの研究に二分化している気がする。まあ、研究の難しさの割にはなかなか使いどころがない、という意味で、最初からこういうのがやりたいと思う学生でもないと、そうなってしまうのは仕方ない気もする。過去1人だけ共参照解析の研究をしていた学生がいたのだが、1年弱かけていつまでバグが取れず実装が完成しなかったので、断念した経緯がある(基盤解析技術は全部がちゃんと完成しないとうまく動かないので、そこそこ実装ができないと難しい)。
今は人数がいるからいいのだが、ここから3-5年くらいかけて研究室の人数を20人以下に減らしたいので、そうなったときにも研究テーマを維持できるようにしていきたい。(計算すると大学院の修士の1学年の定員を6人にしないと研究室のサイズが縮小しないのだが、研究室配属でB4が5人来る年は定員が6人だと厳しいので7人にせざるを得ないし、それを考慮すると隔年くらいでしか減らせない)