大学だからこそ抽象的な内容も扱う

午前2時半から英語で推薦状を書いたり(最近増えてきた)、国際会議の author response という査読に対する著者からの反応を見て最終コメントを用意したりする。

国際会議のプログラム委員に声をかけてもらえると、研究者として認知してもらっているのだなと思う反面、発表する機会が減るとどんどん疎遠になりそうで怖い。ただ、とりあえず研究以前にやらないといけないことがいろいろあるので(子育てもあるし)、しばらくは種を蒔くつもりでコツコツやっているところである。自分の研究室の中だけでよければそんなに時間はかからないだろうが、首都大の情報工学の学部・大学院教育全体を底上げして、コース全体で学生を主体とした研究・開発体制にしていきたいし。

午後の授業の資料作成に4時間ほど。文脈自由文法に対するポンピング補題を説明するのだが、自分自身 M1 のときにポンピング補題を初めて習って、どうにも苦手だったので、微妙な感じ……。正規表現オートマトンは研究や開発に直結しているので分かりやすいのだが、「文脈自由文法でない」ということを証明したい、という状況に自分はあまり出くわさないし、証明がゲームやパズルみたいな感じなので、おもしろいと思えないとしんどい内容だと思う。

ただ、「実例があると分かりやすい(ので、実例を入れてほしい)」と何度も言われると、それは違うんじゃないか、とも思う。抽象的な思考をする能力というのは、それはそれで大事だし、それこそは学校でないとなかなか時間をかけて養うことができない(実例が必要なものは、仕事を始めれば嫌でもたくさん出てくる)ので、むしろ大学では抽象的で考えるのが難しいようなことも教えておくべきではないかと(そういう抽象的な思考ができない人は、振るい落とされてしまうが、場合によってはそういう選別も必要)。

午前中は大学に来て機械翻訳勉強会。教師ありアライメントに関する章を終え、とうとう句ベースの機械翻訳へ。自分が奈良先端大に入学した2005年というのは、ちょうど階層的句ベースの機械翻訳モデルの論文が ACL という自然言語処理のトップカンファレンスでベストペーパーを取った象徴的な年だったのだが、当時は統計的機械翻訳といえばフレーズベースが基本だったので、ここから再度勉強するのは感慨深い。まだ Moses がなく、Pharaoh を使っていた(無料で使えたが、ソースは公開されていなかった)時代である。

このあたり、修士のころはあまり理解できていなかったが、分かるようになったのはいつだろう? D2のときには腑に落ちていたのだが、それは D1 のときに日本語入力エンジンを作っていたからで、やはり自分でそういうエンジンを書いてみるのが、遠回りに見えて、理解に至る一番の近道なのかもしれない。いまは解説も豊富だし、作る障壁は精神的なものを除けばほとんどないのだ。

進捗報告では Moses の factored translation model が動かない問題を深追いしてみたが、原因分からず。次に授業が控えていてタイムアップになってしまうのが残念。本当に動くのか、これ?

午後のオートマトンと言語理論の授業は文脈自由言語に対するポンピング補題である。やはり証明の話になるとてきめんに分からなくなるみたい(ただし、分からないのは恐らく文脈自由言語に対するポンピング補題ではなく、正規言語に対するポンピング補題ですでに分からなくなっている)。授業のあとたくさん質問をもらうが、休憩時間が少ないので全てに答え切れないのが残念。日野キャンパスだと、時間に余裕もあるのだけど、こちらは教室の数も足りていないのか、次の人たちが外で待っていたりするし……。

試験前だからか、図書館の中も溢れかえっていた。みんな真面目だなぁ。