午前中、Microsoft Office の利用申請。サイトライセンスなので研究室的に費用がかからなくていいのだが、MACアドレスから何から全部手書きせねばならず、かつ利用申請のたびに申請者情報を書かないといけないので、研究室で集約してもらっていたのである。手書きでなければコピペするだけでいいので、都度申請してもらってもそんなに負担ではないのだが、手書きで毎回コース名とか内線番号とか書かされるのは苦痛なので……。
お昼は NAIST 松本研時代の後輩が訪ねてきてくれる。日野キャンパスに来てくれるのは2回目だと思うが、学生室がかなり変わっていると驚いていた。確かに前回来たときと比べると学生数は2倍強でレイアウトも全然違うし、驚くのも無理はない。自分も昔どこに誰が座っていたか思い出せないし。いや、今もどの席に誰が座っているのか完全には把握しておらず「この列のどこか」くらいでしか分からないが(汗)
仕事と大学院で学んだことの話をしていて、NAIST 松本研で身につけた「自然言語処理のお作法」がとても役に立っていて、博士後期課程で学ぶというのは自然言語処理に関する仕事をするなら重要だ、という話を聞いて少し嬉しく思う。松本研はタグ付けから機械学習、エラー分析まで一通りしっかりやり方を叩き込まれる(?)環境で、なかなか全部できる研究室はないし、うちもそう思えるような研究室にしたいものである。今はどれも松本研のレベルに達していないし、教員数と博士後期課程の学生数からして松本研レベルに到達するのは不可能だと思うが、教員1名の研究室としては最高水準にしたいと思っている。
あと、研究室とは1ミリも関係ないと思いつつ研究室有志で読んでいた「BINARY HACKS」の知識が無茶苦茶仕事で役に立つ、という話も激しく同意で、すぐ役に立つと思ってなくても基礎勉強は将来への投資にもなるし、自分たちで誰に言われるでもなく自主的に勉強する、というのが文化として根付いていた松本研の環境は本当にいいところだったと思う。うちの研究室でも毎学期学生たちが勝手にいくつか勉強会を立ち上げてやっている(自分は出ていない)が、自分たちで勉強会を立ち上げて回す、というのが卒業してからも一生役に立つ経験なので(就職すると教員はいないし、職場でも自分が一番詳しい人になってしまうので、周りを巻き込んで学んでいくしかない)、こういう文化も続くといいなと思っている。
午後は(ニューラル)機械翻訳勉強会。Google の機械翻訳が日英・英日もニューラル翻訳になったっぽいとの噂だが、ニューラル翻訳は統計翻訳と出力の傾向が違うので、確かに見たらニューラルっぽいなと分かる。自分も去年の後半にニューラル翻訳の出力を見て「これはすごい」と今後ニューラル翻訳がメインになることを確信した一人であるが、こんなに早くプロダクションレベルになる、というのがすごいと思う。ニューラル翻訳で起業して一旗上げようと考えていた人も多いかもしれないが、エンタープライズ翻訳以外はもう Google 翻訳でいいじゃん、となるだろうなぁ。まだ試したことがない人は、ニューラル翻訳はこれまでの統計的な機械翻訳と流暢性が決定的に違うので、ぜひ試してみてもらうたい。
夕方は勉強会の見学者と面談。バックグラウンドを考慮すると修士で受け入れるのは厳しいので、座席を割り当てない研究生でなら、という話で進めていただいている。留学生や文系の学生など、どうしても夏季入試のタイミングでは受験を検討していなかった、という人がいるのは仕方ないのだが、今後は冬季入試の学生も基本的に研究生でしか受け入れられない(研究生をして夏季入試を受けてもらう)気がしている。