NLP 2012 チュートリアル: 自然言語処理は10年経ったら浦島太郎

朝7時に起きて広島へ出発。京都まで行きやすくなって大層便利。駅まで歩いて4分くらいかなぁ。NAISTにいると駅まで歩こうという発想がほとんどなくなっていたが……。

新大阪で @kevinduh さんと合流し、さくらで広島へ。道すがら、研究の話をしたり、大学の話をしたり、研究室の話をしたり。こんなに話を聞いてくれる人ができて、なんだか嬉しくて涙が出そうである。やっぱり一つの研究室に長くいると考え方が固まってきてしまうので、こうやって話すと新鮮な感じになれて嬉しい。

広島で一度別れ、路面電車とバスを乗り継いで自分は一路広島市立大学へ。バスで[twitter:@kmura]さんと偶然一緒になる。(自分はランチミーティングのために少し早く来ていたので、誰にも会わないと思っていたのだ) こうやって、普段は地球の裏側にいる人と、毎年会えるというのは不思議な感じである。(日本国内にいても、10年会わない人もいる)

お昼は甲南大の永田さんと食べ、少し打ち合わせをしてから NLP 2012 (言語処理学会年次大会) チュートリアルへ。しかしLRECのカメラレディの〆切が明日ということで (その後1週間延長されたのだが……)、物理的には広島にいるのにビデオ中継で見つつ論文の添削。一応チュートリアルの最後の40分には間に合い、統計的機械翻訳の最先端について聞くことができたが、2004年のチュートリアルの「統計的機械翻訳ことはじめ」から今年のチュートリアルの「統計的機械翻訳の最先端」まで、まだ10年も経っていないのに、ここまで内容が変わっているのか、とびっくりする。

思えば自分も修士のころは全然理解できていなかったなぁ、とつくづく思う。というか、統計的機械翻訳は研究の概要を理解するまでに基礎体力がけっこう必要なので、本気で取り組まないとなかなか厳しいものがある。とはいえ、コーパスも使えるようになってきたし、オープンソースのシステムもたくさんできてきたし、研究はしやすい環境になってきた。NAIST も4月以降が楽しみである :)

統計的機械翻訳チュートリアルの裏で乾先生が「大規模言語資源時代の意味談話処理」についてお話されていたようだが、事前に見せてもらった資料の半分以上が書き直されていて、すごい力の入れよう。しかしこれはトークも聞かないと内容がよく分からないかもな〜。あと鹿島さんの「ネットワークと機械学習」もとても分かりやすく、自分もこういうスライド作りを参考にしたいと常日頃思っている。今回の動画中継は録画がないようで (今後もないかもしれないが)、ちょっと残念だが、こうやって資料が見られるだけでもありがたいことである。

夜は東大辻井研のH鳥さん、Appleの木田さん、そしてtetsuo-sくんの4人で広島そごうの五右衛門にて。Appleでのお話とか、MSRの話とか (H 鳥さん、tetsuo-s くん、そして自分は3人ともシアトルの Microsoft Research でインターンをしていた)、いろいろ話して楽しい時間を過ごす。実は同じ時間に同じお店でNTTの方々を中心にお話が盛り上がっていたようで、全然気がつかなかったが、この業界狭いので、ものすごい数の研究者が広島に集結しているのかもしれない。

「本会議の初日 (=大会の2日目)」に約束をしていたのだが、「大会の初日」に約束をしていたとすれ違いがあったりして、大変申し訳ない。紛らわしいので何度も確認するくらいでよかったなぁ……