ACL-IJCNLP 2009 本会議初日

シンガポールに来たのはこの会議に出るためだが、それの初日。

ちゃんと会場の場所を確認していなかったので、朝迷ったが、なんとか招待講演の前に滑り込むことができた。招待講演は転移学習のチュートリアル的な話だったが、これならサーベイ論文読んだ方がいいような気がする(分かりやすく伝えようとしてくれているのだが、むしろ分かりにくいみたいな)。自分の研究ばかり紹介しているので、確かにチュートリアルでなく招待講演なのでそれはそれでいいとは思うが、全体でなにが問題なのか分かりにくかった。

午前は統計・機械学習の手法のセッションに出る。Percy Liang の "Learning Semantic Correspondences with Less Supervision" が一番の目当てだったが、話を聞くとそんなに目新しいような感じではなかった(このセッションよりは Semantics のセッションのほうが合っているような?)。生成モデルで文章と logical form の対応づけをする、というのがキモで、あとは生成モデルをマルコフモデルにしたらうまくいった、という話(でも質問でも何人か聞いていたが、マルコフモデルでなんでうまく行くのだろう。なにもしないよりはましだと思うのだが、グローバルな制約はマルコフロジックとかで書かないとだめなのでは?)。

他のトークは、daiti-m さんの話のほうが(なにに使えるかはさておき)おもしろいと思うのだが、人も一気に減ったし質問もあまり出なかった(EMNLP のほうが盛り上がるんだろうか)。このセッション最後の "Knowing the Unseen: Estimating Vocabulary Size over Unseen Samples" の Suma は MSR のインターン同期だったのだが、こういう形で再開できて嬉しいものである。彼女も元気にやっているそうだ。

Student Lunch ではフランス・インドネシアからの学生たち、中国・イギリス・韓国からの留学生たちと食べる。それぞれの国で PhD の学生生活について聞いてみたらやっぱりそれぞれ違う。中国の清華(下記コメント参照)大学の話を聞いたら、国際的なインデックスに登録されるジャーナルか国際会議に4本通さないと卒業できないらしく、それでみんながんばってがんがんトップ会議に論文出すそうだ。道理で……。

午後は機械翻訳のセッションと情報抽出のセッションに出る。どれもどうだというものではないが、McIntosh and Curren の "Reducing Semantic Drift with Bagging and Distributional Similarity" は関連研究なので聞かなければ、と思って行ったので、一応感想を書いておくと、確かにいろいろ調べていてたぶんよいのだろうなとは思うのだが、実験設定が一般的な設定ではない(毎回の反復で5個のインスタンス・5個のパターンを取得しているが、意味クラスを学習するタスクで取得するインスタンス数としては少なすぎるし、パターン数としては多すぎる)ので、本当にいいのかどうかが分からない。この個数で1000個取得するためには200回反復を繰り返さないといけないはずだが、200回も反復を繰り返す前に必ずドリフトするはず(power method 使うと収束するのはせいぜい数十回)で、なにか違うことをやっているはずなのだが、なにが違うのか発表だけでは分からず。あと意味ドリフトの検出の式を提案したとあるが、shimpei-m くんもこういう話を今年の言語処理学会の年次大会でやっていたので、もうちょっとがんばればよかったのになぁ、と思ったり思わなかったり(仕事しながら研究は難しいのだろうけど……)。

しかし時差ボケが午後襲ってきて途中から激烈に眠かった。明日に備えて寝ることとしよう。