ACL 2012 本会議最終日: 来年は木置換文法が流行りそう

朝から雨……。一応折り畳み傘を持ってきてよかった (出発前日にイオンで購入した)。写真は初日にホテルから撮った眺めである。初日と2日目しか晴れていない……

Lifetime Achievement Award は最初聞き逃してしまったが、FrameNet の Charles Fillmore 教授 (UC Berkeley) が受賞されたようである。言語学の人はほとんど自然言語処理の国際会議には来ないと思っていたのだが、数年前に ACL にも来られたそうで、もっとこういうように言語学と言語処理で交流があればよいな。

2つ目の招待講演は Mark Johnson の "Computational Linguistics: Where do we go from here?" である。1つ目の招待講演が ACL のこれまでの50周年を振り返るものだったので、これからの50年がどのようになるか、というようなお話をしてほしい、というのがお題だったそうだ。

トークのコアの部分は、今までの自然言語処理の研究は精度至上主義で積み上ってきたが、これからは精度が全てではない、という主張。別の言い方をすると、「構文解析を精度XX%にするには$YYYかかる」あるいは「語義曖昧性解消の精度をZZ%にするにはどれくらいのデータが必要か?」というような観点が重要で、精度がよければ万事問題なし、という時代は終わった、ということである。

企業で自然言語処理に取り組んでいる人には自明な話だと思うし、内容は割合自分には至極当然のことを言っているように思えたが、たぶんそれは彼と自分が同じような考え方をしているからで、もしかするとそういう見方をしていなかった人はドキッとしたかもしれず、全体としてはよかったように思う。

あと研究としてこれからおもしろそうなのは

の3つの分野であると挙げていて、確かにこのあたりは研究がどんどん進んでいるところなので、いま自分が17歳だとしたら脳神経科学をやりたいと思っていたかなと思う。(第一) 言語習得も個人的には興味があるが、いまは第二言語習得かな〜。

午前中のセッションの最中 [twitter:@yukino] さんから連絡があり、Hisami さんが今日来ているので Hisami さんのところでインターンシップをした MSR のインターンで集合写真を撮りましょう、とのことだったので、ランチタイムに集合。tetsuo-s くんだけ合流できなかったが、古い順に自分、[twitter:@mhagiwara] さん、[twitter:@jun_hatori] さん、@yukino さんと揃い、全員で写真を撮る。こういうふうに同窓会ができるのっていいなと思う。前も紹介したが、「マイクロソフト・リサーチで言語処理・言語研究に携わって」は名文だと思うので、言語処理に興味のある学生の方々におかれては、ぜひ一読されたい。

ランチのあと [twitter:@pavlocat] くんと合流して発表スライドの確認。すでに社会人ということもあり、あまりじっくり見てあげられなかったが、だいぶがんばってくれたと思う。自分が発表するのと比べるとハラハラ具合が全然違うが、自分にできるのは見守ることくらいだし、むしろ仕事で忙しい中ここまで自分で準備してくれて、感謝するばかりである。

そして運命の NLP Apps II セッションだが (どうでもいいが2年前 NLP.app という名前の勉強会を作ったが、半年で解散して言語教育勉強会と意味談話解析勉強会に戻ったのを思い出した)、本会議最終日にも関わらず、けっこう人が来ている。明日からの EMNLP に参加する人がこちらにもちょっと出ているのもあるのかもしれない。個人的には @pavlocat くんの一つ前の

  • Benjamin Swanson and Eugene Charniak. 2012. Native Language Detection with Tree Substitution Grammars. ACL.

が大変おもしろかった。タスクとしては英語学習者の書いた作文からその人の母語を推定するというものなのだが、推定に使う素性として Tree Substitution Grammar で抽出される木構造の断片を全部使うと state-of-the-art になったという話だが、さらにエラー分析・考察をしてみた話がおもしろい。フランス語が母語の人が犯しやすい誤りの木構造の断片をフランス語が分かる人に見せてみると、実際それに対応するフランス語の表現があるとか、判別に失敗する割合が高い言語ペアは語族的にも近いところにいるとか。

なるほどと思った話は、ノルウェー語とスウェーデン語 (ともに印欧語族) とフィンランド語 (ウラル語族) の3つも判別に失敗する割合が高いのだが、このうちフィンランド語は語族がノルウェー語・スウェーデン語と違うのになぜだろう、と思って調べてみると、フィンランドでは実は小学校で ノルウェー スウェーデン語 (2012-07-11 修正。uranishi さんどうもありがとうございます) が必修で、第二外国語として中学校から英語を履修するので、母語以外にも誤り傾向に影響を与える要因がありそうである、ということが分かったとか。

こういう分析ができるのも、Tree Substitution Grammar だと木構造の断片を見て解釈というかデバッグ (?) しやすいおかげだ、と聞いて、俄然興味が出る。たとえば品詞と単語両方を含むような木の断片を獲得できたりするので、言語学の知識を活用しやすいようである 。Best Paper の [twitter:@haplotyper] さんの研究も Tree Substitution Grammar の話だったし、これは一度活用してみたいな。

@pavlocat くんの発表は無事終了。質疑応答も、2人からの質問に応対し、まあ一応完了 (たぶん答えられると思った内容が答えられなかったが、あとで松本先生がフォローを入れてくれていたらしい)。終了後2人熱心に質問してきた人がいて、1人は英文誤り訂正ソフトを作っているアメリカの会社の人、もう1人は韓国の博士後期課程の学生で英文誤り訂正を研究テーマにしている人で、有意義にいろいろと意見交換できてよかった。こんなに熱心に聞いてくれるのはさすがである (ちゃんと内容が伝わったということだろう)。発表お疲れさま!

夜はそういうわけで @pavlocat くんの慰労会。[twitter:@hidetokazawa] さんが「小町くんと今回まだ一度もご飯食べてないから食べましょう」と誘ってくださったので、[twitter:@taku910] さんや [twitter:@nokuno] さんらとともに焼き肉。日英翻訳のもろもろについてあれやこれやお聞きしたり、最近の松本研についてお話したりする。韓国には1週間近く滞在していたが、焼き肉らしい焼き肉を食べたのは実はこれが最初で最後かもしれない。(けっこうおいしかった。払った金額はいつも食事に払っている金額の5-10倍だが……)

3日間の本会議が終わったが、すでに疲労感がかなりあり、4泊5日くらいで止めておけばよかったかと少々後悔気味……。