言語的知見を活かす NLP

PACLIC の2日目。今日はお昼まで参加できて、午後は空港に移動するという予定。昨日の夜に地元の結婚式っぽい集まりがあったので少し見てみたが、かなり日本とは違いそう。

午前中に聞きたかったのは Emily Bender (@emilymbender) さんによる基調講演で、言語学自然言語処理のいい付き合い方について、という話。自分も元々は言語への興味から自然言語処理に来ているので、話は全部同意。Language Processing: 100 Essentials from Morphology and Syntax という本を思い出した。

その上で、「深層学習の登場で言語生成の研究が活気付いていて、うちの研究室でも機械翻訳を中心に取り組んでいるのですが、評価を含めて言語学的な分析や知見を自然言語処理で活用していくのは、両方の知識がないと難しい面もあると思うのですが、どうしたらいいですか」という質問をして、回答は「エラー分析をしましょう。エラー分析をすれば、言語的な側面を見ることになるでしょう」というもので、それはそうなのだけど(いつも論文を書くときは必ずエラー分析をしているし)、聞きたかったのは、たとえば言語学の知見を使うにしても、背後がブラックボックスで分析してなんとかなっていたのは深層学習登場以前の話で、いまはむしろ中身がどのように動いているかを知らないとエラー分析もできないのでは、ということが知りたいのである。

深層学習の方が中身がどうなっているのか分からない、と言われることが多いので、逆説的かもしれないが、言語生成とその評価については、分類問題とは違って探索空間が膨大なので、何らかのモデルを仮定して分析しないと分析できないのではないか(あるいは全く見当外れの分析をするのではないか)、と思うのである。Google のニューラル機械翻訳を試していろいろ(しばしば明後日の方向に)推測している記事を見たりすると、特に2つの分野をうまくつなぐと双方にとって有用なのではないかと思っている。

お昼は @otoguro さんとランチ。Twitter ではつながっているのだが、こうやってお会いしてお話しするのは初めて。研究の話、学会の話、大学の話、家庭の話やら、いろいろ突っ込んだ話ができてとてもよかった。今回 PACLIC に来て一番有意義な時間を過ごしたように思う。来年の PACLIC ははこだて未来大のようなので、来年も都合つけて参加してみたい(とりあえず Google Calendar に予定を登録した)。

午後は電車で空港へ。行きは深夜だったこともあって空港からタクシーで直接ホテルだったが、電車で移動するといろいろその土地の様子が見られるので楽しい。

帰りは少し飛行機が遅れ、最終電車に間に合わないかと少しヒヤヒヤしたが、なんとか高速バスで新宿まで出たら終電に間に合った。今回は日程的な都合(金曜日に授業をしてから飛行機に乗ろうとすると他に選択肢がなかった)で LCC(香港エクスプレス)で来た訳だけど、やはり LCC ではなく普通の航空会社の便で来た方が楽だな……。