メイちゃんと楽しく会話するシンポ

名古屋に日帰り出張。朝5時半に家を出る。前回の広島出張も朝早かったが、6時前だと寒いのでけっこうしんどい。

今日は情報処理学会自然言語処理研究会(NL研)で名工大へ。名古屋にはかれこれ5-6回来ていると思うが、いつも名大で、名工大に来るのは初めてである。名工大の場所すらよく知らなかったが、名古屋駅からたった2駅で、かつ駅前から大学までは公園の中を歩く、という非常によい環境。学生が育つためには交通アクセスも重要であると思うのだが(活気のある企業でアルバイトしたりしやすい)、これは交通至便でよい。まあ、逆に遊ぶ学生も増えるので上下の差が激しくなる、ということの裏返しでもあるが……(田舎に閉じ込められると、みんな研究室に来るしかないので、引きこもりにならない限りは、みんなそこそこ力がつく)

名工大といえばメイちゃんで、今年度は B3 の人たちに MMDAgent という対話エージェントの実験をしてもらっているのだが、このメイちゃんが名工大を中心に開発されているということで、入り口にデモがあったのでパチリ。

NL研自身はいつも通りニコニコ生放送で配信できてよかった。有線接続で生放送に必要なポートを開けて配信するために事前に申請していた MAC アドレスが実は有効ではなく、新たにもう1つ申請してもらったそうだが、なんとかなってよかった。なんだかこういうトラブル対応ばかり [twitter:@shin_kan0] くんに任せている木がするが……。

今回は色々おもしろい発表があり、一番興味深かったのは(優秀研究賞を受賞した)[twitter:@shirayu] くんの話。彼の日記に詳しいが、格フレーム辞書を構築するときに、いくつかヒューリスティックスを入れることにより、格フレームの細分化を行う、という話のようである。評価がちょっと微妙な(間違っているというほどではなく、提案手法の利点は主張できている)気がするが、それを除けば非常によい話。

自分も修士のときには述語項構造解析の研究をしていて、結局意味に関するタスクというのは述語と述語の共起、述語と項の共起、名詞同士の共起、というような統計的に推定する共起情報と、この述語・名詞にはこのような項(関係)構造があるという辞書的知識の2つが最も重要であり、逆に言うとこの2つ以外の情報はほとんど聞かないのでは、という感触がある。

そこで、M2 以降は格の交替に関する辞書を作成したり、授受・使役・可能・受け身・願望のように格の追加や交替についての現象をまとめたりしていたのだが、文内の関係はまだ統語的な情報(パターン)を使うことができるので人手で書けば少しずつカバーできるようになるだろう(そのため、リソースを作成する意義がある)。問題は、なかなかこういうリソース作成に(研究として)興味を持ってくれる人が少ないので、現実的には継続しづらい、ということであるが……(大きな研究室であれば専属のアノテーターを雇えるのだろうが、小さな研究室だと継続的に予算を確保するのも難しい)。

意味解析は文内と文外(文間)の間にいるのでどちらの性質も持ちうるし、うまく文外(文間)の情報を入れる(たとえば one sense per discourse)ことが効果あったりするのだろうが、1文を超えた関係は(人手で辞書的に何かを記述するというアプローチでは)ほとんど無理筋では? とも思っている。このあたりは、解析モデルとして何か効果的なものがまだ提案できるのではないか、という気がしている。

あと、[twitter:@akivajp] くんのフレーズベース統計翻訳のための能動学習もおもしろかった。フレーズを翻訳してもらう、というのがどれくらい実際に人間に負荷をかける(あるいはかけない)のかが問題であるが、人手の評価結果も順当であれば、これは普通にメジャーカンファレンスに通るのでは。

最後に、意味の構成性に関してオフラインで少しディスカッションできたが、うちだけではなく他のところでも同じようなことを考えて同じような実験をしているのだな、と思って、有意義に感じるとともに、これはレッドオーシャンなんだな、ということを改めて痛感。日本国内でも複数箇所でやっているなら、世界的にはもっとたくさんやっているのだろうな……。

今回は研究的に色々と興味深い話を聞くことができて、とてもよかった。質疑応答もかなり密度が濃かったし、「自然言語処理シンポジウム」ということで冬の一つのイベントとしてやるのは有意義だと思う。まだ2回目だが、今後どのようなイベントに成長するのか楽しみである。