NLP 2012 本会議2日目: 研究の流行り廃りはあるが、いつの時代でも大事なことを研究したい

朝、路面電車でバスセンターに行き、そこからバス。路面電車が生活に溶け込んでいるのが素敵。ただし広島市立大には電車で行こうとすると大変みたいだが……

今日も9時からTwitterと言語処理2012というセッション。最初プロジェクタが写らないというトラブルがあったが、[twitter:@shuyo]さんが安定したおもしろさの「極大部分文字列を使った twitter 言語判定」について話してくださる。やっぱり言語ラブな人の話は聞いていて楽しい。極大部分文字列のところも研究の一つのポイントになっているし。

あと共著で kodai-t くんによる「Twitterを利用した評価極性辞書の自動拡張」の発表。彼の研究のベースには東大の鍛治さんの辞書が使われているのだが、その鍛治さん直々に座長をされていたので、自分も緊張。発表後も奥村先生が「今回の研究は (名詞, 格助詞, 述語) の3つ組を使うところがポイントだと主張しているが、そもそも述語だけで極性が決まるものもたくさんあるので、名詞を入れると specific な3つ組ばかり取れてしまうことにはならないか?」という質問をされていて、確かにこういう取得する要素の粒度をどのようにコントロールするのかは重要な課題だと思ったり。

このテーマセッション最後は[twitter:@keita_f] さんによる、「Twitter における日本語処理について」。おっしゃることはどれも予想した通りだな〜。自然言語処理で博士号を取ったような人が行けばまた違ったのだろうが、これでもちゃんと日本語対応が入っているだけでありがたいことである。むしろ、大学院で自然言語処理をやることにした学生で、将来ソフトウェアエンジニアとして海外で働くことを視野に入れているなら、本当に、本気で、ちゃんと英語を使えるようにしたほうがいいと思う。少なくとも、自分の仕事 (研究なり開発なり) については英語で議論できるくらいの水準で使えないと、いくら働きたくても話にならないというか。一番早いのは、実際にそういう場所で英語を使うことで、たとえば外資系の企業に勤めていてビジネスで使うなら仕事をしていても身に付くが、そうでなくても国際的なオープンソース開発に参加していれば、いくらでも議論は英語でやるので、特に学生のうちからそういうのに参加しておくことは有意義だと思うのである。自分の使っているプログラムの小さな問題を解決する1行パッチでもいいので、なにかネタがあれば開発に参加してみることをお勧めする。

お昼は NLP 若手の会のプログラム委員のランチミーティング。場所が分かりづらいので [twitter:@overlast] さんと迷ったが、なんとか到着。普通の部屋を想定していたら、なんとものすごく見晴らしのよい、総本部かなにかのような開放的な空間で、注文してくださっていたお好み焼きとともにお茶も用意してくださる。ここでも [twitter:@ayayan1028] さんの心遣いに感動する。今回広島市立大の学生アルバイトの管理は全部 @ayayan1028 さんがやってらっしゃるそうだが、もはや彼女に足を向けて寝られない感じである。

ランチミーティングは、時間は少なかったものの、少し前に進んだ感もあり、こうやって顔を合わせるのは重要だなと思った。しかしこれだけ人数がいると、次に会うときまでに誰が何をどうするのか、ということを決めておいたほうがいいのかもしれない。(というか、甲南大の永田さんと準備しているワークショップでは、毎回永田さんが議事録を送ってくださるのだが、自分などはミーティングの1週間前に慌てて議事録を読み、自分がやることになっている作業を大慌てで進めたりしているわけだが……)

お昼はちょっとのんびりしたかったので、自販機でお茶を買って学食で [twitter:@hitoshi_ni] さんと @overlast さんとまったりひなたぼっこしながら話す。他愛もない話ばかりなのだが、4日間の行程の中で、唯一心底ほっとすることができた時間だった。前後左右全て何かの予定で埋まっていて、常に次の予定があったからなぁ……。こういうゆったりした静かな時間って、自分の人生ではどうやったら作ることができるんだろうか、と思ったりした。考えてみると、中高のころからの友人と会うときは、大体こんな感じかもしれない。お酒を飲むでもなく、昼間っから適当に会って、多くても2-3人くらいで、なんだか喋って、疲れて解散して。大学以降にできた友人は、会うと言ってもご飯を食べたり飲んだりするのが主で、そして4人以上で会うことが多い (それはそれで楽しいので、それが悪いというわけではないが)。

午後は招待講演2本。Patrick Pantel さんの招待講演は、最近 Microsoft Research でなさっている Entity-Centric Search という研究テーマに関するお話。大きな見取り図の話と個別の研究の話とが混ざっていて、なんだか切り替えにギャップがあったが、質疑応答が盛り上がってよかった。自分も質問しようかとしたのだが、昔ほどウェブデータからなにか抽出することをおもしろいと思わなくなっていて、それよりはウェブデータ (に限らずいろんなテキストデータ) を分析するための基盤技術をいかに提供するかのほうにやりがいを感じるようになってきたかも。今回の言語処理学会年次大会でも、最終日の形態素解析のセッションが異様な盛り上がりを見せていた (立ち見が続出) が、[twitter:@klmquasi] さんがおっしゃるように、形態素解析は一度は完成した技術だと思われて、研究分野としては捨て去られた感があったが、そんなことはなくて、最近またいろんなおもしろい問題が出てきて盛り返していると。確かにな〜

2番目の招待講演は市川先生による障碍者や高齢者の対話の話。手話や指点字についてのお話、非常に興味深い。音の情報がどこまで意味あるか、みたいな話、ふだんテキストしか見ていないと、分からないからなぁ。自分も祖父が気管切開して話せなかったとき、自分の研究ってこういう状態にある人とコミュニケーションが取れるようにするために使えたりしないなら、何のためにやっているんだ、と本気で思ったことがあり、そのことがその後の自分の人生の選択に少なからず影響を与えているのだが、こういう大事な仕事はぜひ続けていってほしいと思う。

夕方はポスターセッションだったが、[twitter:@kow_k] さんや [twitter:@niam] さんと話したり [twitter:@hitoyogusa] さんの発表を聞いたりしつつ、[twitter:@pavlocat] くんと論文の打ち合わせをしたりしていたらあっという間に終了。なにをしに来ているのか謎……。

懇親会では[twitter:@taku910] さんや[twitter:@hidetokazawa]さんに最近の松本研のお話をしたり (最近研究室内メールも、日英並記が面倒くさくなって英語だけで書くようになってきた)、[twitter:@yusmi] さんたちから東大というか国立情報学研究所や東北大のお話を聞いたり、なんだかよく分からないうちに時間に……。とりあえず [twitter:@presri] さん厳選の日本酒コーナーは相当素晴らしかった (2/3くらいは試したと思う)。しかしこれだけ飲むと、すぐ眠くなることが分かっていたので、2次会に誘われたがそのまま帰宅。久しぶりに妻と1時間半電話できて大満足だったが、結局電話終了後すぐ寝落ち……。体力の限界がすぐ来る〜るるる〜