NLP2014 初日: 若手の会は一期一会

言語処理学会第20回年次大会(NLP2014)の初日。昨日うちの学生たちはNLPフットサルに参加して楽しんできたようでよかった。来年は幹事が[twitter:@pawjun]くんに交代するそうで、バスケも可能性としてはあるらしいので、ぜひこういう機会に他の大学の人たちとも交流してもらいたいものである。

行く道すがら、NTTのM崎さんとお会いする。今日の昼にNLP若手の会シンポジウム(YANS2014)のキックオフミーティングを入れてしまったため、NLP女子会とバッティングしてしまって申し訳ない(今年はNLP若手女子会とNLPお姉様女子会があったらしい?)。ここ5年くらいは言語処理学会の年次大会に来ると、ランチとディナーは全部予定が埋まっていて、にっちもさっちもいかないのであった。

朝は長尾眞先生によるNLPむかしばなし。以前も紹介したことがあるが、日本の自然言語処理についてのうんちくに興味のある人は、長尾先生の自伝を読むとおもしろいだろう(それは取りもなおさず、日本の自然言語処理は長尾先生を中心に回っていた、ということだが)。買う価値はあると思うがちょっと高いと思われる方は、図書館で注文するとよいだろう(少なくともこの業界の人は読む価値はある)。

情報を読む力、学問する心 (シリーズ「自伝」my life my world)

情報を読む力、学問する心 (シリーズ「自伝」my life my world)

午前中はポスターをぐるぐると見て回る。どこもぎゅうぎゅうで、動くのも難しいけど……。やっぱりおもしろいのは甲南大の永田さんによる誤りに関する説明を提示可能な前置詞誤り訂正手法。誤り格フレームを作る、というのは去年の研究だが、それに加えて「なんでこれがよくないか」というフィードバックを返せるのがよい。自然言語処理でも機械学習の上限に近づけば近づくほど、解析精度が全てではなく、結果をどのように提示するか、なぜそのような結果になるか、といったことが重要になってくる(他にも、解析速度や実装のしやすさ、ツールの扱いやすさなど、精度以外の面が相対的に重要になってくる)。特に、教育応用においては必ずしも100%正しいことがいいかというと、そうでもない、というのが永田さんのスタイル(信念?)であるように思うのだ。

昼は少し早く抜けてNLP若手の会シンポジウムのランチミーティングのためのスペースを確保する。[twitter:@niam] さんと @syou6162 くんが来てくれたので、手分けして11人分の座席を押さえる。少しずつ人が集まって来たので順次ご飯を食べ、軽く自己紹介してから今年のシンポジウムに向けた議題の議論。Google Docs で議事次第を共有しておいたら、書ける人が議事録を書いてくれていて、後で見返すとき大変助かった。うちのコース会議でもこのようにできればいいのだが……(わざわざまとめ直さなくてよくなるし)。

ランチミーティング後、[twitter:@overlast] さんと追加で打ち合わせ。4月の早い時期までに動いておかないといけないが、年度末のバタバタで忘れそう……(実際この日記を書き始めるまで忘れていたし、キックオフミーティングを受けたメーリングリスト上での議論も、翌週になってようやくメールを送ることができた)

午後はポスターに戻っていくつか見て回る。共著の発表もあったのだが、打ち合わせで遅れてしまったのと、遠くから見てちゃんとやれてそうだったので、お任せすることにした(なんとなれば松本先生も共著者だし……)。

休み時間に少し ERATO 湊離散構造処理系プロジェクト竹内さんのところに遊びにいく。情報科学若手の会つながりだが、こうして全くの新天地で元気にやっているところをお互い確認できるのは嬉しいことである。やっぱり合宿で2泊3日を過ごしたりすると、1年間でそのときしか会わないとしても、なんだか仲間のような感じになるものである。特に博士後期課程に進学してからは、専門が同じ人とはよく顔を合わせるが、専門が違う(具体的には、投稿する先の全国大会や国際会議が違ったりする)人と会うことが激減するので、ときどき話せるのはありがたい。今後もこういう機会や出会いを大切にしたいものである。

午後の口頭セッション1では[twitter:@taku910] さんの A joint inference of deep case analysis and zero subject generation for Japanese-to-English statistical machine translation を聞く。ものすごく洗練されたモデルやあっと驚くような発見があるわけではないが、日英の(統計的)機械翻訳に必要な言語現象を丁寧に見ていって、一つ一つ解きほぐしていってあげた感じで、なるほどなぁと思う。格交替についても自分の研究では中途半端なところで終えてしまっているので、このあたりに光が当たるのも嬉しいものである。地味に興味があるのは今後の展開に書かれている、係り受けと深層格の同時解析なのだが、このあたりってどれくらい相互作用があるのだろうか?(誰かやらないかな〜)

午後の口頭セッション2は構文解析。質疑も盛り上がって、いいセッションだったと思う。[twitter:@tetsuokxxx] くんの Spinal TAG のための高速な構文解析の発表が分かりやすくてよかった。精度をあまり落とさずいかに高速にするか、という話。ただ、実用上は重要な話だと思うが、言語処理の研究としては、高速化というのだと博士論文にまとめにくいよな〜……。(あと、若手奨励賞、おめでとう!)

本会議のあとは NLP 若手の会の懇親会に参加。参加フォームで「所属と研究室名があれば研究室名を書いてください」とあって、自分で「小町研究室」と書くのも恥ずかしかったので空欄にして出してしまったが、そろそろお呼びでない年齢なのかも……。今回は最後の委員長の仕事もあり、こちらに来たのだが、来年は「第三の会」という30〜40代の研究者の集いの方に行こうかな。

個人的にはこういう実際に実験したり論文をガンガン読んだりしている若い人たちと話す方が刺激になるし、自分からも話せることがあるように思うのだけど……(松本先生も、どうしても逃げられない場合やオフィシャルな懇親会以外は、教授クラスの方々にご飯を誘われても断り、できるだけ学生とご飯を食べようとされるのであった)

いつも学会に参加すると、それまで話したことがない人3人以上と話して帰ろう、と決めているのだが、今回はあっさり達成。いろんな初めて話す人と話せて楽しかった。東工大の [twitter:@m_matsunag] さんは Twitter でだけフォローしている関係だったが、初めてお会いできて光栄であった(自分も Twitter でフォローされていて直接お話するのが初めてだったとき、このように思われたりしているのだろうか)。

あと、東北大の島岡さんとも初めてお話した。去年(学部2年生で)はこの大会の若手奨励賞を、今年は優秀発表賞を受賞されたようで、名前は知っていたが、お話できてよかった。「このあと進学しようと思うが、修士を取るまでに勉強しておいた方がいいことは何か」というようなストレートな質問をいただき、データ構造やアルゴリズム、分散処理などのコンピュータサイエンスの基礎を漏れなく押さえる他に、チームで開発したり、バージョン管理システムを使ったりという開発やソフトウェア工学の基礎的な知識も身につけては、とアドバイスするが、他にも何かないかなぁ、と[twitter:@jun_hatori] さんや [twitter:@marugorithm] さんなど、企業で働かれている方々のお知恵を拝借したり。直近で何をやるか、という話でなく、これから数年かけて何を勉強すべきか、という観点で考えているのがさすがだと思う。どこに行っても活躍できそうなので、ぜひ人生の一部をかけて取り組みたいと思えるテーマを見つけて果敢に挑戦していってもらいたいものである。

自分も、うちの大学の2年生に、これからの3年間をかけてどういう意識で勉強するか、という話をしようと思った。これは研究ではなく文字通りの勉強で、すぐ役に立たないかもしれないが、情報処理の足腰として身に付けておくとよい知識や技術、考え方を習得してほしい。たとえば、とりあえず数ヶ月の瞬発力で身に付ければよい個々のプログラミング言語の知識ではなく、プログラミング言語にはどのようなものがあって、どういう背景で作られているか、みたいな知識とか。そういうのを知っていると、未知の言語に出会っても短期間で習得できるように思うのである。なんとなればこの業界は数年から十数年で言語の入れ替えが頻繁に起きるので、個々の言語を使う能力だけではなく、新しい言語が出てきたときにもすぐ対応できる能力が大事なのである(もちろん、もっともよく使いこなせる言語以上に他の言語が使えるわけではないので、得意な言語の能力を伸ばすことも大事)。

懇親会の中盤で、今回から新しい試みとして、スピーチの時間が設けられた。何人か話したが、[twitter:@kevinduh] さんのスピーチがすばらしかった。曰く、日本の自然言語処理は世界的にもレベルが高く、国際的にも通用する研究がたくさん発表されている。特にみなさんのような若手が中心になって研究をしている発表も多く、すばらしい。ただ、日本の中だけで閉じているのは大変もったいないし、この若手の会に集まった100人が全員今回日本語で書いた論文を英語化して ACL自然言語処理のトップ国際会議)に1本投稿すれば、25本くらい採択されるし、25本の論文が日本から ACL に通ればものすごく日本のプレゼンスが上がる。ぜひみなさん投稿しましょう!というもの。

たぶん自然言語処理人工知能関係の研究をしている人は同じようなことを思っており、たとえば松尾ぐみの英語論文の書き方でも

研究の内容自体は、ほとんどの場合、問題ないです。たとえば、私は、人工知能学会論文誌に載るほぼ全ての論文、そして人工知能学会全国大会で発表される論文の3分の1は、きちんと書けばAAAIに通ると思います。(AAAIは人工知能の分野で最もレベルの高い国際会議のひとつです。)日本の情報系の研究は面白いものが多いです。英語論文を読んで、こんなのが通るの?と思うことが良くあると思いますが、裏返せばそれは、日本の研究のレベルの高さ、そしてそれを補って余りある(?)プレゼンテーションのまずさを意味しています。日本から投稿される論文の多くは、中身の勝負に行く前に門前払いされてます。

とあって、自分も似たような感想。ちゃんと書けるようになって、「こんなのが通るの?」というような論文を通せるようになって、実際そういう論文を通すのがいいかどうかは別問題(たぶんたとえば企業の人が見ると論文のための論文を書いているように映る)だが、もっと注目されていい研究がある割に投稿をためらって埋れてしまうデメリットの方がはるかに大きいと思うので、もっと日本からバンバン投稿したほうがよいと考えている。(研究を評価するのは自分ではなく他人なので、思った以上に過小・過大評価されることはつきものだし)

自分のスピーチでは次期若手の会委員長のアナウンス。PFIの[twitter:@unnonouno] さん、NTTの[twitter:@hitoshi_ni] さん、東北大の[twitter:@chokkanorg] さんの3名が、2015年から3年間に渡って NLP 若手の会を盛り立てていただけることになった。それぞれの方が、若手の育成や若手からの発信に理解と行動力があり、ベストな方々にお願いできたと自負している。@unnonouno さんの抱負のスピーチもおもしろく、これからの3年が楽しみである。自分は最後の年をなんとか勤め上げ、しっかりバトンタッチしよう。

懇親会のあとは2次会(いわゆる「関根会」と呼ばれるシニアの会、若手の会、第三の会の3つの会の合同で開催される2次会)へ。ちょっといろいろあって1時間弱しか滞在できなかったが、ここでも初めて話す方々とお話しできて満足。だんだん知り合いばかりになってしまったかなと思うのだが、まだまだ世界は狭い(笑)

逆に、今回は滞在時間も短いせいで、お久しぶりの人たちと遠くから顔を見かける程度でほとんど喋れなかったのが心残りであるが、この業界にいればまた会える方々なので、またお会いしたときに旧交を温めようと思うのである。若手の人たちは一期一会なので、こうやって学会や懇親会に参加して、楽しかったと思えば今後も来てくれるようになるかもしれないが、ひとりぼっちの時間が長くてつまらないと思えばもう来てくれなくなるかもしれないので、せっかく勇気を出して学会まで来てくれたのだから、楽しい思い出を作って帰ってもらいたい、と思う。