ACL 2012 本会議2日目: 博士号取得後3年経ってようやく研究者としての自覚ができてきた

チュートリアルの日と初日は晴れていたのになんだか雲行きが怪しい……。(写真は夕食で食べた参鶏湯)

朝食のとき [twitter:@hjtakamura] さんから「自分で手を動かして研究ができるのは40歳まで」と (また) 聞き、いやいやなんで自分は手を動かして研究していないのかとじっと手を見たり。正確に言うと、(実験のための) コードを書いたり自分で一から論文を書いたりする時間がないだけで、広い意味での研究には携わっているのだが (コーパスを作ったり、論文ではないが研究に関する文章を書いたり)、やはりまだ第一著者として論文を書かなくなるには早いと思っているので、毅然と時間を作らないといけないなと考えたりはする (ここ1ヶ月ほど)。

朝のセッションは Best Paper Award を受賞した [twitter:@haplotyper] さんの発表。とても分かりやすいし、質問が次から次に殺到していたのに、全部すらすらと答えてらして、本当にすごいと思った。(3日間 ACL の全部の発表を聞いてからこの文章を書いているが、自分としては文句なく @haplotyper さんの話がいちばんおもしろかった)

午前中は Social Media → User Generated Content のセッションへと移動。今回の会議は5分間部屋の移動時間を取ってくれるので、セッション中に部屋を移動しやすくて非常によい。5パラレルなので、そうしてくれないと聞きたくても聞きにくい発表が続出するからかもしれないが……。

ランチは [twitter:@pavlocat] くんが「使わないのでよかったらどうぞ」と前払いのチケットをくれたので、会場のレストランに行ってみる。ACL は毎回初日か2日目のランチが Student Lunch になっていて、今日は Student Lunch の日だったので、レストランも空いていたようである。鍛治さんとお話したかったので、[twitter:@sryang_] さんと3人でいろいろとお話する。

午前のセッションでも Twitter だとかなんだとか、そういうメディアのテキスト処理の研究をけっこう見かけるが、たくさん論文が出るようになったらもはやブームは終わりで、目につく簡単にできる仕事はやり尽くされて、ひとひねりふたひねりしないと論文は書けませんね、というお話をしたり。機械学習 (教師あり学習) で分類問題にして解くなんてのは、解くべき問題が重要 (未解決) なら手法はそんなに目新しくなくてもよいのでありだと思うが、あまりわくわくするような話でもないというのは、確かにそう。識別の課題ではなくこれからは生成の課題のほうがおもしろいんじゃないか、というテーマでひとしきり盛り上がる。確かにいま (機械翻訳を除くと) 生成系の研究は下火だが、Apple の Siri が火を点けた音声認識や対話をしてくれるようなシステムが流行ってきたし (これは本当にすごいことだと思う)、意外と最近は道具が揃ってきていてインパクトの高いことができるようになってきているのかもしれない。

昼はデモセッションがやっていたので少し見て回る。単に自分の研究の関心が近いせいだが、

  • MeiHua Chen, ShihTing Huang, HungTing Hsieh, TingHui Kao, and Jason S. Chang. 2012. FLOW: A First-Language-Oriented Writing Assistant System. ACL 2012. Demo Session.

は自分が作りたかったものにかなり近く、そりゃ手の動く人がいれば作るグループもあるよなと改めて思う。このシステムはブラウザ内で動作し、中国人が英語を書くことの支援を想定しているもので、英語をタイプしていくと周辺の文脈 (直前に書いた数個の単語) から続きを予測入力できたり、英語が分からなかったら中国語で書けば、周囲の英語も情報として用いて絞り込んだ英語を出してくれる (上位5件までを表示) というもの。また、英語で書いたけどこの部分もっといい表現がないか? と思ったら、その部分をマウスで選択したら対訳コーパスから抽出したフレーズを用いて英語→中国語→英語と翻訳して同義となる表現をサジェストしてくれる (この部分はあまり賢いことはしていないが)。個人的には第二言語学習者のテキスト入力は、日本人が日本語入力システムを使うような形で入力メソッドとして実現するようになるとよいのではと考えているので、現状はともかくこういう方向でみんな作ればいいんじゃないかなと感じた。

午後は Machine Learning I → Relations → Topics と回る。昨日と同じだが、どの発表も微妙な感じ……。

  • Max Whitney and Anoop Sarkar. 2012. Bootstrapping via Graph Propagation. ACL 2012.

は、自分が4年前にした研究と似ているかな? と思って聞いてみたのだが、似ているというかほとんど同じであった (が、自分の研究は知らなかったようなので、セッションのあと話しに行って宣伝しておいた。)。全く意味がない仕事をしているというわけではないが、過去の研究を踏まえたら (ちゃんと押さえていたら、割と) 自明な延長線上をやった、という研究が多く、本質的に自然言語処理という分野に対して貢献をしているのか疑問 (というか不安) に思ったりする。それでも実用上意義があるならまだしも、実用上も性能がそんなによいわけではなかったりして、何をどう解いたかではなくどのように書いたかのほうが重視されているのかなという印象を受けたり。

アメリカでは自然言語処理分野で PhD を取得しても必ずしも研究を続けるわけではなく、エンジニアとして就職する人も多かったりするし、「決められたお作法に従って、メジャー国際会議に通るような論文が書けるようになる」というのが PhD を取った人の備えているべき資格だとすると、自然言語処理分野に対して貢献するというのは PhD 学生としては必ずしもそんなに動機はないのかもしれず、論文の数を稼ぐ書き方を身につけて実際実践する、というようになっているのかもなぁ。

とはいえ毎年出しもせずにそんなことを考えていても負け犬の遠吠えに過ぎないので、とりあえず来年は出すだけでも出せるようがんばろう。

夜はバンケットに行く人たちと別れ、[twitter:@akf] さんと ny23 さんと3人で夕食。これくらいの人数だとまったり話ができるので嬉しい。@akf さんとはいろいろと積もる話を直接お話してみたかったので (けっこう、というかしょっちゅうメールで相談に乗っていただいているが……)、ありがたい。ny23 さんともじっくりお話できて、とても楽しかった。やはり少し上の世代の研究者の方々と話すと参考になる。悩みはどこも同じというか、解決策があるわけではないが、自分はこうしよう、こうしたいな、と思えることが増えてきたかな。(解決するかどうかというより、研究者として、あるいは教員として自分がどうしたいのか、なにをするべきか、というのが少しずつ地に足がついてきた感じ)