自然言語処理で博士号を取得した最優秀学生は企業に行く

午前中ミーティングしてからお昼は @uchumik さんと @shichiseki さんと学研北生駒駅近くのべに江 真弓店にててんぷら。このお店、前 @mizukirc ちゃんと @takashi_nakano くんや @okeihaan さんたちと論理生命学講座の D3 の人たちの公聴会お疲れさま会をしたときに紹介してもらったところである。目の前で揚げたてを持ってきてくれるのでおいしい(が最近自分の体の油の分解速度が落ちてきた気がする。大丈夫だろうか)。

お昼からまた Pantel さんを迎えに行く。車の中で、他の学生の審査委員をしたときの話を聞く。最近 StanfordRion Snow さんの外部審査委員もしたそうなのだが、彼は履歴書もすごく、ソーク研究所(知らない人のために補足すると、ソーク研究所は生命科学分野では知らない人がいないほどの有名な研究所で、数多くのノーベル賞受賞者を輩出している)で研究員をしてから、Microsoft Research、Google Research でインターンをして、なおかつ Powerset という検索エンジンのスタートアップ企業(現在は Microsoft に買収された)でもインターンをしており、彼がどこに行くのかというのを世界中の自然言語処理研究者が注目していたようだが、なんとTwitter で働き始めたそうである(Why Work at Twitter? の下のところを何回かクリックすると出てくる。上記 Pantel さんのページにも現在 Twitter所属であることが書いてあるが) 。我々の分野のトップ会議の best paper award を200年に受賞したし、いろんな研究所が獲得に動いたらしいのだが、スタートアップ企業で働きたいという彼を説得することに失敗したということだ。うーん、そうなのか。

日本でも自然言語処理分野の研究でここ数年突出した業績を挙げているのは@hillbig くんと@mhagiwaraさんだと思うのだが、@hillbig くんは PFI での仕事を続けるそうだし、@mhagiwara さんはバイドゥで働いているし、自然言語処理の研究は突き詰めると大学で続けるより企業のほうがおもしろいのだろうなという気はする。誤解のないように書いておくが、自然言語処理分野の博士課程に魅力がないと言っているわけではなく、自然言語処理分野は大学と企業の垣根がそこまで高くないし、企業の中にいてできることと大学の中にいてできることを天秤にかけると、企業の中にいるほうがいろいろと動きやすい、という状況が往々にしてあり、企業の中のデータを使いこなせるくらいの腕力がある人は、企業のほうが能力を発揮させやすい、ということである(データ構造やアルゴリズム、分散処理などにも通じていないといけないので、大学で自然言語処理だけやっていればいいという話ではない)。

2月までに進路届けを出しなさいと大学院から言われているのだが、いろいろと考えさせられる一件であった。

ちなみにGoogle 技術講演会 in 大阪が1月30日に開催されるらしい。

講演題目:Google 日本語入力を支える情報処理技術

講演者:工藤 拓

講演概要:
本講演では、Google 日本語入力に使われている様々な情報処理技術を紹介する。
Google 日本語入力は、これまでのインプットメソッドの設計にとらわれない
新しいアプローチで設計・実装されている。日本語入力システムは様々なアプリケーションとして
協調して動作する必要があるため、高い堅牢性とセキュリティ保護機構が必要となる。
発表ではまず、Google 日本語入力の内部設計に触れ、それらが堅牢性と
セキュリティー保護にどう貢献しているか、従来法との比較を交えながら紹介する。
さらに、大量のウェブページを用いた辞書の自動構築、統計的自然言語処理
活用したランキングの学習、語彙集合の効率的な圧縮方法について解説する。

とのことなので、就職希望の学生さんたち(でなくてもいいので、特に NAIST とか近隣の大学の情報系の院生の人たち。進学希望含む)はぜひ行ってみてはいかが?

さて、そういうわけで話は尽きないのだが、以前案内したように、Patrick Pantel さんによるトークがあった。残念ながらビデオアーカイブはない。NAIST の講演は講演者の同意があれば全部アーカイブされており、学外の人でも自由に見ることができる(ただし、一部の講演は学内の人しか見られない)。2006年の分からあるようだが、自分は2005年入学なので知らなかった。すごいなぁ。

トーク自体はけいはんな自然言語処理メーリングリスト(誰でも参加できる)で当日朝に告知したため、外部の研究員な方々にもお越しいただいたようで、小さい教室が埋まるくらいの盛況。M1 の学生はもうこの時期ほとんど授業もないし(4月から7月の間に講演すると単位取得のために100人近く出席する)人が集まらなくて閑散としていたら悪いなと思っていたのだが、杞憂であった。質疑応答も非常に活発で、すばらしい。むしろ質疑が次から次に出て規定の時間を15分くらいオーバーしていた :-)

話の内容は去年にやっていた研究2つの紹介で、自分は両方の論文も読んでいたし、前半部分の話は2年前にも去年も聞いたし、というわけで、分かりにくいところはなかった。むしろ、この後なにをしていたのかが気になるのだが、今回のトークは M1 向けに(つまり自然言語処理の知識を仮定しないで)用意してほしいとお願いしていたので、突っ込んだ内容も入れられなかっただろうし、あとのディナーのときに詳しく聞いた(笑) kmurakami さんは「詳しくなにやっているか分からない」と言っていたのだが、ちょっと今回のトークを M1 向けで用意してもらったので説明不足になり、申し訳ない。

トーク終了後、@akfさんを北生駒駅でピックアップして、8人できのこ料理 創士庵へ。自分はランチでしか来たことなかったが、「えっ、これがきのこ」と思うくらいおいしかったし、個室があるそうなので、予約してみたのだ(今回は8人だったが、テーブル2つあったので、16人くらいまで行けると思う)。きのこ料理(きのこフルコース)、Pantel さんを含め habib-a さんや calvo さん含め、外国の人たちの口に合うか分からなかったが、きっと日本でしか食べられないものだと思うし、少なくとも記憶には残るからいいかな? 概ね日本人の人たちには好評だったが、かなり日本人向けの味付けであるようには思う。メキシコ出身の calvo さんは「うちの母が作る料理みたいでおいしい」と言っていたが、Appleインターンしていたときのルームメイトの Laura もメキシコ出身で、彼女と料理の好みが自分は非常に似ていた(メキシカンは辛いイメージがあるが、薄味の料理もたくさんある)ので、きっとメキシコ人と日本人は味覚が似ているのだろう。habib-a さんは前一緒にご飯食べたとき「パキスタンではスパイスをもっと使うので tasty だけど、日本の料理はほとんど味がしないので、ソースをかけないと食べにくいことがある」と言っていた。今回 Pantel さんから「MicrosoftApple どっちがよかった?」と聞かれたりしたのだが、自分はシアトル生活でなにが悪かったかというと料理に尽きるので、ベイエリアはいろいろ食べるものあっていいなぁと思うのであった。(シカゴのあたりやオハイオに行った友人たちの話も、料理だけでは日本に帰りたい、という意見だが、全く同感) 

帰りは @uchumik さんと Pantel さんと @akf さんをお送りして、長かった2日間の任務終了。無事終わってよかった……。あとは博士論文のコメントを反映して2月4日に審査願いを出すのだが、こちらは大幅な書き直しが必要なコメントはなかったので、落ち着いて直せると思う。ねぎらってくださったみなさん、どうもありがとうございました!