年収1000億円もらえるならおれは研究者をやめるぞ!

広島の2日目は朝イチのセッションで座長を頼まれていたのでがんばって起きる。朝早起きして観光しようと思っていたのだが、起きたらそんな時間ないし……。仕方ないので歩いて広島バスセンターに行くまでに少し遠回りして原爆ドームだけ見てくる。

はだしのゲン」を小学生のときに幾度となく読んだのだが、この町はそういうそぶりを全く見せず、ただこの原爆ドームだけが象徴として残っている。記憶し続けることと同様に、忘れることも大事なのかもしれない。早朝の原爆ドームの近くにいた日本人は全員通勤途中のビジネスマンか OL で、観光客は団体の中国人だけだったのは印象的である。日本人はもう平和には興味がないのかなぁ。空気のように平和だからこそ意識しないのかもしれず、それが理想なのかもしれないが、なにやら世の中がきな臭いことに突入しつつあり、こういう意識でこれからの世の中乗り越えられるかどうか分からないのだけど。

座長はなんだか緊張して名乗り忘れたり (あとで名乗った)、言おうと思っていたことを言いそびれたりしてしまったが、無事終了。最初のセッションの話は日経平均株価の予測の話なのだが、最近立て続けに「ザ・クオンツ 世界経済を破壊した天才たち」

ザ・クオンツ  世界経済を破壊した天才たち

ザ・クオンツ 世界経済を破壊した天才たち

と「超ヤパい経済学」
超ヤバい経済学

超ヤバい経済学

を読んだので多少興味があった (ちなみに「超ヤバい経済学」は金融工学の話ではない。「ヤバい経済学」については感想を書いたことがあるが、基本的には同じ路線でトピックが増えただけなので、前作が楽しめた人は読んでみるといいと思うが、前作を読んでいない人は前作を読んだ方がいいかも)。

クオンツというのは計算機を使って株や先物取り引きなどの売買を行ない、多大な利益を上げる集団のことなのだが、いったいどういう人たちがそういうことをしているのだろうか? ということに興味があって読んでみた。基本的には上がるか下がるか、という2値分類であり、50%以上の確率で上がる、あるいは下がるということが分かれば儲けられる、という寸法である (実際は売買の手数料がかかるので、53%程度の予測率が必要なようだが)。

2値分類、と聞くと機械学習自然言語処理をやっている人なんかは「いろんな特徴量を使って機械学習すればいいんじゃないの」と思いつくだろうし、たぶんそうやっていろんな人が参入しているのだろう。そこまでは想像に難くないし、まぁ学部生や修士を出たような人たちを金融業界が釣りまくってやっているんだろうな、と思っていたのだが、世の中そんな甘くなかった。

 バウムのIDAでのおもな功績は、同僚の数学者ロイド・ウェルチとともに発表したバウム=ウェルチアルゴリズムだった。これは隠れマルコフモデルと呼ばれる未知の数学的現象にパターンを見出すためにつくられた。このアルゴリズムは暗号解析に抜群の効果をあらわすとともに、金融市場にも応用することができた。(p.158)

自然言語処理隠れマルコフモデルを使っている人なら Baum-Welch アルゴリズムの名前は聞いたことあるだろうが、このアルゴリズムを提案した人は結局クオンツになっていたのである! さらにびっくりすることは、次に書かれていた。

 一九九三年十一月、ルネッサンス(引用者注: 当時稼ぎまくっていたクオンツたちのベンチャー企業)はピーター・ブラウンとロバート・マーサーを採用した。彼らはニューヨーク州エストチェスター群ヨークタウン・ハイツの丘陵にある、IBMのトーマス・J・ワトソン研究所の音声認識研究グループの創設者だった。ブラウンはまもなく、ファンド内でも異常なほどのハードワーカーとして知られるようになった。[...]
 その後数年にわたって、ルネッサンスIBM音声認識研究グループから多数の研究者を雇った。そのなかには、ラリット・バールやヴィンセントとスティーヴンのデラ・ピエトラ兄弟もいた。彼らの名前をインターネット検索すれば、一九九〇年代半ばに数多くの論文を発表した研究者たちだということが分かる。そしてその後、採用活動はぴたりと止まった。(p.164)

この「ピーター・ブラウン」という名前は機械翻訳の研究をする人は絶対に覚えておかないといけない名前だが、統計的機械翻訳の記念碑的論文(最初に提案した論文)は

  • Peter F. Brown, Stephen A. Della Pietra, Vincent J. Della Pietra, and Robert L. Mercer. The Mathematics of Statistical Machine Translation: Parameter Estimation. Computational Linguistics. pp.263-311. 1993.

なのだが、ここに登場する全員が(当時は IBM の基礎研究所で音声認識自然言語処理の研究をしていたのに)その後クオンツとなり、研究から足を洗って金融工学にどっぷり浸かっている、というわけである。

確かに自然言語処理や研究は金になるものではないが、ここまで華々しい研究をしていて、論文もバリバリ書いていた人がその後研究をぷっつり止め、金融工学に転身するというのは衝撃的だった。確かに儲かる金は天文学的数字(年収10億ドルと後ろのほうに書いてあった)だが、それくらい金が入ってくるなら研究はできなくてもかまわないということか。いや、確かに年10億ドル入ってくるなら自然言語処理の研究なんてしている場合ではないのかもしれないが、年10億ドル儲けられる人は、研究の分野でも超トップレベルの人たちだったわけで、やはりほとんどの人は参入しないほうがいいのかもしれないが。

この本、文章自体は読み難いと思うが、研究と金儲けとの関係について考えるにはいい題材だと思うので、興味ある人は通読してみるとよいだろう。

ちなみにタイトルはジョジョネタなので、元ネタを知りたい人は「ジョジョの奇妙な冒険」の第1部を読んでいただけると……

午後はもう一つの共著の話、@smly くんの

  • 小嵜耕平,新保仁,小町守,松本裕治(奈良先端大)「ハブを作らないグラフ構築法を用いた半教師あり語義曖昧性解消」

の発表もつつがなく終了。自分は原稿のチェックをしているくらいなのだが、割とこの手法はいいんじゃないかと思う。実際のハブとなる事例がどういう性質を持っているのかは別に検討しないといけないだろうが、計算量は大規模データにもスケールするくらいに落とすことができ、性能も既存手法と同等か上回っているので、使い勝手はよいと思うのだけど……

(2012-02-26 追記) 上記の研究が 2011年度情報処理学会山下記念研究賞 を受賞している。また、まだ論文誌には投稿していないが、国際会議版が CoNLL で発表されている。

帰りは松本先生たちと途中までバス。松本先生も今回の研究会では発表したのだが、実はこの研究会で話すのは10年ぶりらしい、と聞いてびっくり。やはり自分が学生であったころの記憶を呼び戻すと(というほど時間は経っていないはずだが……)、スタッフが発表するのを見ると刺激になるので、第一著者で話すチャンスがあればどんどん話したいなぁ。

夜、@Wildkatze くんから「masayu-a さんが駅弁のあなごめしを買うように言っていました」との情報を得たので、@smdaskさんと2人であなごめしを買ってみる。自分は予約した指定席があったので喫茶店で時間を潰したが、自由席が空いているだろうと思って突撃した @smdask さんは新幹線立ち席だったらしい……。夫婦あなごめし、これはおいしい! 大きなあなごが2匹入っていて、それだけなのだが、ものすごく身が柔らかく、こんなあなご食べたことない。確かに薦めたくなる気持ち分かるわぁ〜。ごちそうさまでした〜