IBIS 2012 1日目: 企業とアカデミアのあいだ

今日から3日間、情報論的学習理論ワークショップ (IBIS 2012) に参加。今回は [twitter:@kashi_pong] さんにお誘いいただいて、少しお手伝いしているので、フル参加の予定である。既存の IBIS 系のガチ委員と、「今年の IBIS は怖くないよー」系のゆるふわ委員と声をかけたそうだが、もちろん自分はゆるふわ系である。

ちなみに、自分はなにか仕事を頼まれたら、1回目は基本的に引き受けることにしている。何が自分に向いているか分からないし、どういうのが好きかも食わず嫌いであることもあるので、やってみて判断する、というスタンスである。(だいたいは自分の見聞が広まって、しんどくてもやってよかった、と思うことが大半である。初めてだから、しんどくてもなんとかがんばるのかもしれないが……)

午前中は招待講演で、ガチ機械学習という趣。こういう話を聞くと、IBIS に来たなぁ、と思う。今回は事前登録の定員の300人を超える人数が登録し、1週間ほどで締め切ってしまったのだが、あとで参加者の顔ぶれを聞いてみると、6割が企業の人のようで、東京開催だったせいか、あるいは初日の招待講演が機械学習の基礎から応用、あとウェブやマーケティングにおける機械学習の活用というテーマだったので、情報収集に来られている人が多いのかな。どこでどのように開催するのかは目的次第だとは思うが、こういう回 (会) があってもいいかなと思ったりする。

個人的には招待講演されていた (福水さんを除く) お2人が自分と同世代で、こういう IBIS のような場所で招待講演を堂々とされているのが刺激になった。やはり、博士号を取得してすぐの研究者は、研究で尖っていたほうがいい。これくらい研究力をつけるには、どうしたらいいかなぁ。

昼は [twitter:@sla] さんや @kashi_pong さんとお弁当を食べたり。NLP 若手の会のような組織、イベントが機械学習の若手では存在しない (以前は T-PRIMAL が活発に活動していたそうだが……) という話で、確かにそんな気もするが、それはそれでいい傾向 (各自がそれぞれのタスクを持って複数のコミュニティで活動していて、若手でも直接シニアな人とガチで議論する) なのかなとも思う。

午後はビジネス寄りの招待講演で、マーケティングへの機械学習の応用とウェブ応用。階層ベイズが成功している人文・社会科学系の学問はいまのところマーケティングだけだ、という話。確かにうまく行くかどうかは設定次第でもあるし、使い所は大事なんだろう。

ウェブ応用は [twitter:@emasha] さんによる楽天における機械学習の取り組みと、[twitter:@hamadakoichi] さんによる DeNA におけるデータ分析について。個人的にはそんなに新しい情報はなかったが、IBISでこういう話があるのもいいんじゃないかなと思う。(言語処理学会年次大会や、NLP若手の会でも。) 楽天で作っている形態素解析器 raqumo (天叢雲剣から来ているらしい) は KyTea 同様点推定で、楽天のデータを使って self training しているとのこと。DeNADeNA Social Morphological Analyzer というのを作っているらしいのだが、名前が紹介されただけでなにをしているのかは分からず。

結局 @emasha さんも強調されていたが、機械学習的に高度なことが必ずしも必要なわけではなく、データを蓄積したり仕様やAPIを標準化・共通化したりするほうが大事で、現場にどういう問題があるか認識して、それをどのようにしたら解決することができるか、というアイデアのほうが重要だ、ということである (もちろん、最新の手法を使えば解決できることなら、最新の手法を使うことを妨げるものではないだろう)。

@hamadakoichi さんも、データ分析をする人だけでは仕事ができず、エンジニアや企画の人とチームを組んで、チーム全体で目標を共有し、一緒にコミットすることが大事だと繰り返されていたが、この部分がどれだけスムーズかによって、働きやすさ、満足度が全然違うんだろうなと思う。(うまく行っていない場合、エンジニア側はログを出しても自分にすぐメリットが見えないのでなかなかやってくれなかったり、逆に研究所も成果報告会的なイベントの前だけぶつぶつ言いながらデモを作ったりするような感じ?)

夕方はポスター。ものすごい熱気である……。IBIS はシニアな方々もガチでポスター発表したりしているところがすごい。NLP 若手の会もプログラム委員が率先してポスターをするくらいでないとな〜