ランチはいつも通り (?) レストラン MOMO で。そういえば masayu-a さんからいただいたケーキ、おいしかった。妻に「masayu-a さんが『奥さんならきっと気に入ると思います』と言われた」と伝えたところ、「同じ女子だからきっと好みが分かるんだ」という謎のお言葉をいただく。ありがとうございました。
昼から DSIRNLP 勉強会。本当は来週の忘年会に出たかったのだが、いろいろな事情により来週東京に帰っている場合ではないので、代わりに勉強会に出る (兼発表する) ことに……。
会場はミクシィだったので、2回か3回行ったことあるし、余裕〜と思って北参道駅に来たのだが、どうも降りてから再度確認するとミクシィの場所は Google Maps で確認するとどう見ても渋谷にあるので、そういえばオフィスを移転したとか聞いたような……と思い出す。こんな落とし穴があったとは……。
結局30分ほど遅れて会場に到着。[twitter:@uchumik] さんのライトニングトークを聞けて満足。[twitter:@issay] さんの Mahout の話を聞いていて、そういえば Gentoo の開発に参加したときも、だいぶカオスだったなぁ、と思い出す。かっちりした開発体制が好きな人もいるのだろうが、自分はどちらかというと乱雑なほうが好きで、そういうところに入っていってがんがんコミットしたい性格なので、いま Mahout の開発に参加するのも楽しいのではないかな、と思った。
ただ、あとで [twitter:@sleepy_yoshi] さんとも話したが、Java で機械学習するなら Weka とか別のよいツールがあるし、大規模データで並列分散したいのはぶっちゃけ素性抽出のところで、学習自体はそんなに Hadoop 使ってまでやらなくてもよいのでは、と思うし、Hadoop はともかく Mahout で機械学習系のツールを充実させることにはそんなに意味はないのかもしれず。
ともあれ、やっている人がいないところはやりやすいので、いま学生で時間があったり、若手のエンジニアの人で活動の場所がほしい人は、こういうところから (車輪の再発明でもなんでもいいので) パッチを投げまくるところからスタートするとよいと思う。
自分のライトニングトークは来年の言語処理学会年次大会で開催する「文章の作成・校正支援」というテーマセッションの紹介。3分というのは、時間短いな〜。そういえば自分がプレゼンテーションデビューしたのは Internet Week 2003 という集まりの OS Update というセッションで、200人くらいを前にたしか5分間で Gentoo の魅力を伝えてほしい、というものだったのだが、用意していた ThinkPad がなぜかプロジェクターと相性が悪く、配布した資料のみで冷や汗をかきながら説明した、というのを覚えている。
合間合間に [twitter:@kimuras] さんと最近のウェブ業界について、そして自然言語処理の今後についてあれやこれやとお話する。今回いちばんの収穫は、@kimuras さんといろいろお話できたことかな〜。@kimuras さんもミクシィで R&D のリーダーをやってらっしゃるので、マネージメント的な悩みは大学の助教のポジションと似たようなところがあり、お互い話がよく分かる (笑)
帰りの新幹線の中で「Coders at Work」を読み終える。
Coders at Work プログラミングの技をめぐる探求
- 作者: Peter Seibel,青木靖
- 出版社/メーカー: オーム社
- 発売日: 2011/05/25
- メディア: 単行本(ソフトカバー)
- 購入: 11人 クリック: 360回
- この商品を含むブログ (36件) を見る
最初インタビュアーが誰か意識しないで、有名どころのインタビュイーのところからつまみ食いで読んでいたのだが、「あれ、こんな質問、相当コード書ける人でないとできないだろうし、なんでこの人はこんなにやたら詳しいんだ?!」と思って表紙を見て大いに納得……。これは久しぶりにいい本に出会うことができた。全ての情報系の人にお勧めする。
というのも、先日 [twitter:@y8o] 先生から「社会がどんな技術を身につけた人材を必要としているかと、大学研究室でどんな研究を行うのが社会から期待されているかはおそらく一致し」ないということをコメントいただいて、ああ、確かにその通りだなぁ、と思った。特に最近見かける情報系の学生は C++ をやりたがるのだが、Google とかなんだとか、有名どころの企業では確かに Java や C++ でコード (プログラム) が書ける人材がほしいのだろうし、学生もそれを先取りしてそういう言語で研究をしようと思うのだろうが、研究は研究であって研究の中に占めるコードを書く割合というのは必ずしも高くないので、コードを書くところに異様に時間がかかって (確かにプログラミングの能力はついたりして、本人の開発力は上がるのかもしれないが)、肝腎の研究がおろそかになっては、研究を重視する大学院としてはあまり歓迎すべき状態ではない。
もちろんプログラミングもできて、研究もできる、というのが理想で、要はバランスなのだが、どちらか選べ、と言われたら (その選択が非現実的な設定であるということはおいといて)、やっぱり研究大学としては研究なんじゃないかなぁ、と思うのである。