自然言語処理を一般向けにおもしろく書くのは難易度が高い

朝から曇天。でも気温が上がらないのでそこそこ過ごしやすい。

昼から研究室。9月のNL研の原稿締切が迫っているのであった。大丈夫かと思ったが、なんとか間に合いそうな感じ。Dropboxで原稿を共有するのはお手軽でよいのだが (更新があったらすぐ分かるし)、複数人で作業するときファイルをロックすることができないので、結局簡便な共有方法ってことかなぁ。バージョン管理システムの使い方を覚えなくても共有できるのはとてもよいのだけど。(勝手にバージョン管理とバックアップしてくれるし)

電車の中で「その数学が戦略を決める」を読み終わる。id:keiskS くんの日記で見かけて積ん読されていたのだが、裁断して iPad に入れたらだいぶ読みやすくなったのであった。

その数学が戦略を決める (文春文庫)

その数学が戦略を決める (文春文庫)

前のほうでワシントン大学Oren Etzioni さん が出てきてびっくりした (p.69 以降)。この人は自然言語処理でも特に情報抽出 (テキストマイニング) で非常に有名な人で、TextRunner というシステムを作ったことで知られている。最近は ReVerb のほうが有名かもしれない (GitHubソースコードも入手可能)。

この本自体は一般向けにデータマイニング機械学習がどのように活用されているか、という話 (読み物) で、それなりにおもしろい。情報系の人はあまり楽しめないかもしれないが、数式がひとつも登場しなくてもデータマイニングについてここまで書けるというのはすごいことである。ワインの品質を求める回帰式とか (笑)

あまりがんばってオリンピックを見るような感じではないのだが、朝出勤前にニュースで見たりしていると気になって夜も見てしまうな〜。実家にいたときは弟がスポーツ好きだったのでよく見ていたが、あれからもう12年も経つのかぁ。