詳しい人が読んでも楽しめる入門書は良書

先々週から妻が毎日お弁当を作ってくれるようになり、健康的な生活を送っている。食材や日用品は生協で注文している(iPadiPhone で頼めるようだ)ので出歩かなくてよいのだが、頼むタイミングの問題でちょっと足りないものがあると、家の近くのスーパーまで買い物に行く。ときどきは歩いた方がいいので、ちょうどよいかもしれない。

そういえば、年末に出た「Python によるデータ分析入門」を読了。

Pythonによるデータ分析入門 ―NumPy、pandasを使ったデータ処理

Pythonによるデータ分析入門 ―NumPy、pandasを使ったデータ処理

データサイエンスのプログラミング言語はRからPythonに置き換わるという記事もあり、どんどんPythonの利用範囲が広まっているようで、2009年に自然言語処理はPythonがいちばんという記事を書いた身としては、そうなるだろうなと思っていたりする。

さて、上記の本は Python の便利な使い方(IPython を使ったデバッグのコツとか、けっこう有益)や NumPy/SciPy の使い方(いろいろある行列演算パッケージの違いや落とし穴、効率的な書き方など、こちらも有益)、matplotlib による可視化や pandas によるデータ処理など盛りだくさん。自然言語処理の研究や開発で活用するいろんな処理が詳しく痒いところに手が届くような感じで書かれているし、翻訳も信頼できる感じ。

初心者にはとても分かりやすく全部の操作の意味や(普通は教えてくれないような)はまりやすいポイントを開設してくれていて配慮が行き届いているし、すでに上記のパッケージを使っている人でも「へえ、そうなんだ」と思うような tips を見つけることができるだろうし、極めて良書である。データサイエンティストを自称する方々はぜひお買い求めいただければと思う。(最後のは冗談だが、研究や開発でPythonを使う人は一度ざっとでも目を通しておくと役に立つだろう)

あと、それに関連しているわけではないが、一部で話題になった『図解・ベイズ統計「超」入門』(サイエンス・アイ新書)も購入してパラパラめくってみた。

なんちゃってイラストでとっつきやすさを演出しているようなのではなく、実際噛み砕いて図解で説明していて、非常によい感じ。

自分も入門書を書くとき、入門じゃない人でも楽しめるような作りにしたいなと思ったのであった。プログラミング言語が関係する場合、息の長い本を書くのは難しいとも思うが、意外と Python は長く使われるんじゃないかな?と予想している(ただし息が長いのは Python 3 ではなく 2 系列だろう)。最近日本語版が無料公開された計算機プログラムの構造と解釈(いわゆるSICP)は Scheme を使っていたが、Python で書き直したバージョンもあるらしいし、もう一度読んでもいいかなと思ったり。