Google の PageRank に関する参考書

今日は理論的な話をするのではなく、単なる参考書についてのポインタ。今週時間取って

Google's Pagerank and Beyond: The Science of Search Engine Rankings

Google's Pagerank and Beyond: The Science of Search Engine Rankings

をちゃんと読んでいるのだが、なかなかこの本はよい。そんなに分厚くないのだが、理論的な話と実装の話がバランス取れていて、ときどき入っている小話(中国の検索がどうだとか、Google が株式公開したときの Dutch Auction はどうだとか)もおもしろい。Google's PageRank と書いてはいるが、Kleinberg の HITS についても書いてあったり、SALSA の話とか Personalized PageRank の話もあったり、高いだけのことはある。(ちなみに日本語で PageRank の基本的な話を知りたい人は馬場さんの解説shimbo さんのリンク解析についての解説スライド、あと Introduction to Information Retrieval のリンク解析の章をまず読むべきである。)

個人的には最近大規模データでこういうリンク解析をする話を調べていて、論文を見ても色んなところに散らばっていて探すのが面倒くさかったのだが、これ(買ったのに1年以上見ていなかったが)開いてみたら PageRank の大規模化の話や高速化の話がそれぞれ1章割いてかかれていたり(行列をひたすらかけていくことで主固有ベクトルを求める power method は遅いことが知られているのだが、いかにその遅い power method を高速化するか、とか)、最初からこれ読めばよかった……。

というわけで、PageRank について知りたい人、リンク解析・グラフ理論の現実への応用について興味がある人には超お勧めである。これで Google の中の人じゃない、というのだからすごいなぁ。

あとあまり関係ないが Google つながりで

グーグル・ジャパンで働く11人の英語勉強法

グーグル・ジャパンで働く11人の英語勉強法

も紹介しておくと、これは Google 日本法人で働いている人が英語学習についていろいろ語った本で、エンジニアの人の比率が低いのでエンジニアの人はあまり参考にならないかもしれないが、それを差し引いてもかるーく読める。どちらかというと Web に載っている無料コラム系の内容で、お金を出して買うほどかというと微妙だが……。結局「ちゃんと受験英語はやりましょう」「仕事で必要なので英語がんばりました」というような内容で、それはそれで当然の話な気がする。この本を読んで新しい情報が得られたかというとあまりそんなことはないが、娯楽的には楽しめたので、Google の中について(企画とエンジニアの関係とか)知りたい人は時間があったら読んでみるといいかも。