Introduction to Information Retieval

今週から情報検索の勉強会を始めた。テキストはIntroduction to Information Retrieval。出版は来年だそうだが、フルテキストとスライドが公開されているので、自由に参照できるのが利点。Modern Information Retrieval という検索分野では有名な本があって、自分も買ってはみたのだが、なんか開く気にならないで積ん読のままになっている。気がついたら読まないうちに第2版が出る(来年5月)らしく、古いの読むのもなんかしゃくだなと思ってこちらを読むことにした。スライドも公開されているのでみんなは事前に読んでこなくてよくて、発表する人(=自分)が本文を読んでスライド使って話す、という感じ。一人で読むのは寂しいのでみんなにつき合ってもらうわけである。

と思ったら来年から某検索エンジン会社に就職する shimpei-m くんがインデックス周りの章を担当してくれるらしい。ありがたい。(自分も読むと思うけど)

昔はディスクが速くて CPU が遅かったからこの手法が使われていたけど、最近は CPU よりディスクがボトルネックになるのでこの手法が主流、などなどどの手法がよく使われていてそれはどうしてか書いてあるのでおもしろい。まあ、「情報検索入門」なので難しい話が書いてあるわけではないし、学部生向けのテキストとしてはよく書けているんじゃないかと思った。