自然言語処理の中級者向けのテキストはどのようなものになるだろうか

東京では楽天テクノロジーカンファレンス2010があったらしい。Twitter で様子がちょくちょく分かるが、楽しそうである。行けなくて残念。こういうとき、東京に住んでいると気軽に行けるのになぁ、と思ってしまう。(勉強会に行き過ぎて自分自身で独自のものを考えたり作ったりする時間がなくなる「勉強会貧乏」になる危険性はあるが)

同様に、YAPC::Asia Tokyo 2010も開催されていたようだ。研究用のコードを見直していて気がついたが、自分が Perl から Python にスイッチしたのは3年前で、それまではほとんど全てのスクリプトシェルスクリプト(+make)か Perl で書いていた。その後、ほとんど全てのスクリプトPython で書くようになってしまったので、感慨深い転換点であったように思う。(いまでも Perl で書くものはある。リストのシャッフルみたいな簡単な操作で、Perl だったらモジュールの名前を知っているが、Python だとどうやればいいのかすぐ出て来ないようなものとか。)

@overlast さんが YAPC::Asia で使った資料をYACP::Asia Tokyo 2010 2日目で発表してきましたで公開している。先日の「情報科学若手の会」の飛び込みセッションと内容は同じだとおっしゃっていたが、かなり変わっていてびっくり(!)。自然言語処理・情報検索の教科書が冒頭にまとまっていて、この分野に興味があるけどどこから手を付けていいか分からない人の参考になるのではないかと思う(たしか「どんな教科書がありますか」というのは若手の会での質疑応答で出てきた話だった)。この「生駒日記」も「副作用として海外インターンに行きたくなる」と紹介してくださっている(笑)が、もっとこの分野に参入してくれる若い人が増えるといいなと思っている。(いや、若くなくてもいいですけどね!)

いまさらながら「エキスパート Python プログラミング」

エキスパートPythonプログラミング

エキスパートPythonプログラミング

を読んでいるが、割とよい本だと思う。@tettsyun くんからも「小町さんの書く Python スクリプトって Perl っぽいところがありますよね」と言われたりしたのだが、確かにこの本の第2-3章の「構文ベストプラクティス」なんかを読むと過去の自分に読ませたい……。Amazon のリビューにも書いてあるが、「Python 以外の言語を使った経験があり、標準のチュートリアルやライブラリのリファレンスを読んで入門書の必要性を感じなかった」ような人が、「Python 流に書くためにはどうしたらいいか」というのが分かるという本、かな。

どの言語の本でもそうなのだが、中級者向けの本というのは読者層が狭いのでなかなか書けないものだろうが、そういうところを攻めていて非常によい。自然言語処理でもこういうふうに中級者向けの本があればよいのだが、そもそも中級者以降はタスクを固定しないとなかなか突っ込んだところまで書けないのが痛いところかな。そして各タスクに共通の部分というのが(機械学習を除いて)あまりない、というのも……。情報検索はいろいろ書けかつ自然言語処理における成功した分野の一つではあるのだが、情報検索における自然言語処理の役割はそんなに大きくないので、情報検索に固定するとあまり自然言語処理について書けないのが問題。統計的機械翻訳スペシャリストが構文解析からなにから全部まとめて書く、という筋が最近は出てきたかなと思っているのだが、どちらも一筋縄ではいかないタスクなので、書ける人は本当に限られるように思う。