自然言語処理や機械学習でいくつか新しい教科書的なものが登場してきたので、まとめてみようと思う。
教科書について。Introduction to Information Retrieval
Introduction to Information Retrieval
- 作者: Christopher D. Manning,Prabhakar Raghavan,Hinrich Schuetze
- 出版社/メーカー: Cambridge University Press
- 発売日: 2008/07/07
- メディア: ハードカバー
- 購入: 7人 クリック: 115回
- この商品を含むブログ (37件) を見る
Foundations of Statistical Natural Language Processing (The MIT Press)
- 作者: Christopher Manning,Hinrich Schuetze
- 出版社/メーカー: The MIT Press
- 発売日: 1999/05/28
- メディア: ハードカバー
- 購入: 3人 クリック: 169回
- この商品を含むブログ (18件) を見る
統計的機械翻訳では先日も紹介した
Statistical Machine Translation
- 作者: Philipp Koehn
- 出版社/メーカー: Cambridge University Press
- 発売日: 2009/12/17
- メディア: ハードカバー
- 購入: 1人 クリック: 12回
- この商品を含むブログ (16件) を見る
むしろ自分が気になるのは hideto-k さん(ご存じない方もいらっしゃるかもしれないが、奈良先端大の松本研の OB で、現在は Google で機械翻訳の研究をされている)が Amazon に書評を書いていて、「機械翻訳だけでなく統計的自然言語処理の入門書としても良い」というタイトルで
現在の機械(自動)翻訳研究において主流になっている統計的機械翻訳の著名研究者による入門書。分かりやすい例を用いながら基本的な事項から説明しているため、機械翻訳に限らず自然言語処理全般に興味がある方にお薦めできる。(ただし言語と計算 (4) 確率的言語モデルやFoundations of Statistical Natural Language Processingなどで統計的自然言語処理について基本的な知識を身につけておいたほうが良いだろう。)
ただし、本書はあくまで入門書である。実際には重要だけれども、最初に概念を理解する上ではかえって混乱を招くような事項については、ごくあっさりと触れられているのみである。もし本書を読んで機械翻訳に興味を持ったら、是非本書に書かれたアルゴリズムの実装に挑戦してもらいたい。きっと次から次へと疑問が生じてくるはずだ。そうしたら各章末に挙げられた参考文献に当たって疑問を解決してもらいたい。それを繰り返しているうちに、きっとあなたも知らず知らずに機械翻訳の研究者になっているはずだ。
というわけで、これを機に統計的自然言語処理がもう一度盛んになってくれるといいなぁ、と思うのである。日本語では hideto-k さんも書かれているように 「確率的言語モデル」
- 作者: 北研二,辻井潤一
- 出版社/メーカー: 東京大学出版会
- 発売日: 1999/11
- メディア: 単行本
- 購入: 10人 クリック: 91回
- この商品を含むブログ (44件) を見る
一応宣伝(?)のためにもう一度書いておくと、「言語処理のための機械学習」
- 作者: 高村大也,奥村学
- 出版社/メーカー: コロナ社
- 発売日: 2010/07/01
- メディア: 単行本
- 購入: 13人 クリック: 235回
- この商品を含むブログ (42件) を見る
ただやはり研究と勉強の溝は深く、勉強が好きな人が必ずしも産みの苦しみを伴う研究をやりたいわけではなかったりするので、あくまでもここはスタート地点なだけであって、やっぱり研究に取り組んで七転八倒して、苦しくても世界でまだ誰も発見していないような知見を得るという体験をしてもらいたいなと思うのである。人生すいすいと進むのが当たり前だと思っている人にはつらいかもしれないが、せっかく学生でいるのだから、困難な道を進むと力がついていいと思う(学生のうちなら、スタッフや仲間がいて手助けしてくれるわけだし、手助けするためにスタッフがいるわけでね)。