自然言語処理の独習に向かない教科書

午前中は共同研究のSkypeミーティング、なのだがこちらの音声が送れないという謎の不具合で20分ほどロス。前回までとお互いハードウェアもソフトウェアも変えていないはずなのだが……。こちらを再起動してSkypeを最新版に更新したらつなげるようになった。謎。

昼過ぎに会計処理。使い切らないといけない予算は全部消化したのだが、新年度の学生数が確定したら必要な機材を揃えておかないと。

夕方は研究室で機械翻訳の話をしたり。先日届いた「機械翻訳」を渡したりする。出版直後は品薄だったようだが、今は普通に買える。

機械翻訳 (自然言語処理シリーズ)

機械翻訳 (自然言語処理シリーズ)

まだ詳しく読んでいないが、チラ見した範囲では相当よく書けているので(著者人を見ると当然ではあるが)、このレベルの書籍が日本語で読めるというのは日本人はとても恵まれていると思う。これから読むのを楽しみにしている(特に渡辺さんが書いたところ)。

来年度はこのほんをつかって機械翻訳の勉強会もしようと思うのだが、誰か一人でも機械翻訳を研究テーマにしてくれる人がいるといいなぁ。

ちなみに先日自然言語処理を学ぶ推薦書籍という記事を書いた。何を入れたかは読んでもらえればいいので繰り返さないが、何を入れなかったかはそれぞれ理由があるので書いておく。

まず岩波の「自然言語処理」。

岩波講座 ソフトウェア科学〈〔知識〕15〉自然言語処理

岩波講座 ソフトウェア科学〈〔知識〕15〉自然言語処理

聖書と同じくらいの分厚さで、詳しく書いてあるのだが、機械学習登場以前の自然言語処理の内容であり、かつ入手困難で、最初に手に取るべき本ではない。

次は「確率的言語モデル」。

言語と計算 (4) 確率的言語モデル

言語と計算 (4) 確率的言語モデル

統計的言語処理をするなら必読で、薄いながらかなり詳しく分かりやすく書かれているので間違いなく良書なのだが、言語モデル自体をそこまで詳しく知る必要があるか?と言われると、必ずしも言語モデルを研究・開発で使うわけではないので、万人が読むべき本ではない。(どういうタスクに言語モデルを使うかは、だいぶ言語処理に詳しくならないと分からないし、分かるようになった人はおそらく入門書を必要としていない)

あと、英語の本はないのかというコメントもあったが、英語の本となるといわゆる FSNLP か SLP になるのだが、どちらも何百ページもある(SLPに至っては1000ページを超える!)ので、初学者が最初に購入すべき本ではない。FSNLPKindle版が出たので、まだましだが……。

Foundations of Statistical Natural Language Processing (The MIT Press) (English Edition)

Foundations of Statistical Natural Language Processing (The MIT Press) (English Edition)

SLPこと Speech and Language Processing は2008年に改訂版が出た。
Speech and Language Processing: International Edition

Speech and Language Processing: International Edition

NAIST松本研や東北大乾研ではこれが新入生の基礎勉強会で読む教科書になっているそう(2008年まではFSNLPだった)で、現在自然言語処理の研究室では SLP がデファクトの教科書になりつつあるが、上述したようにこの本は(音声処理も含まれるせいであるが)1,024ページ(現在のところ1万円以上する)あり、研究室で輪読するならともかく、独習する人がこれをスタートに読むと挫折する可能性が高い。

いずれにせよ、来年度うちの研究室では本の輪読会を今年度比5倍にする予定なので、どれが勉強会に向いているかははっきりするかと思う。