初心者向けではない入門書にも需要がある

最近コタツの中で寝てしまうことがよくあり、気がついたら朝の6時だったりして、非常によろしくない。(寝直すけど) コタツで寝ると眠気は取れるが疲れは取れないので、コタツの中で寝たくないのだが……。父がよくコタツで寝ているのを子どものころはうざったく思っていたが、気持ちが分かる年頃になってきてしまったということだろうか。

昼前、一番下の弟に年賀状を書かなかったので、電話でもしてやるか、と思って電話したところ、夫婦で実家に挨拶に来ていたところだそうで、ついでに両親にも挨拶しておく (両親には年賀状を送ったのだけど)。我々夫婦はほとんど両親に会っていない気がするのだが、そもそも単身赴任だと一緒に行動しにくいし、たまに会える時間があったらわざわざ他の人を交えて会いたいとも思わないので、一緒に暮らすことのできる来年度以降かな……。

午後、ブルーバックスで出ていた「物理数学の直観的方法」を読む。

もともとは知る人ぞ知る古典的著作だったのだが、最近ブルーバックスに入っていたとは。単行本のほうは松本研図書室にもあるし、パラパラと目次を読んだことはあったが、通読したことがなかった。読んでみたら、なるほどおもしろい。直観的にテイラー展開だとか固有値だとかそういうのを求めるイメージを説明してくれていて、語り口調が独特なのがよい。もともと、初心者向けの本でもなく、かといって専門家向けの本でもない、ちょうど中間あたりをターゲットにした本がないので、そこを狙って書いた、と前書きにあるが、確かにそういう層を狙うのは重要かもしれない。

自然言語処理だと最近は「入門 自然言語処理」や「入門 ソーシャルデータ」のように、サンプルコードつきで自然言語処理について解説してくれる本が登場してきていて、たぶん「入門書」としては理論やイントロを書いてある本、「専門書」としては論文があるのだろうが、自然言語処理でもちょうどその2つの間をつなぐような本がなかなか登場しなかったが、一昨年から去年にかけてはこの点、かなり改善されたと思う。ちなみに、今年2月に出版予定の id:tkng さんが書いた「日本語入力を支える技術」もこのあたりの入門から実装というちょうど「中間」をピンポイントに突く本で、広く初心者から脱皮したいみなさまにお楽しみいただけるのではないかと思う。

あと、オライリーから出ている「ビューティフルデータ」

ビューティフルデータ (THEORY/IN/PRACTICE)

ビューティフルデータ (THEORY/IN/PRACTICE)

の第14章も、あの Peter Norvig が

  • 単語分割
  • 暗号解読
  • スペル訂正

について、英語でもウェブテキストだと問題になる単語分割をしたり、実際に戦時中に使われた暗号を解読したり、Google N-gram の中に見られるスペル誤りを訂正したり、というタスクについて、それぞれ Python でコードを示しながら解説していて、「現実のデータを見て手法を考える。コードを書いて適用してみて、エラー分析してコードを改良する。解ける問題と解けない問題はなにか、考える」という、研究や開発で必要とされるスキルを余すところなく解説していて、とてもよい入門になっていると思う。(他の章もおもしろいのだが、それぞれ別の人が書いているので、けっこう当たり外れがある)

ちなみに、Peter Norvig のスペル修正プログラムはどう書くかをご存知の方も多いだろうが、この本の中に書いてあるバージョンはリンク先とけっこう違う (笑) 両方読んで違いを見てみる、というのもおもしろいと思う。

あと、暗号解読については、新潮文庫から出ているサイモン・シンの「暗号解読」

暗号解読(上) (新潮文庫)

暗号解読(上) (新潮文庫)

が驚異的におもしろいので、未読の人はぜひ。自然言語に興味がある人も、人工言語に興味がある人も、文字や単語の頻度分析からここまで暗号が解読できるのか!とびっくりすること請け合いである。上下巻なのだが、確か旅行先で上巻だけ買って読み始めたら止まらず、帰りの電車の中でずっと読んで、高の原で下巻を買ってさらに帰って読んだ記憶がある (笑)

いま3月7-9日開催のスプリングセミナー (NAIST の受験生を対象にした、1泊2日・2泊3日の実習体験) の準備をしているのだが、今回は英作文の前置詞の誤り検出 (訂正) タスクをやっていただこうと考えている。プログラミング言語の指定をするか、「どのプログラミング言語でもよい」と書くか、ちょっと悩ましいのだが、今回は Python 限定でもいいかなぁ (NLTK も使いたいし)。いつもは言語の指定はしないのだが、まだ悩み中。

ともあれ、実際にコードを書いて現実に問題になっているタスクに取り組んでもらう (今年の国際会議のワークショップでも、全く同じタスクが設定され、世界中の大学・研究所・企業の人たちが参加する予定である。つまり、最先端)、という体験をしてもらいたいなと考えている。

参考