最近コタツの中で寝てしまうことがよくあり、気がついたら朝の6時だったりして、非常によろしくない。(寝直すけど) コタツで寝ると眠気は取れるが疲れは取れないので、コタツの中で寝たくないのだが……。父がよくコタツで寝ているのを子どものころはうざったく思っていたが、気持ちが分かる年頃になってきてしまったということだろうか。
昼前、一番下の弟に年賀状を書かなかったので、電話でもしてやるか、と思って電話したところ、夫婦で実家に挨拶に来ていたところだそうで、ついでに両親にも挨拶しておく (両親には年賀状を送ったのだけど)。我々夫婦はほとんど両親に会っていない気がするのだが、そもそも単身赴任だと一緒に行動しにくいし、たまに会える時間があったらわざわざ他の人を交えて会いたいとも思わないので、一緒に暮らすことのできる来年度以降かな……。
午後、ブルーバックスで出ていた「物理数学の直観的方法」を読む。
物理数学の直観的方法―理工系で学ぶ数学「難所突破」の特効薬〈普及版〉 (ブルーバックス)
- 作者: 長沼伸一郎
- 出版社/メーカー: 講談社
- 発売日: 2011/09/21
- メディア: 新書
- 購入: 7人 クリック: 46回
- この商品を含むブログ (34件) を見る
自然言語処理だと最近は「入門 自然言語処理」や「入門 ソーシャルデータ」のように、サンプルコードつきで自然言語処理について解説してくれる本が登場してきていて、たぶん「入門書」としては理論やイントロを書いてある本、「専門書」としては論文があるのだろうが、自然言語処理でもちょうどその2つの間をつなぐような本がなかなか登場しなかったが、一昨年から去年にかけてはこの点、かなり改善されたと思う。ちなみに、今年2月に出版予定の id:tkng さんが書いた「日本語入力を支える技術」もこのあたりの入門から実装というちょうど「中間」をピンポイントに突く本で、広く初心者から脱皮したいみなさまにお楽しみいただけるのではないかと思う。
あと、オライリーから出ている「ビューティフルデータ」
ビューティフルデータ (THEORY/IN/PRACTICE)
- 作者: Toby Segaran,Jeff Hammerbacher,堀内孝彦,真鍋加奈子,苅谷潤,小俣仁美,篠崎誠
- 出版社/メーカー: オライリージャパン
- 発売日: 2011/02/28
- メディア: 大型本
- 購入: 24人 クリック: 493回
- この商品を含むブログ (15件) を見る
- 単語分割
- 暗号解読
- スペル訂正
について、英語でもウェブテキストだと問題になる単語分割をしたり、実際に戦時中に使われた暗号を解読したり、Google N-gram の中に見られるスペル誤りを訂正したり、というタスクについて、それぞれ Python でコードを示しながら解説していて、「現実のデータを見て手法を考える。コードを書いて適用してみて、エラー分析してコードを改良する。解ける問題と解けない問題はなにか、考える」という、研究や開発で必要とされるスキルを余すところなく解説していて、とてもよい入門になっていると思う。(他の章もおもしろいのだが、それぞれ別の人が書いているので、けっこう当たり外れがある)
ちなみに、Peter Norvig のスペル修正プログラムはどう書くかをご存知の方も多いだろうが、この本の中に書いてあるバージョンはリンク先とけっこう違う (笑) 両方読んで違いを見てみる、というのもおもしろいと思う。
あと、暗号解読については、新潮文庫から出ているサイモン・シンの「暗号解読」
- 作者: サイモンシン,Simon Singh,青木薫
- 出版社/メーカー: 新潮社
- 発売日: 2007/06/28
- メディア: 文庫
- 購入: 30人 クリック: 216回
- この商品を含むブログ (234件) を見る
いま3月7-9日開催のスプリングセミナー (NAIST の受験生を対象にした、1泊2日・2泊3日の実習体験) の準備をしているのだが、今回は英作文の前置詞の誤り検出 (訂正) タスクをやっていただこうと考えている。プログラミング言語の指定をするか、「どのプログラミング言語でもよい」と書くか、ちょっと悩ましいのだが、今回は Python 限定でもいいかなぁ (NLTK も使いたいし)。いつもは言語の指定はしないのだが、まだ悩み中。
ともあれ、実際にコードを書いて現実に問題になっているタスクに取り組んでもらう (今年の国際会議のワークショップでも、全く同じタスクが設定され、世界中の大学・研究所・企業の人たちが参加する予定である。つまり、最先端)、という体験をしてもらいたいなと考えている。
参考