技術から基本を学ぶコンセプト

午前中、娘と近くの公園で遊ぶ。先週と同様、3-4歳くらいの女の子を見つけると追いかけて真似っこをして喜んでいる。真似をするのが楽しいらしい。

自然言語処理の基本と技術」が、紆余曲折を経て出版される運びとなった。

自然言語処理の基本と技術 (仕組みが見えるゼロからわかる)

自然言語処理の基本と技術 (仕組みが見えるゼロからわかる)

もともと話は2011年くらいまで遡り、いろいろあったがこうやって日の目を見ることができてよかった。自分自身、最初は執筆者として参加予定だったが、大変申し訳ないことに執筆時間を確保することができず、最終的には監修として関わることになった。今年度、自分が執筆活動に使える時間はこれに最優先で投入したので、なんとかお役目を果たすことはできたかな、と思う(そのあおりで、時間を確保できていない別の本の原稿もあるのだが……)。実際の本が届いてみると、ページ数から想像していたより分厚く、感慨深い。

本書の特色は、割といま自然言語処理に触れる機会が多くなってきていると思うので、イメージしやすいアプリケーションから逆算してそれに必要な基礎知識を解説する、というスタンスで、目次は2012年くらいに話し合って作ったものだが、2016年の今も特に改訂の必要はなく、コンセプトはよかったかなと思う(内容は2015年当時の最新事情に更新されているが)。ちなみに、最初にこの話が来たときと比べると全員所属が変わっているのだが、動きが速いこの業界をよく体現している。

あと、この本は @mhagiwara さんと @neubig さんの貢献が大きい(本文的に全体の8割強)のだが、本に分担が書かれていない。文体が著者の3人ともけっこう違うので、読む人が読んだらどこを誰が書いたのかは想像できると思うけど……。あと、文体といえば、あとがきは小町が書いたのだが、やたら読点が多い文章となっている。これは、Mac のライブ変換を使って書いているからで、ライブ変換は変換に癖があり、読点をたくさん入れて曖昧性を減らさないと変な変換をされるので、思わず読点をたくさん入れてしまうのである。(Twitter やブログ文体なので読点が多いわけではない)

自然言語処理の入門書、2011年当時は(「自然言語処理の基礎」が入手可能性など考慮するとお勧めであったが)あまり適当なのがなかったように思うのだが、昨年放送大学から「自然言語処理」が出て、評判がよいのでこちらも読んでみた。

自然言語処理 (放送大学教材)

自然言語処理 (放送大学教材)

歴史はもとより伝統的な手法から新し目のアルゴリズム(たとえば情報抽出の Espresso や系列ラベリングの CRF、係り受けの MST を使うアルゴリズムなど)までまんべんなくカバーされていて、現在はどのタスクはどれくらいの精度、ということも紹介されていたりして、割とこれは決定版の教科書の一つであるように思うのだが、自然言語処理を研究テーマにしたい学生や、自然言語処理ツールを使うエンジニア向けかなという気がするので、結果的に割と相補的な位置付けであり、両方読んでもいいように思う。特に、理工系の人でないと、放送大学の本は少しハードルが高いように思うし……(逆に言うと、「自然言語処理の基本と技術」は、技術的な詳細を知りたい人や、すでにだいぶ学んだ人には物足りないだろう)。

自然言語処理の入門書が少なかった時代と比べると隔世の感があるが、可能な範囲で自然言語処理アウトリーチに少しでも貢献できればと思っている。
首都大のオープンユニバーシティおよび来年度の学部生・大学院生の授業でも、「自然言語処理の基本と技術」を教科書にする予定)