思考ステップを分かりやすく説明した文書は貴重

9月まで妻に12時ごろミルクをあげてもらっていたのだが、12時まで起きていると夜寝られないという問題が発生し、最近は9-10時にミルクをあげたら残りは自分の担当にしているのだが、そうすると日によっては午前3時くらいにミルクで一度娘が起きることがあり、今日がその日であった。まあ、3時に起きるとそれはそれで静かな中普段できない作業ができたりするので、悪くはないのだが(原稿2本の添削をした)。

午前中はひたすらメール処理。今期は月火にそれぞれ授業があるので(火曜日は南大沢に行く日でもあり、研究室のイベントを入れていないし)、水曜日が研究室の始まりのような感覚である。とはいえ、12月から水曜日の2限にも授業が入ると、忙しくて死にそうになりそう……(そのころには、少し勉強会が終わっていることを期待するのだが)。

昼は SLP (自然言語処理の教科書)の輪読。スペリング誤り訂正の話があったりする。誤り訂正の中でもスペリング誤り訂正は編集距離のような基礎的なアルゴリズムが登場するので、割と勉強になってよいと思う。スペル修正プログラムはどう書くかというのは、簡単なところから問題を定式化してアルゴリズムを実装し、少しずつ改善していくというサイクルで書かれた見事な文章で、こういうふうな解説記事を自分も書いてみたいものである。

そういえばオライリーから出ている「入門自然言語処理」の12章、Python による日本語処理に関する文章が無料で公開されていたのだが、最近アクセスできなくなっているようだ(「認証が必要です」と表示される)。夏休み前までは(勉強会で使っていたので)確実にアクセスできたのだが、あれだけ簡潔にまとまっていて分かりやすい(しかも無料かつオンラインで読める)日本語処理の文章は他になかったので貴重だったのだが、もし技術的な問題だけだったら、なんとかクリアして再度公開してほしいものである。

先日東北大学の乾研究室が引っ越しのため1週間ほどサーバが止まっており、言語処理100本ノックの内容が参照できず困ったのであるが、必要なものは(オンラインでいつでもアクセスできると安心せず)ちゃんと全部手許にコピーして置いておかないといけないと思った次第である。

午後は研究会(進捗報告)である。M1の人は(来年の3月に言語処理学会で発表するのでなければ)そんなに焦る必要はないのだが、M2/B4 の人はそろそろ手を動かした方がいいと思う。11月末段階で卒論・修論の目次発表を予定しているので、その段階ではもうタスクも決まりサーベイも一通り終わっている前提で逆算すると、何をやるかは10月末の段階で決まっていないと、研究テーマを絞ったサーベイすらできないので……。

あと、「サーベイ中です」という人には、月30本くらい読んで紹介してもらったほうがいいのだろうか? 月30本でも1日1本なので、本当はもっと読んだほうがいいのだろうが、アブストラクトや図表、手法の流し読みだとすぐ眺められても、他人に内容を紹介できるくらい読もうと思うと、1日1本くらいかなと……。(なんだか、想定する論文の読む量が、2桁とは言わないが1桁は少ないように感じている)

夕方は研究室のアルバイトの書類を回収したりする。首都大に来てアルバイトを発注する側になったのだが、事務処理がちょっと煩雑。勉強会が多くてなかなかアルバイトもできないと思うので、少しでも還元できたらな、と……(しかし継続的に研究費を取らないとなかなか定常的にアルバイトにしてあげられないので、ちゃんと研究費を獲得しないとな、という気になる)。