10年前に書いたプログラムだと言語からして違う

今日は学生たちがインターンシップに行くということで、ほとんど研究室に人がいない日。2人だけ来ていたので、雑談も含めていろいろ話したり。まあ、みんな違うことをする方が研究的にはいいと思うので(手法は同じで違うタスクとかいうのは、知見が共有できていいけど、同一あるいは類似タスクを複数人でやるのは、分担や責任がはっきりしなくなるのでよくないと思うのだ)、いいんじゃないかな〜。

いろいろあって溜まっていた学会関係のお仕事、そしてコース内のお仕事をひたすら片付ける。本来お盆に入る前にやってかないといけなかったことが、ずるずると延びていて、ご迷惑をおかけしていて申し訳ない。すぐやらないと、思い出すオーバーヘッドが馬鹿にならないので、すぐ片付けられるといいんだけどなぁ。あと、なぜか最近身の回りの時間の進み具合が極端に遅くなった気がするのだが、なんでだろうか?(娘の成長が早すぎるせい?)

SVM の使い方を教えてほしい、とのことで、自然言語処理で使われている実例を見せた方がいいかと思い、自分が修士のときに実験していたコードをいろいろ探してみたのだが、コードはあっても実行可能な実験の生データは NAIST にあるので、すぐには見せられず。これが時間というものか。

世の中に出回っているサンプルは、すでに素性IDの形に変換されていたり、あるいは入力から素性に変換する部分があっても bag-of-words の素性くらいしかなかったりして、自然言語処理の実タスクを考えると、あまり実用的ではない。日本語処理を考えると、係り受けをどのように入れるかとか分かる例がよかったのだが。(しかし、当時のコードは Perl で書いていたので、これが仮に動いたとして、うちの研究室で Perl を読める人は1人もいないし、Perl の説明をするのは本質的ではないので、動かなくて正解だったのかもしれない)

まあ、今年度は基礎勉強会の数と内容を大幅にグレードアップしたので、今年の新入生は説明しなくてもこのあたりすぐできる(たぶんツールの名前さえ分かれば数時間でできると思うし、全く説明せずどれだけ多くかかっても3日くらい?)と思うし、来年度以降の新入生も同様に基礎勉強会をしっかりやる方針は継続したい。

学生から質問があったのが17時半だったので、研究室を出た時間が18時半になってしまい、ちょっと遅くなって心配したが、なんとか20時前に家に着くことができた。できれば18時前後に家に着きたいのだが、19時前後になってしまっていて、妻に迷惑をかけていて、申し訳ない。18時に帰宅できれば、まだ娘が起きているので、寝かしつけを代わってあげられるのだが……。19時半までに帰宅できれば一緒に夕ご飯が食べられるのだが、20時を越すと夕ご飯も別々になってしまうし、どれだけ遅くとも18時には大学を出たい(そのためには17時半には研究室を出ないといけない)。心を強くもたないと……。