データマイニングの基礎知識を身に付ける

午前中は機械学習の基礎勉強会。年度内には全部終わりそう。

プログラミングのアルバイトを1件受注。学生数が少ないので、気軽に引き受けられないのだが、今回のは割と軽めなので。来年度学生が増えたら(今の2倍弱になる。一気に増えるわけではなく、今が1年目なので少ないだけだけど……)、もう少し頼みやすくなるかもしれない。今年度は、やる学生がいる予定で引き受けて、結局やる人がいなくて自分で作ることになった案件があるのだが、ちょっと見込みを誤った。もっと前から自分でやるつもりで準備しておいたほうがよかったな〜。

午後にメール処理していると、大学院の演習で分からないことがある、と学生たちが来る。研究ではMATLABを使っているグループなのだが、PythonPostgreSQL のインストール、機械学習のツールのインストール、PostgreSQL のダンプデータのロードなど、さっぱり分からないそうである(3人とも研究室がバラバラ、OSもバラバラなので、コミュニケーションを取りにくいのも関係している)。

端末を持ってきてくれたわけではなかったので、自分の MacPostgreSQL のインストール、scikit-learn のインストールなど、ステップバイステップで見せる。自分もいつも SQL を使うときは MySQLSQLite (MS SQL Server のときもあったが)なので、Postgres の操作は調べつつ、であったが。2時間付き合って終わらず時間切れになり、やったステップを小一時間でまとめて Wiki に書いて渡す。

ゼロからでも2時間くらいかければできるので、1ヶ月以上かかってまだツールのインストールもデータのロードも終わっていないのは想定外だったが、確かにデータマイニング的な研究開発をしないとこのあたりは触らないかもしれない。あと、そもそもコマンドラインからコマンドを実行する、というのに慣れ親しんでいないとかなり厳しい(それもあって、できる人が一人でもいればいいと思い、チームを組んでもらったのだが)。今回は履修要件を書かなかったが、書いた方がよかったかも……。

ただ、今回の大学院の演習は「ネットワークマイニング・テキストマイニング」というテーマで希望して来た人たちなので、こういう経験ができるのは悪いことではないのでは、と勝手に思ったりしている。(それが直接役に立つかどうかは、どういう仕事に就くことになるか次第かもしれないが……)

大学院の演習は、学期中だからあまり時間が取れない、という問題があるそうだが、隣のヒューマンメカトロニクスシステムのコースは学期中に演習をやらずに夏休みの時期にやらせるそうで、実際演習の効果を考えるとそのほうがいいと思う。2単位なので建前上は90時間確保してもらいたいのだが、毎週少しずつやっても思い出すコストがかかるばかりで、それなら一気に2-4週間確保してやってもらったほうがいいだろうし。ただ、夏休みはインターンシップのハイシーズンなので、実際必修の授業で夏休みを占有するのはもったいない気もするし、この演習自体実施が難しいのではなかろうか?

年末恒例の入力メソッド飲み会の手配をしたり、ワークショップのプログラムを組んだりする。今年は10大ニュースはあるのだろうか。ほぼ毎年飲み会の手配をしてきたが、さすがに東京にいて京都の飲み会の手配をするのはしんどいので(そもそも京大出身ではないので、京都の飲み屋も知らないし……)、今回で幹事は引退かな〜。

研究室で大学院に進学予定の学生は LaTeX で卒論を書くこと、と伝えているのだが、自分の MacBook ProLaTeX を華麗にコンパイルしようとしたらコンパイルできず、失態を見せてしまったので、原因を調べてみたところ、ホームディレクトリ下にある texmf に適切にシンボリックリンクが張られていなかったからであった。なんと……。しかし LaTeX も使い方を勉強していないと、使うだけで大変なのかも。

合間合間にアルゴリズム演習の添削と、物品の見積もりの依頼。予算によっては年内に発注済みにならないといけないのである。旅費もそろそろ確定しないとなぁ。言語処理学会の年次大会、飛行機で行かないといけないので、ある程度予算を残してあるのだが……。