大学でのプログラミングも継続すればレベルが上がる

午前中、ひたすらアルゴリズム演習の課題の添削。40人弱が提出するので1回あたり5-6時間かかる。今年は1年目なので仕方ないが、毎年これだけの時間がかかると厳しいので、来年はどうするか考えよう。単純には毎週出している課題を隔週にするとか、1回で2-3問出している課題の分量を減らすことであるが、これでもかなりミニマムな気がしているので……。

午後は大学院のプロジェクト演習。KDD Cup 2013 の論文の著者推定タスクである。サーベイは前回までで終わったので、2週間開けた今日は進捗報告である。

公開されているベースラインくらいはチュートリアルもあるので、動かせたかなと思ったのだが、一応2チームは動作はさせることができたようだが、評価スクリプトがエラーになるそうで、Python の分かる人が学生9人中誰もいないため、3チームのいずれもベースラインシステムの評価ができていない、という報告。即興で、1行ごとに先頭が論文IDで、残りは著者IDがスペース区切りで入っているデータを、1行に論文IDと著者IDのペアになっているようにするプログラムを書いて渡す。これくらいでも、Python が分からないため書けないようなので……。

エラーを見せてもらうと、結局テストに使うべき事例を間違えていたからのようだが、エラーメッセージを見れば分かる範囲のことでもあるのだが、エラーが英語で書かれていると、みんな目の前に表示されていても読まないらしい。お、おう……。自分も学部1年で初めてインターネットに触れたときは英語より日本語のほうを読んでいた気がするので、仕方ないか。1年生の後期にパーツを買ってきて組み立てた PC に Linux をインストールしようとして、英語で書かれたドキュメントしかなかったので観念して英語を読むようになったが、英語でないと書かれていない(けど読みたい)ものがあるかどうか、かな?先日MSの萩原さんがいらしたときも、エンジニアとして生きていくなら英語での読み書きは必須なので、学生のうちにやっておくとよい、とおっしゃっていたし、みんなM1なんだからそろそろ観念したほうがいい(笑)

あと、著者推定器の実装は、JavaチームはWekaで、RubyチームはRでするらしい。MATLABチームはこれから検討とのことだが、どのチームも分類器を使ったことのある人もほとんどいないようで、みんな完成するのかちょっと心配になってきた……。

そもそもうちの情報通信コースでは、機械学習が出てくる授業は3年生の後期の「人工知能」および「Webマイニング」の授業だけのようなのだが、ほとんどの学生は3年前期までで選択科目は履修してしまい、3年後期は必修の実験しか取らない(でアルバイトをする)みたいで、そうするとほとんどの人が機械学習は研究室でだけ学ぶ知識になってそう。今学期から研究室内部で機械学習の基礎勉強会を始めたが、基礎勉強会を各研究室別々にやるのも不毛なので、何研究室か合同でやれないかなぁ。(学生がちゃんと授業を履修してくれれば済む話かもしれないが)

夕方はメール処理の合間を縫ってコース会議の議事録作成。記憶力が相当悪くなっていて、覚えているうちにやらないと、自分の興味のないことは速やかに忘却してしまうのである。

夜はちょっとだけ学会の仕事。今年度はちょっと委員的な仕事を引き受けすぎたと思って、先日一つ懇親会の幹事のお仕事をお断りしたのだが(タッチの差で依頼された、来年度以降の研究会の幹事の仕事はお引き受けしたので……)、こちらの仕事もけっこう大変なようで、申し訳ないが断ってよかったように思った。今年度内にやらないといけない仕事は、もう追加で引き受けるのではなく、いまお引き受けしている仕事をちゃんとやることに集中したいと思う。(そろそろ来年度のNLP若手の会シンポジウムについても動き出さないといけないころであるし)

帰る前、少しだけテキスト処理。いわゆる半角を全角に変換する必要があったのだが、超久しぶりに Perl で書く。学部生に聞いたら Perl は名前くらいしか知らないとのことで、それはそれで幸せだよ、と言ったりもしたのだが、自分は Perl も割と好き。Perl Best Practices を読んで感動したのを思い出したりした。英語が非常に分かりやすかったせいもあると思うが、技術書はこう書きたい、と思わせるものがあったのである。

それに関連して、M2のときに書いた日記を発掘。「Perl プログラマのレベル10」という(翻訳の孫引き)記事なのだが、Python でもあまり変わらないな(このときの自分は、将来Pythonを使っているとは考えていなかったが)。ちょうど「レベル1」ぶんが1学年に相当するくらいで、うちの研究室で修士号を取り終わるころレベル6-7程度になっているくらいが目標かな?