簡単な問題を自分で複雑にしない

午前中は赤坂へ。……行くつもりが、地下鉄で逆向きに乗ってしまい、ミーティングに遅刻(汗)2駅で気がついたからまだ被害は少なかったが、慌てすぎだった。

ミーティングはインターンシップをお願いしているところで、まだ学部生なのでちょっと心配で様子を見るということもあったが、問題なくやっているようだ。

うちは情報通信コースというだけあってか、学部4年生でも割とコードが書け(プログラミングコンテストガチ勢ではないが、研究的には十分)、かつ今年の修士の新入生もそんなに詰まらず研究のコードが書けるようで、むしろこれで論文が書けなかったら教員の責任が重大である。(論文をばんばん読んだり、どんどん発表したりする先輩がいるような環境をまだ用意できていない、ということも含め。)

お昼から日野キャンパスに移動して、学生と昼のミーティング。

今日が〆切のタスクに関して、昨日の実験結果はあまり芳しくなかったが、今日は出力を見るとそこそこできていたので一安心。最適化をかけない方がよい結果なのだが、そもそも最終的に評価したい尺度で最適化をかけないと意味がないので、そういうものなのだろう。zmert の使い方を覚えたいのだが、それをするにはちょっと時間が足りない。

別件でコーパスの前処理について、テキストファイルから行の先頭が特定の記号にマッチするものを抜き出してもらおうとして、1時間内外でできる(実際自分がやったら3分かからなかった)と思ったのだが、1日経ってもまだできていないので、ステップを確認する。(こういうとき、別に手が遅いわけでなくても、本来やるはずのタスクをやっていない可能性が高いので)

どうやら「小さいデータでまずやろう」と思って(ここまでは、ちゃんと考え方が身についていてすばらしいが)画面に less で表示したテキストを別のファイルにコピペして、それでやろうとしていたため、端末の画面幅で改行されたり、元々のファイルの文字コードから変わったりして文字コードの変換が必要になったり、色々な問題が発生していたようである。いずれも本来のデータでやれば存在しない問題なので、自分で問題をややこしくして時間をかけていた、ということである。(その証拠に、元のデータでやったらファイルサイズがエディタで開くとしばらくフリーズするくらい大きいとはいえ、結果が出てくるのは一瞬だった)

アドホックな対処としては、人によっては1日に1回の確認だと間隔が開きすぎで、変な方向に行ってしまうので、ちゃんとできているか数時間ごとに確認する、というものだが、自分だったらそこまで細かく管理されたくないし、確認する方も手間なので、他の方法を考えたいところ……。自分でやった方が早くても、学生がやり方や考え方を身に付けるためにあえて時間をかけてやってもらって見守る、というのが教員の基本スタンスだと思うが、実は教員の時間も有限なのでかかる時間とのトレードオフがあり、ある程度のところを超えると「これ以上は無理」という限界があるようだ。(あと、そもそも学生が自分で発案したテーマの場合、論文もプログラムも分担せず本人に全部書いてもらうので、「自分の分担のところを書いて渡す」ということができない)

また、人工知能業界では「ある問題を解くとき、その問題よりも難しい問題を途中で解いてはならない」という Vapnik の法則というものがあり、今回のケースなんかもその一例だと思うのだが、これはどうやったら防げるのだろうか? たとえば出力は正の値しか取り得ない関数が負の値を出力しても「これはおかしい」と思わない人がいるようなのだが、こういう問題を解くときのセンス(あまりこういう単語は使いたくないのだが)はどうやって身に付ければいいのだろうか。授業でも「このようなことに気をつけましょう」と(何度も繰り返し)言うと、みんなそれだけは気をつけてくれるのだが、それ以外に応用してくれない人もいるので、言い方が悪いのか、と思ってしまう。まあ、授業は大人数を相手にしているので、仕方ない気もするけど……。

午後から研究相談。以前東大の相談員で ftp.ecc.u-tokyo.ac.jp の管理などに尽力してくれた K 頭くんが、自然言語処理関係の相談があるということで、わざわざ日野キャンパスまで来てくれた。かれこれ10年以上ぶりだろうか? お互い変わっていないような、変わってしまったような、不思議な感じ。

やりたいことは分かったが、年度内にする、というのだと、できることは限られているな……。首都大の学内の予算もそうだけど、単年度でできることって限られているし、その年度に研究した成果が査読付きのところで発表できるのは、早くて翌年度以降なのではないかと思う(ので、単年度の予算の継続を、その年度の中で判断されるのは厳しい)。

夕方に研究室に戻って学部生の人たちの進捗を聞いたりする。勉強することと、他の人の研究を手伝うことと、自分の研究を進めること、の3つを並行してやっているのだが、自分の研究を進める、というのが難しいかもしれない。具体的には「10月に(長くても1-2ヶ月で作れるような)何を実装するか」を決める、ということなんだけど……。(出したアイデアがいまいちで、考え直さないといけなくなる可能性を考えると、9月中にはラフなアイデアを提案する必要がある)