転ぶなら後ろ向きではなく前向きに

重い腰を上げて早朝からスライド作成。みんな、オラに元気を分けてくれ!(爆) 

もう今週末は引っ越しなのでいろいろ片付けないといけないのだが、そんなことをしている時間がない。どうしたものか。

久しぶりに高校生が通学する時間に電車に乗る。坐れない。4月から毎日こんな感じだろうか。つらそう。行き帰り、どちらかくらいは坐りたいな〜。各停でもいいから……(近鉄は急行の方が空いていることもあるので、各停だから坐れるというわけではない)

諸事情により、朝からミーティング。自分が退職することがきっかけであったが、なんだか申し訳ない。遅かれ早かれこういうことになると思っていたが……。「いちばんいい上司でした」とおっしゃってくださったのが救いだが、もっとやれることがあったようにも思い、複雑な気持ちになる。働きやすいと思ってくれていたのであれば、それに越したことはないが、難しいものである。

次に英作文の誤り訂正タスクのミーティング。ミーティングのときは進んでいると思ったのだが、冷静に考えるとちょっと遅れている気がする。誤解してほしくないのだが、みなさん (特に M1 の人たち) には開発ではなく研究をしてほしいと思っているので、早く研究に着手してもらいたいのである (現段階で研究の入り口が見えているのは ippei-y くんだけである)。〆切まで2カ月を切っている段階で、サーベイを始めたばかりで「どの先行研究を実装しようかと思っています」というのを聞いてちょっと目の前が暗くなったが、既に発表された誰かの手法を実装するのは研究ではなく開発であり、まだスタートラインにも立てていないのである。

ベースラインの実装がないのはマイナスだが、ベースラインの実装ができてようやく0になる。とにかく速やかに0に持って行って、そこから1にする方法を考えなければならないのだが、0にすることが目標だと0にすらならないのではないかと危惧しているのだ。士気を下げるつもりではないのだが、個人的には全体で0 (研究的に新しいことが一つも試せていない) だったら参加自体取りやめたほうがいいと思うし、参加するならもっと新しいことに挑戦したほうがいいんじゃないかと思う (もちろん、単に思いついたことを実装すればよい、という意味ではなく、先行研究をサーベイした上で、誰もやっていないことに挑戦する、ということ)。挑戦した上でうまく行かないのは仕方ないし、転ぶなら後ろ向きではなく前向きに転んだらいいと思うのだ。

あと、なんだか大規模データを使おうとして無為に時間を使う人が多いので、修士 (特に M1) のうちは大規模データ禁止令を出したほうがいいのではないか、と思うくらいである。ひとまずうまく行くことが分かるまで4万文以下のデータで実験して、コンセプトあるいは実装の正しさが示せたら大きなデータにかけるとか。大きなデータを使うと、(待ち時間が多いので) コードを書いていない割に実験している気になってしまうので、危険である (全く何もしていなくて「やばい、やっていない」と思うより、さらにタチが悪い)。同じ時間を使うなら、小さなデータで待ち時間を少なくして相対的にコードを書く時間、データを見る時間を多くした方がよい。ある程度言語処理に慣れてくると、実験結果が返ってこなくてもいろいろとやれることが増えてくるので、大規模データを使ってもよいと思うが、そうでないうちから使うと、自分の成長率を鈍化させてしまいかねない。

昼から [twitter:@takesako] さんと雑談。[twitter:@kevinduh] さんと [twitter:@neubig] さんも交えて、今後の話とか、言語の話とか。「パターン認識機械学習の学習」(下記リンク先は第1版のままのようだが)

パターン認識と機械学習の学習―ベイズ理論に挫折しないための数学

パターン認識と機械学習の学習―ベイズ理論に挫折しないための数学

の第2版をいただいた! (*゜▽゜*)

サイボウズNAIST から就職してくれる人が出てくれるといいな〜。毎年とは言わなくても、隔年くらいで……。

昼一で (昼ご飯を食べる暇もなく) 企業の方々とミーティング。なんだか PFI のサービスをいかに活用するか、みたいなコンサルティングになっているのだが、なんでこんなに PFI の製品について自分は説明しているのだろうか……(いや、こうやって「あれがやりたいならこれ、これがやりたいならこれ」と言えるくらいラインナップが揃っているのがすごいのだが)。とはいえ、プロトタイプを作って社内で評価もしているようで、実際に使う人がどのような意見・反応であったのか聞くのは大変興味深い。そこそこ技術的な背景も分かっていてコードも書ける方々とお話しすると、いろいろと刺激になってよい。東京に行ったら遠くなるのかと思ったら逆に近くなるようで、こういうふうにときどき研究の話を還元できるといいなと思う。

連続して言語処理学会年次大会の練習セッションその1 (その2は水曜日)。今日は口頭発表が3人、ポスター発表が1人。修士論文の発表練習は、内容についてのコメントは禁止して発表スタイルについてのコメントのみに限定したためにスムーズに進んだが、今回はその制約がなかったため、松本先生から一人一人の発表の内容についての質問が続出して、思ったより難航する。おっしゃることもどれもごもっともなので、最終的な発表までにそれがクリアになってよかった。あと、予稿に書いた内容からどこまで離れていいか、という話題があり、出してから実験を大幅にやり直した場合、どこまで話していいのか確かに悩ましい。

朝9時から休憩する暇なくずっと働き詰めなのだが、夜は予算消化で頭を悩ませる。年度末の予算消化も助教シャドウワークの一つなのだが、もう今週は水曜日から出張で、次1日フルで使えるのは18〜19日になってしまうので、年度末までにとなると今週中に発注をかけておかないといけないのである。まあ、12月くらいから毎月少しずつ使っていっているので、そんなに大金が残っているわけではないのだけど……。(自分の予算はもう使い切った)

深夜に銭湯に行ってサウナにしばらくいて、そのあと涼まずに湯船に入って帰ろうとしたら、のぼせたのか気持ち悪くなり、冷水のシャワーを数分浴びてようやく回復する。サウナくらいでこんなになるとは、びっくりした……。体力が弱っているのか体調が悪いのか知らないが、ノロ、インフルに次ぐ身の危険を感じた一瞬であった (今朝早く起きたので、睡眠不足だったとは思う)。サウナに入ったら、しばらく身体を冷やして休まないと危険である (いつもはサウナのあとはしばらく腰湯で冷却するのだが、今日は省略してしまった)。そもそも心臓が強い家系ではないので、サウナに長時間入ること自体が危険なのかもしれない。気をつけよう。