霜月を超えると朝は寒すぎる

もう師走。このところ、朝が寒くて布団から出られない。寝っ転がりながら iPad はできるのだが、iPad でできるのはメール(コピペや添付が難しいので、読むだけ)と Twitter(こちらはコピペも添付もしないので、書ける)くらいなので、結局早朝に仕事ができないことに変わりはない。

結局通勤時間中の自由時間と早朝の仕事時間を入れ替えて、布団の中で Twitter 見たり日記を書いたりして、電車の中でメールの返事を書いたりする、ということにしているのだが、通勤時間に仕事をするのは効率が悪いので、なにか回避策がないかなー。

午前中は企業の方の訪問(2回目)。今年度はもう新規の案件をお受けしていないので、技術相談はお断りしたが、基本的な技術に対する態度は共通しているので、意気投合。お互い保育園に子どもを送り迎えしている、という話でも盛り上がったが、父親送り迎えをするのは割と普通の世の中なのかもしれない。しかし19時半にお迎えをして子どもが寝るのが22時、そこから仕事をして午前3時に寝る(起きるのは6時)、というのはちょっと厳しい……。夜に仕事をすれば朝寒い問題はないのだが、夜に仕事をするとエンドレスになりがちなので、寝る時間は遅くとも11時までにしたいな。(夜はインターネットにはつながないでできる仕事をする、とか、仕事をするにしても制限をつけて仕事をしたほうがいいと思った。思ってできるなら、もうやっているだろうが……)

お昼からは臨時のコース会議。メイン議題は博士論文の提出の審議であるが、コース会議で承認されたらコース長会議に上がり、そこで承認されたら教授会に上がり、というような順番があり、自分も2年後にやることになるので、ちゃんと把握しないといけない。書類もフォーマットが決まっているので、間違えないように。自分も博士号を取得するときは松本先生がこういうことをやってくださっていたのかと思うと、頭が下がる思いである。

昼過ぎは言語学習支援勉強会。NLP 若手の会シンポジウム(YANS)で発表した学生たちに、発表しないの?と聞いたら、発表してくれることになった。せっかくリソースを作ったなら、ちゃんと人の来るところで話して宣伝しておいたほうがいいように思うので、よいサイクルである。

途中、1時間弱 Skype ミーティング。やはりスペシャリストの方とお話しすると非常に勉強になる。あと、何人かいるとブレインストーミング的に新しいネタも出てくる。実は自分の強みは意味解析から形態素解析までのいろいろなレイヤーの仕事を(応用を見据えて)やってきたことだと思うので、最終的にそこにつながると自分の土俵になっている。手法というより新しいタスクの提案、データの分析、というような感じだろうか。

あとは情報抽出も自分の得意技の一つだが、こちらは研究課題を小町が持っていて、なんとなくこうすれば解けそう(新しい手法)、というネタ集なので、自分でサーベイしてよさげな手法をサクッと実装する学生とはピッタリはまるのだが、うまくいかないこともある。去年までと比べると、今年はみんなよく論文を読んでくれて、言われたように論文を100本くらい読んでくれた人は、しっかり論文を読む力、そして新しい研究ネタを自分で出せる、研究ネタの良し悪しが判断できる、という力がついているのだが、あまり論文を精読・多読してくれていないと、こちらから全部お膳立てするわけではない(が、ちゃんとサーベイは自分でしてもらわないといけない)ので、あるところから先に進まなかったりする。

研究室1年目の課題は機械学習、2年目の課題はプログラミング、3年目の課題はサーベイで、毎年それぞれに対応する勉強会を立ち上げてやってみているが、おそらく4年目の課題は英語である。留学生が2人になりそうなので、機械翻訳勉強会・言語学習支援勉強会の進捗報告の資料から英語化かなー。

夕方は機械翻訳勉強会。サーベイ報告と研究アイデアを聞く。割と深い。

サーベイ報告の方、研究室に来て半年で基礎知識が身についていることを期待するのは酷だが(自分も FSNLP を一通り読み終える、つまり M2 になるまで基礎知識足りてなかった)、依存構造解析と句構造解析の違い、構文解析と意味解析(意味役割付与、述語項構造解析)のタスクの違いくらいは夏休み前までに押さえておく必要があるのでは、という気がした。そう思うと、薄い日本語の教科書でいいから、専門用語の基礎知識補充のために、一通り読んでおいたほうがいいのかなぁ。

研究アイデアの方は、明らかにレッドオーシャンの研究テーマに突っ込んでいく学生をどこまで生暖かく見守るか、いう話なのだが、とりあえずすぐ思いつく単語を入れて Google 検索するくらいはしたほうがいいと思う。2012年とか2013年に思いついた研究テーマなら大したものだが(ACL/NAACL/EMNLP に通るくらい)、今からやって2016年の国際会議に出すネタとしては、さすがに先行研究がいくつもあると思われるし、実際あるので……。

誰かニューラル翻訳やらないかなぁ。これもレッドオーシャンだとは思うが、まだ工夫の余地がある(修士論文を全部これに突っ込むくらいの覚悟でやれば、他の研究グループに何かを先に出されたとしても、発表できるくらいの差分を作ることができる)と思うのである。