ストーリー一度作ればあとは楽

朝5時半から1時間ほどメール処理。5時以前だと、起きて仕事をしていると妻を起こしてしまうので、起きても二度寝しているのだが、二度寝すると(目覚ましなしで)5時に起きるのがなかなか難しい。6時までには起きられるのだが……。

午前中はソーシャルメディア解析勉強会である。vim -d で4ファイルまで同時に diff を見られるので、また1時間アノテーションを見ていたが、全体の25%くらいしか見終わらない。さすがに今日くらいにはアノテーションを一区切りさせておきたかったのだが、このペースだと年次大会に行くのは難しいかも……。

そもそも解析器を作るところまでが実習プランに入っていたので、言語処理100本ノックの前半をやってもらったりしているのだが、分量的にはアノテーションだけでもよかったかなぁ、と思ったりする(100本ノックをやるために、アノテーションが後回しになったりしているようだが、重要度的には逆なので)。しかしそれだとアノテーションつらい勢が配属されるとお互い詰むので、悩ましい。週1.5時間で研究的に意味のあることをする、というのが厳しいのかもしれない。 まあ、今年度も最後まで行ってみないと分からないので、いい意味で化けるといいなと思っている。

午後は言語学習支援勉強会と機械翻訳勉強会の合同進捗報告。El Capitan で画面分割が標準でできるようになったので、前回の進捗報告のメモを左に、今の進捗報告のメモを右に表示して比べたりしているのだが、みなさんに議事録というか自分で理解したことを、その日のうちにまとめてもらったほうがいいのかもしれない。問題はそれを共有するのに適当な場所がないことで、今から何かを導入するなら Slack なのだろうが、すでにうちはサイボウズ Live を使っているし、Slack があと何年続く(流行っている)かも分からないし、研究室の基盤ツールは10年くらい平気で使われることを考えると、サイボウズ Live、DropboxGoogle Drive あるいは Google Docs でスマートに解決できればいいのだが。

機械翻訳勉強会はかなりバラエティに富んだ内容。新しい対訳データが来たので回してみました、というのから、ニューラル MT を 回(そうと)してみました、という話まで。ニューラル MT は CPU でやると途方もない時間がかかるようで、修論が現実的な時間内に書けそうにないので勘弁してください、という報告があったり(汗)ニューラル MT、割と本気で研究室として取り組んでみたいのだが、計算機リソースは如何ともしがたいので、とにかく深層学習用のサーバを早く調達せねば、という気分になる。

あと、やはり M1 の人たちには論文の精読と多読をしてもらわないと、と思うのだが、読み方講座を開いたほうがいいのかなぁ。論文の読み方、教えるべきかどうかちょっと不安で、論文の書き方は教えた方がいいと思うのだが、読み方は人それぞれなので、何をどれくらい読むかだけ決めて、読み方はあえて指定しない方がいいのではないか(みんなが同じ読み方になるのはよくないのでは)、と思っているのだが、世の中自力で読めるようになる人ばかりではないので、一度は決められたやり方で読んでもらった方がいいのかな、と思ったりする。(英語の論文ではなく日本語の論文なら読めるかというとそういうことはないので、言語の問題ではなく、論文という文書フォーマットの読み方を身に付ける必要があるようだ)

夕方、研究アイデアについて相談を受ける。いまやっているテーマと全然別のタスクだが、こういうふうに自分からアイデアを出してくれるのは嬉しいものである。話を聞いてみると細部に問題があり、この手法を使いたいならこのタスクは不適切で、このタスクを解きたいならこの手法は不適切、というようなことが分かったのだが、こういうふうにアイデアを戦わせると見えてくるものもあるし、ぜひたくさんアイデアを出してほしいと思う。最近流行っている X をとりあえず Y に適用しました、なんだか分かりませんが流行っているのでうまく行くと思います、というのでは論文のロジックとして弱いのだが、Y にはこういう性質(問題)があるので X を使うとうまく行きそう、というストーリーが描けるといいな、と思うのである。