ニューラルな翻訳ならばGPU

午前中、ひたすら事務処理。月曜日を休み、かつ火曜日の昼に1時間ダウンしていたせいで、今週の事務が全くできていないのである。

昼からは論文紹介。

  • Vajjala and Meurers. Assessing the relative level of sentence pairs for text simplification. EACL 2014.

を紹介してもらう。文書単位のリーダビリティの評価と文単位の難易度の評価の間をつなぐ、という研究。いろいろ書いているが、おもしろい結果としては、Wikipedia に書かれている文は Simplified Wikipedia と比べて常に平易かと言われれば、実はそうではなく、Wikipedia の文でも最初から平易なものも入っている、というお話。

今学期は学部4年生の論文紹介からのスタートで、スライドを使って紹介するスタイルでは全員ちゃんと読めているようであったが、精読を聞くと個々の文の理解はあやしいところもあるので、もっと精読の機会を増やしたほうがよいのかも。SLP(自然言語処理の教科書)の勉強会でものすごく英文を読んでいるはずなので、英語力(精読力)も上がっていると思うのだが、やり方を変えた方がいいのかな?

夕方は研究会。自然言語処理チュートリアル、就職活動のチュートリアルTeXチュートリアルPythonチュートリアル。思い思いのチュートリアルをしてくれるが、準備にもう少し時間をかけてほしい気もする。ただ、研究時間とコンフリクトしてやりにくいという背景も分かるので、悩ましい。前期にこういうのができればいいのだが、研究室インターンシップで学部3年生が研究室に来るのは後期なので、これは動かせない。来年度どうするか、また考えよう。(B3 たちと一緒にデータを見るのは割と楽しいので、こういうのは続けたいが、プログラミング好きな人にはアノテーションは苦痛かもしれないし、何がベストなのか分からない)

研究会後、ワークステーションの受け取り。メモリ512 GBのマシンはまだ来ないが、GeForce TITAN X が4台動くワークステーションが先に来た。recursive なニューラルネットワークの研究をしている人はあまり意味がないかもしれないが、TensorFlow でニューラル機械翻訳とか、CPUでは無理な処理が動くのではないかな?