高1で NMT を回してる

今日から都立高校を対象とした理数研究ラボという制度で3日間都立高生に来てもらい、演習をしてもらう。来たのは高1-3の男女取り混ぜて6人に対し、こちらは TA が3人というかなり豪華な布陣。

午前中は座学で、(統計的)機械翻訳の話とニューラル機械翻訳の話をしたが、ボリュームが多く、お昼ご飯を挟んで継続。話そうと思えばいくらでも話せるのだが、意識が飛んでいる生徒もいたし、ニューラル機械翻訳の話だけして演習に入った方がよいのかなあ。うちの M2 から下の代は「ニューラルネイティブ」で、そもそも最初からニューラルで入ったクチなので(補足しておくと、時期的には2016年のことなので、そこまでニューラルがあっという間に広まるとは思っていなかったが、研究室の戦略的にそのようにした)、統計的機械翻訳の話はそこまで必要ではないことも分かっているのだが。

演習は今年度から新しくもらった部屋でやることにしたのだが、外から来た人は研究室の無線ネットワークにつなげないので、最初は SIM を買って IIJ につながる Wi-fi ルータでつないで演習してもらったのだが、1時間で 3GB 使い尽くしてつなげなくなって、演習ができなくなりそうで焦る。一応大学のネットワークに接続できる Wi-fi ルータの設置申請はしてあったので、なんとかそちらを使えるようにして事なきを得る(結局、持ち込みの端末でやる人はいなかったので)。

今回は演習は全て Google Colaboratory を用いるように設計。Google Colab は Python の Jupyter Notebook のような環境だが、GPU が使えるし、裏では root 権限で Ubuntu がインストールされていて自由に使えるので、データやツールを全部ダウンロードして実行するような使い方に最適なのである。Google Colab の中のファイルを取り出すのが若干面倒だが、今回はそういう使い方はしないので無問題。

ちなみに誰でも使えるように公開しているので、興味ある方はこちらから見ていただければ(要 Google アカウント)。「1時間でできるニューラル機械翻訳」というコンセプト。実際プログラミング経験がほぼゼロの高校生たちも(TA が隣にいて、何かあったらサポートできる体制ではあったが、特に大きな問題なく)初日の1コマ分くらいの時間で全員できていたので、動かすだけならそんなに難しいところはないと思っている。高1でニューラル機械翻訳の実験をするの、日本最年少だろうか。

夕方は基礎ゼミナール(学部1年生の授業)の採点。人数が少ないので採点自体は楽。みんなしっかり書いていて(自然言語処理なんて初めて知った人も多いだろうに、と)少し感動する。来年度の授業はだいぶ変えるつもりだが、これはこれでよかったな、と思ったりする。

夜は社会人博士の人たちの勉強会。NLP 若手の会シンポジウム(YANS)で発表するかどうかの見極めの会だったが、どちらかはっきりせず……。自分は研究発表に関して学生が発表したいと言えば基本的に認めているのだが、「いついつまでに結果(原稿)ができていること」というのをチェックしていて、「見切り発車」させることはないのである。人によって手の動く速さが違うのでなんとも言えないが、去年からは発表を見送らせることに積極的になったので、微妙なものを出すくらいなら(機会はたくさんあるし)見送ってもらっている。