大学に入ってすぐに学ぶこと

午前6時から2時間ほど授業準備をしたりメール処理したり。前も書いたように今年は Google Colab というのを使って OpenNMT-py(PyTorch)によるニューラル機械翻訳の演習をしようとしているので、その準備である。

この Google Colab は Ubuntu で動く Jupyter Notebook(つまり Python)なのだが、コマンドラインからコマンドも実行できるので(pip はもちろん apt も使えて)root 権限でインストールし放題だし、GPUNVIDIA Tesla K80 で、現在でも70-80万する代物)も使い放題なので、簡単な演習ならもうこれで十分なのである。制限はいくつかあり、90分放置するとセッションが消えるし、最大12時間でセッションが消える(セッションをまたいでデータを保存したければ Google Drive 等に保存する必要がある)のだが、その欠点を補ってあまりあるほど便利。しかも無料。Microsoft の Azure ML を使おうかと考えていたこともあるが、もう Google Colab でいい、と思っている。(仕事以外で趣味で GPU 使って遊びたい人にもおすすめ)

自然言語処理の大学院の授業は結局今日は演習に到達せず、ひたすらゼロから始める ニューラルネットワーク機械翻訳を解説して終わってしまったが、思ったより話すことが多い。この2017年3月の資料から1年経って付け加えるとしたら教師なしニューラル機械翻訳の話題かと思うが、まあニューラル機械翻訳はかなり安定期に入った技術なのではないか、と思ったりした。

お昼からはひたすらメール処理。なんだかメールが多い。

夕方は B1 の基礎ゼミナール。座学をようやく終えて今日からアノテーションに入る。結局アノテーションの準備が間に合わず、機械翻訳アノテーションをしているのだが、これはこれでおもしろい。学部1年生でもアノテーションできるかという試みとしては成功しているように思うのだが、どうも教養の授業としては(毎回課題を少し書いてもらっているのを見た感じ)コレジャナイ感を感じ始めており、来年は専門色を排除した授業にしようと思っている。

それを自分がやる意味があるのか、というのは自問自答すべきだが、自然言語処理アノテーションを通じて学部1年生が身につけておくべき知識を伝えるのは効率が悪い。結局西尾さんが毎年1年生に教えてくれていたような、PDCA サイクルの回し方、アイデアの出し方(ブレインストーミングの仕方)、他人とのコミュニケーションの取り方(どのように話すと建設的に進められるか)、みたいなのが、入学直後に身に付けておくといいスキルセットではないかなと思っている。