論文を解説付きで読む効果

そろそろ研究室では IJCNLP(自然言語処理に関するアジア太平洋地域の最大級の国際会議)に投稿する学生たちに原稿を提出するように伝えているので、ぼちぼち上がってくると思うのだが、何件の投稿になるのか若干気がかりである。7月7日が投稿〆切である。今年度はまだ国際会議の本会議での採択がなく、残念なことに全滅しているので、ここで全員採択されてほしいのだが……(主要な要因は自分の力不足で、論文のブラッシュアップにかける時間を確保できなかったせいで申し訳なかった)。

すでに英語で書かれた原稿がある研究はいいのだが、国際会議投稿経験がない学生で、まだ英語で書かれた原稿がない(日本語で書かれた原稿はある)場合、同時に見られるのは2件がいいところな気がしている。そもそも現時点ですでに「LREC に投稿しましょう」と言って IJCNLP を断念した学生すらいる(LREC は extended abstract が9月締め切り)。IJCNLP への投稿は時期的にも来年3月に修了する人が最優先なので、投稿を見送ってもらう人も出るかもな……(ちゃんと原稿を出してくれない人とか)。

昼から研究会でチュートリアルをしてもらう。今回は

  • Jupyter-notebook と numpy
  • Chainer
  • Scrapy を用いたクローリング

の3点。どれも試してみたい感を刺激されるいいチュートリアルで、詳細についてもよくまとまっていた。Chainer に関しては新入生向けの基礎勉強会でちょうどニューラルネットワークをやったところのようで、自分で微分して実装する話と、Chainer の自動微分で計算する話と対応させて説明があり、理論と実践のバランスもよかった。来年度が楽しみである。

そういえば東大中山研の「当研究室を希望する学生の方へ」という文書で以下のような記述があり、うちも学生の研究テーマ選択ではこういうのを考えた方がいいのかな、と思ったりする。

深層学習の研究がやりたい人へ

最近非常に人気のある分野で希望する人も多いのですが、他の人の2,3倍研究に時間を割く覚悟がない限り手を出さない方が無難です。理由は主に、(1) 深層学習自体が非常に計算に時間がかかると同時に、泥臭い作業が多い技術であるためどうしても本質的な部分以外での手間が多くかかること、(2) 一か月、一週間という単位で技術革新が起こっている極めて競争が激しい分野であり、生半可なスピードでは研究として意味のある成果は出せないこと、の2点です。これらを理解した上で挑戦したいという方は大いに歓迎します。

とりあえず、論文をあまり読みたくない人(速く読めない人)、コードをあまり書きたくない人(速く書けない人)が手を出すと討ち死にすると思うので、内部進学生の研究テーマ割り振りでは考慮した方がいい(無理そうな人は研究テーマの再考を検討してもらう必要がある)のでは、と思った。まあ、これら勉強が好きでも研究につながるかどうかは別なのだが、そもそも勉強が好きでない人は深層学習は無理かな……。

夕方は COLING 2016 読み会。2本の論文を紹介してもらう。今学期は論文紹介で自然言語処理の基礎を解説する、という試みをしているので、論文紹介をちゃんと聞いている人は基礎が身につくことを期待している。去年もこうすればよかったが、後の祭りである。