中堅になってきたなと思う日々

今日も結局壁紙の作業があるので家で留守番。3日目終了時点でまだ1部屋終わっていない(2部屋目の壁紙は剥がし始めている)のだが、この様子で終わるのだろうか? 元々の作業予定では、1.5日で1部屋が終わる(3日で2部屋が終わる)ような工程表だったのだが……。

午前中はメタ査読をしたり査読のコメントを書いたり。昨日の最先端 NLP 勉強会でも査読をする人やメタ査読をする人向けのアドバイスがあったが、こんな話が出るところが最先端 NLP 勉強会は有意義だと思う(Aim4ACL という、国際会議に向けた原稿のブラッシュアップの勉強会も、同じような効果があったが)。最先端 NLP 勉強会、議論は非公開だが最近はスライドが公開されているので、どういう雰囲気で発表がされているのかは少し雰囲気分かるかも。以前は必ずしもそうではなかったのだが、最近は論文に書かれていない話をみんな積極的に盛り込んでくれるようになったので、聞いていておもしろい(関連する自分の国際会議の発表が少し言及されていたりするのは、立ち位置も分かってとてもよい)。

論文の(メタ)査読については、自分も若手ではなく中堅研究者になったのかな、というところだが、博士後期課程~博士号取得後5年くらいは、筆頭著者としての研究能力が高かったせいもあり、細かいところが気になって論文の評価をしていたと思う。ただ、何回かメジャー国際会議の分野長(area chair)をさせてもらったり、小さな国際会議のプログラム委員長をさせてもらったりして、落とすことではなく通すことに意味がある(意見が分かれるような論文は通すバイアスをかけた方がいいし、トップカンファレンス群はだいたい査読の基準は同じだが、中小規模の国際会議やワークショップはそれぞれに歴史的経緯や性格もある)、ということを学んだので、最近はあまりそういうところではなく「この論文を通すことが、このコミュニティにどれくらい貢献するか」ということを意識している。ポスドクくらいの人から見ると「なんでこんなの通すんだ」と思われるかもしれないが、立場が変わると見方も変わるし、査読を割り当てるときも査読者のバランスを考えてお願いしたりもしているので。

最先端 NLP 勉強会が、形は論文紹介という形式を取っているが、実はポイントは個々の論文自体にはそこまでなく、研究に関する why, what, how, when, who, where みたいなのを共有する場所になっているのがとても意味があって、日本の自然言語処理分野でトップカンファレンスに継続的に論文を出したりしている人が集まって、次の論文につながるような議論ができているのが有意義である。この会、会場の物理的な制約があって新規参入者の参入障壁が高いのが難点なのだが、クローズドな会になっていて、聞くだけの人(過去・現在・未来に発表したなく、他人の発表にコメントもしない人)を排除する、というのも議論の水準を維持するポイントの一つなので、仕方ないかな。

この会や NLP 若手の会が盛会になっている一方(それはとてもいいことだし、日本の NLP 業界的には間違いなくプラスだと思うのだが)、個人的にはなんだか2000年ごろの日本のオープンソース開発コミュニティのような雰囲気を感じて、ちょっと心配になる。それで、そういえば Kondara ってあったよな、と思って検索したらびぎねっとの宮原さんが書いた記事が見つかった。自分は宮原さんにオープンソース開発コミュニティに誘ってもらって(それまでは日本の開発コミュニティとはあまり関係しておらず、自分は直接海外の開発コミュニティとつながっていた)居心地の良さを感じ、NAIST に進学して最終的には今のような仕事をしているので、NLP にはそこまで恩義を感じていない一方、オープンソース開発コミュニティには恩義を感じているのであるが、後者は一時期の盛り上がりから現在に至るまで見ているので、ちょうど日本の NLP もこのタコツボ的な盛り上がり方はあれに似ているなぁ、と思ったりする(だからといって同じように進展するという訳ではないだろうし、もし同じようになるとしてもどうやったら防げるのかもよく分からないのだが)。

自分の個人的な意見としては、日本出身の人はもっと直接国際的なコミュニティとつながるべきだと思うし(だからこそ、オープンソース開発でも自分は日本のコミュニティを通さず直接 Gentoo のコア開発者になったし、海外でインターンシップもしたし)、最近は日本出身の自然言語処理(を中心とした人工知能関連領域)の若手の人たちが続々と海外インターンシップに行ったり、博士号を取得してから海外で働き始めているのはとてもいいことだと思っている。そこで世界的にもちゃんと通用することをアピールして、日本の大学もそんなに負けてないよ、という存在感を出していきたい。逆にやめたほうがいいと思うのは内輪でだけ盛り上がることで、いくらレベルが高いことをやっていても、外のコミュニティとつながっていない(情報の流れが、外から内向きばかりで、外に向かっていかない)のはよろしくないので、ちゃんと upstream に情報を返していきたいと思っている。

午後は後期の研究室の予定を確認したり、来週のトークの準備をしたり。英語で研究室紹介をするのは久しぶりで、深層学習時代になってからは初めてだと思うし(このところ毎年「さくらサイエンス」というのでフィリピンから来る留学生対応をしていたが、研究室紹介という観点からは特に紹介しておらず、研究紹介をしていた)、ちょっと色々と考えて調整して、3時間ほどかかる。しかし結局自然言語処理の分野の外から見ると、あまり深層学習はポイントではないような気がしていて、研究の流行具合と実践には少し差があるように思った(言語生成のようにニューラルで劇的に変わったタスクはあるのだが、それにしても使いやすいわけではないので)。