近似して扱いやすい問題に

今日は第9回最先端 NLP 勉強会という論文読み会への参加のために、理研 AIP オフィスへ。実はここに来るのは初めてだったが、駅直結で無茶苦茶便利。駅から20分歩かないといけない日野キャンパスとはえらい違い。

自分の紹介した論文は以下(スライド)。最近研究室では情報抽出の研究をしている学生がほとんどいないのだが、本来自分はそちらの研究の知見が多いので、こういう論文に興味があるのであった。(最近は機械翻訳をはじめとした言語生成の研究をする学生が多い)

同じ著者がほとんど同じ研究を何本も ACL に通しているというのが初めて知り、研究者(学生)としての生存戦略としては正しいのは分かるが、それってどうなの……と思ったり(手法 A と比べて手法 B がいい、という研究と、手法 A と比べて手法 C がよい、という研究を同時に投稿するが、手法 B と手法 C は比較しない、というような。まあ、自分たち以外にしていないと世の中に存在しないという意味では比較しなくていいのだが、自分はどっちがいいか知っているわけで、モヤっとする)。

深層強化学習の研究がちらほらブームになっていて、うちの研究室でもやってはどうかと去年から言い続けていて、自分のタスクに適用した学生もいるのだが、まだ(発表に至るという意味で)研究に使っている学生はいなくて、思ったより(いや、想定内ではあるが)なかなかやっかいである。個人的には、言語処理は(深層)強化学習でやるより、離散的な記号処理をなんとか連続値の世界で近似して処理する(たとえば Gumbel Softmax を用いた手法とかの)方が扱いやすいのではないかと思うのだが、理論的な基礎づけが難しいので、どうしたものかと思っている(詳しい人に教えてほしい)。

あと、研究内容を離れると、こういう会の運営は大変だと思うが、もう9回も続いているというのがすごい。他にも研究室横断でやっていた勉強会がいくつかある(今年の3月の言語処理学会年次大会ワークショップでも紹介された)のだが、段々と休止状態になっていて、継続することが難しい、と思うのである。

ちなみになんでそうなってきたかはよく分からないのだが、一つは PFN や理研 AIP のような組織に人が集中し(これ自体は悪いことではないが)、その中だけで回るようになってきて、外と連携する意義が薄れてきたのかなと思ったりする。まあ、単騎でやっている組織だけで再連結すればよいのだが、単騎の組織は運営に割けるエフォートもあまりなかったりして、持続可能な制度にするのは難しい。自分は連携することは半ば放棄して、研究室としては学生が勝手にやりたいように、行きたいところに行ってもらうことにしているが、これがベストなのかどうかは分からない。