論文を選ぶだけでも一仕事

午前中は第9回最先端NLP勉強会のために ACL 2018、EMNLP 2018、TACL の論文にざっと目を通す。自分も半分くらいには参加しているのだが、この会は「研究者のための研究者による論文紹介」が趣旨で、第1フェーズで読むべき論文の推薦、第2フェーズで自分が読む論文の立候補、という順番で担当が決まるのが特徴である。第1フェーズには、論文を紹介しない人も論文を挙げるのが原則で、それぞれの国際会議の論文リストを全部見て、何本かずつ挙げるだけで結構大変である。

各国際会議ごとに論文が200本以上あるので、自分はまずタイトル(と著者名)だけでスクリーニングして2割くらいに絞り込み、次にアブストラクトを読んでざっくり「自分でも紹介したい」「他の人が紹介してくれるなら聞きたい」「自分で紹介したくないし、他の人の紹介でも特に聞きたいとは思わない」の3種類に分類し、1番目と2番目のカテゴリーに入った論文については、実際に PDF をダウンロードして、どの順番で推薦するかを決めている。自分が推薦しても他の人もある程度推薦しないと立候補フェーズに残らないので、マニアックな話はよほど紹介したい話でない限りは推薦しないが……。

以前はこの作業は1日(半日)がかりだったのだが、上記のように最適化してからは2時間くらいで終わるようになった。まあ、これに限らず自然言語処理の研究者や学生であれば毎回トップカンファレンスの論文リストを眺めるくらいのことはした方がいいと思うので、研究室内でも後期に ACL/EMNLP 読み会を開催する予定である。

あとはひたすらメール処理デーだったが、後期の授業が始まる前にいろんな TODO を全部片付けておきたい……。