はじめてで迷ったときの論文の読み方

昨晩勉強会のあと20分くらい takuo-h くんと話したのだが、授業や勉強会が多過ぎてキャパシティを超えているとのこと、たぶん松本研の M1 はみんなそうではないかな。自分も M1 の間は平日は毎日3時間睡眠で予習・復習・勉強会そしてバイトと大変だったし、大体みんな忙しいのである。

NAIST の M1 自体がそもそも授業の負荷が高いのに加え、松本研は特に勉強会の数が多いので、全部出ていると相当しんどいはず。とはいえ、出ていると耳学問でいろいろと学ぶこともあるので、可能な限り出るとあとあと「限界に近かったけど出ていてよかった」と思うこともあるだろうし、そのあたりは自分の体力との相談かと……

そういえば以前書いた松本研究室の手引きという文書を発掘した。修士の2年間しか書いていないので、博士の3年間も書きたいのだが、結婚して夫婦で1年間奈良で暮らしたりしていて、あまり他の人の参考にならないのではないかと思って筆が止まっているのであった。

あと、研究はどういうふうにしたらいいか、という話も出る。こうしたらいい、という決定版はないし、人それぞれなのでなんとも言えないが、もしどこから始めたらいいか分からない、という人がいたら、以下のような感じで一度やってみるといいと思う (合わない場合は一度やってやめてもいいし)。

  1. ACL Anthology というのが自然言語処理における論文を集めたサイト (他の分野でも似たようなものがあるかもしれない) なので、このうち「ACL」「NAACL」「EMNLP」と書かれている3つの国際会議の過去3年以内の論文リストを見て、興味を持った論文を数個ピックアップする。(機械学習系の人なら NIPS とか ICML とか KDD)
  2. 興味を持った論文を読んで、ピンと来るものがあったら、その論文から参照されている論文のうち、まだ読んだことがない論文を数個(3本〜)選んで読んでみる。
  3. 興味を持った論文で読んでいないものがなくなったら終了。読んでいないものがあるなら、ステップ2に戻って繰り返す。

だいたい論文に書くくらいのテーマ1つなら、英語の論文100本読めばそのテーマに関する論文はほとんど読み尽くすし、100本読むとどの論文からも引用されている「根っこ」となるような論文がなにかも分かる (takuo-h くんは「人力 PageRank するんですね」と言っていたが、そのとおり) ので、研究論文がどういうものかはこれで掴めるのではないかな。

最初のステップ、上では自力で見つけることを前提にしているが、ここは自力でなくても先輩やらスタッフやらに「こういうことに興味があるんですけど」と話してみて、1本でもいいので論文を紹介してもらったら、2番目のステップ以降を自分でやればよいし、重要なのは1番目のステップではなく2-3番目のステップなので、全部自力でやろうとする必要はない。また、どんどん読んでいくと、最初スタートしたときはいまいちな論文からスタートしても、引用されている論文はだいたいいい論文をみんな引用するので、辿って読んで行くとどこかでいい論文に到達することができる。つまり、スタート地点で質の高い論文からスタートしなくてはいけないということはないので、テーマさえ外していなければ、気楽に選べばよい。

今年も研究室で論文の読み会が開催されると思うので、そういう機会を利用して一度体験してみるとよいと思う。