研究の新規性と独創性

id:ny23 さんの 機械学習×MapReduceが参考になる。

自分の中で一昨年から今年の春くらいまで、自然言語処理アルゴリズムを並列分散化するというテーマがブームだったが、夏休みを経てだいぶ熱が薄れてしまった。上記エントリでもまとめられているように、大規模データで回したければ単純にデータを分割して各繰り返しごとに平均化すればよいという話が実用上は使い勝手がよいだろうし、実データでは学習より素性抽出のほうが遥かに遅かったりするので学習の重さはあまり関係なかったり (ny23 さんも書かれているように、そこも並列化しないといけない)。

あと、@kashi_pong さんの研究に対するスタンスとも通じるところがあるが、追記部分に激しく同意。

これだけ色々な学会で発表されるほど流行るとフォローするのも大変だろうな.個人的には,人がわんさか集まってるトピックだと,自分がちょっと考えて思いつくようなことは既に他のグループも並列してやっていることが多いので,われ先に,とやらないと新規性がすぐ無くなってしまうのであんまりやる気がしない.
今後の展開を予測して最初の一手をつけるか(大抵,その最初の一手で問題の最も面白く重要な部分は解けてしまう),人が寄り付かなくなった砂漠で(出るか分からない水を求めて)井戸を掘るような仕事の方が好みだ.

最近研究費の申請シーズンだったり未踏(ユース)の〆切だったりして、他の人が書いた研究(開発)計画書を見たりする。その中でも「新規性や独創性について書け」と書いてあったりするのだが、新規性と独創性というのは微妙に違って、研究には新規性が必ず必要なのだが、誰もやっていないから新規性がある、という筋で論文を書こうとすると、人が集中している(流行っている)トピックでは早い者勝ちになってしまう。「こんなやり方(切り口)・テーマは誰も思いつかなかった」というような内容だと、他に競う人がいないのでじっくり取り組める。あまり急かされて行動するのは苦手なので、人が集中するようなトピックはなるべく避けるスタイルのほうが好みだな〜。