研究ネタにきっちりと片を付ける

人工知能学会に投稿していた2本のうち、1本はすでに採択通知をもらっていたのだが、もう1本の採択通知をもらう。これで NAIST に来てからの仕事は人工知能学会論文誌x3、言語処理学会論文誌(「自然言語処理」)x1で、一応論文誌にできるくらいまで研究したネタは全部成仏してくれたことになる。

振り返ってみると、国内の全国大会や国際ワークショップで終わってしまってそこから先に進まなかった研究ネタもあるのだが、やはり論文誌にまでして一段落かなーと思う。(だいぶ前京大の森さんから「論文誌まで書いて一仕事」と言われたのはよく分かる) 

とはいえ、工学、特に情報系は、論文誌はしばしば査読に時間がかかるので、国際会議に投稿された論文(プロシーディングス)も論文誌と同じくらいの仕事に扱われることもある(もちろん国際ワークショップでお茶を濁すのではなく、トップ国際会議でないといけないけど)ので、やはり「いい研究」というものを続けているべきなんだなーと思う。(要はバランスよく)

あと、O 野原くんの機械学習の多値分類問題におけるトーナメントモデルに関する解説記事を見て、自分も修士のころトーナメントモデル(※多値分類のと意味少し違うので注意)を用いた述語項構造解析というものに取り組んでいたのだが、こういう理論的背景についてはよく分からずやっていたので、参考になる(上に挙げた論文誌の一つは修士のときの仕事である)。トーナメントモデルは述語項構造解析だけでなく、元々は ryu-i さんが照応・省略解析に使っていたものだが、masakazu-i くんは依存構造解析に使っていたし、経験的には計算時間を削減しつつうまくいくヒューリスティックだったわけだが、もしかすると理論的にもそこそこうまく行くことが言えるのかもしれないと思った。

実は私もこの問題は1年前からいろいろ、特に言語モデル周りでやっていたのですが、モタモタしている間に今年の間に一気にいろいろとでてきてしまいました。
[...]
どの論文も解析(二値分類の問題に還元したときにどの程度達成可能な精度より悪くなるか)がたくさんされていて、このへんの技はもっていないので勉強になります。

トーナメントモデルの他にも、「昔試したことがあるあれは、経験的にはそこそこうまく動くことが分かっているが、考えてみると理論的には(こういう)背景があるんではないか」みたいなネタはいくつかあるのだが、その「こういう」の部分はしっかり勉強していないと分からないし、このへんの技は自分も身につけたほうがいいように思った。(実は自分の博士論文のテーマのそんなふうなストーリー)

これらは実際に実装は簡単で、すでにいろいろと使わせてもらってます。

トーナメントモデルも修士で入学したてのころは「えー、そんなの実装したら2年かかったりするんじゃないか」と思っていたが、書いてみるとすごく簡単(コードの量的には十行-数十行くらい?)で、こういう実装が簡単なアルゴリズムで、理論的に上限や落とし穴が分かっていれば、けっこう使いやすいのではないかと思う。

あと、最後に

しかし、研究はよっぽど思いつかない問題でやるかチームでやらないとなかなか先取りできないなぁ・・

とあるのだが、研究を先取りするのも大変ですなぁ……。