午前中ミーティングのつもりだったがキャンセルだったので、代わりに本のレビュー。一応これで最初から最後まで1.5回見たことになる。残りの0.5回は時間的に厳しいだろうな……
来年の NLP 若手の会シンポジウムに関する問い合わせがちらほら。少しずつ動き出しているところ。
昼電話があり、14日に急遽東京にいなければならないことに。バンコクの様子も不安定なので、思い切ってバンコクを経由しない便に変更する。キャンセル料が35,000円かかるが、帰りを関空着から成田着にしたのと (しなかったら結局関空から東京まで移動しないといけない)、元々のチケット代が1万円強安くなったので、丸々損をしたわけではない。本当は帰りにシンガポールでストップオーバーしてシンガポール国立大の S 山さんのところに半日お邪魔する計画だったのだが、ドタキャンになって申し訳ない……。
午後、国際会議のスライドの添削が一段落したので査読をしようかと思っていたが、昼ご飯も食べられないくらいだったので、代わりにおやつを食べながら研究室で CMU の金出先生の特別講演 (講義室の中継が研究室のテレビで見られる。そもそも満員御礼のようだし……)。うんうん唸って研究していると、あるとき神様が「お前はがんばった」と門を開いてくれることがある、という話が印象的だった。他の話も綜合してまとめると、「手法ありきで研究してはいけない。優れた研究は、必ず問題からスタートする。この手法はうまくいく、という先入観を捨てることが大事」ということかな (最近聞いた他の話とごっちゃになっているかもしれないが)。
自分としては「少しでも研究に興味がある人,面白いテーマを探している人は「研究に必要なたったN個の事」とかいう記事を読まずに今すぐに"How to do good research, get it published in SIGKDD and get it cited!"を読むべき」を見て、内容に興味が出て KDD のチュートリアルスライド (相当長大) を見てみたのだが、ここで和訳されているのは実はごく一部で、和訳されていないところ (論文の書き方) がとても参考になった。「あなたが数時間かけて図や表を分かりやすくして、査読者の時間を1分節約することができるなら、それはするべきか? →当然」とかいう話が、実例と根拠とともに書いてある。表を分かりやすくする方法なんかは、なぜかオレオレ略語 (オレオレじゃなくても略語を未定義で) を使いたがる人に100回読ませたい。
夕方から言語教育勉強会。今日は九州からいつも Skype 参加してくださっている hiromi-o さんの他に、hiromi-o さんが教えている学生さんたち3人も遠隔参加。すごい人数になっている (笑)
論文紹介は takuya-fu くんが
- Alla Rozovskaya, Dan Roth. Generating Confusion Sets for Context-Sensitive Error Correction. EMNLP 2010.
を紹介してくれる。話は単純で、文脈依存の誤り訂正のために、どの単語をどの単語に間違えるのか、という混同確率の表 (confusion matrix と呼ばれる) を獲得するのは誤り訂正の基本なのだが、誤り箇所がタグづけされた学習者コーパスを用いて分類器を学習者の母語別に作ると誤り訂正の精度が上がります、という話。それはそうですね、という話なのだが、ちゃんと実験もしてあって納得度は高い。応用を考えると、変に手法に凝る必要はないので、こういう潰すべき問題を一つ一つ潰していくことが大事なんだなと思う。
進捗報告は [twitter:@keiskS] くんと [twitter:@mrcarrot] くんが、最近考えている研究テーマについて話してくれる。タスクに力点を置くか手法に力点を置くかで微妙に違うのだが、こうやって解きたい問題と解くための手法を両方自ら考えて試行錯誤するというのはすばらしい (もっと言うと、自分たちでチームを組んで議論しているところもさすが)。しばらく生暖かく見守ろう。
しかし今回の (今回も?) 勉強会は白熱し、終わったのは22時半……(始まったのも19時だが) 来年はこんなに遅くまではできないだろうなぁ。それだけが気がかり。(あるいは、自分もリモート参加にするとか……?)