共同研究も本気で取り組むと楽しい

最近は毎日快晴で気持ちがいい。ちょうどいい気候なので、朝妻が伏見桃山城まで散歩に行ったりしているそうだが、自分も早寝早起きして運動しようかな。

朝、アルバイト説明会。松本研では年に片手〜両手で数えられるくらいの (主に単発) アルバイトがあるのだが、今回は長期もありということで、留学生の人たちも応募してくれて、活気があっていいことである。留学生の場合、労働許可証的なものが必要であるところが注意点だが、研究に関係あるアルバイトなら、いろいろ学べることも多いしね。

午前中は来月のオープンキャンパスの準備をしたり、広報部会のお仕事をしたり。秋のオープンキャンパスは一般向けで、子どもでも分かるようなデモを中心に研究を紹介するイベントである。今年は山中さんのノーベル賞効果で来客者数が増えるかもしれないし (数年前、NAISTが研究力1位という報道があったときは、明らかに来場者が増えた)、忙しいかもな〜。ちなみに今回は受験生向けのイベントではないので (たとえば松本先生は今回出張でいらっしゃらない)、受験を検討している方は、3月あるいは5月のオープンキャンパスにお越しになることをお勧めする。

お昼、[twitter:@kevinduh] さんと[twitter:@neubig] さんとランチに行き、学食で石原都知事のニュースを見て、日本人はそんなに政治の話題が好きじゃないね、という話になる。確かにあまり政治に期待していないせいかもしれないが、ほとんど喋らないなぁ。アメリカで、というか Microsoft Research にいたときは、ランチの話題でたびたび (アメリカの) 政治の話が出てきて、全然ついていかれず面食らったのを思い出した。Apple にいたときは逆に政治の話題を聞いた記憶がないので、自分としてはたいそう居心地がよかったのだが、同じ西海岸でも地域性があるのかな。

午後は機械翻訳勉強会。miao-yさんがスライドで

  • Lee et al. Detection of Non-native Sentences using Machine-translated Training Data. NAACL HLT 2007.

を紹介してくれる。機械翻訳の応用先を探していたらしいが、個人的にはタスク自体に興味があり、紹介してもらってありがたい。タスクと着眼点は、なるほどなと思った。たとえば機械翻訳された文か人手で翻訳した文かを判別するような、識別的言語モデルの研究がこのあと流行るが、ちょっと早かったかも (言語モデルで生成した擬似負例を使ったりするのが翌年あたりに出てきたような?)。手法や用いたデータはいろいろと改善の余地があり、そういうところが short paper たるゆえんだと思うが、ちゃんと実験すればフルペーパーになったんじゃないかなぁ。データを増やしたときどうなるかとか、人間はこのタスクがどれくらいできるかとか、興味がある。

夕方は北京と電話会議。いろいろと進捗があっておもしろい。議論も刺激的で、この共同研究はやってよかったなと思う。お互いそれなりに時間を割いて、アイデアを出したり手を動かしたりしながらでないと、なかなかうまく行かないなと思ったりする。共同研究を維持するのが共同研究の目的になってしまうとしんどくて、研究をやりたいテーマがあって、お互い出せるものを出し合って、定期的に連絡を取る、というのがいいのかな。

夜は査読。もっと早く終わる予定だったのだが、参考文献を全部チェックしていたら意外に時間がかかった。コメントもA4で4ページぶんくらい書いたが、これくらいの勢いで書かないといけない原稿があるんだった……(汗) 時間取れずに申し訳ないです>各位。。。