学振totoとっとっと?

朝今日は暑くなるということで、洗濯してみる。晴れていたので太陽は直射できず……。

午前、[twitter:@neubig] さんと [twitter:@tomo_wb] くんと研究ミーティング。おもしろいネタ考えるな〜。そして @neubig さんは ACL のフルペーパーに引き続き、EMNLP も通ったらしい。まさに鬼神。

そういえば昨日の同窓会、じゃなくて松本研同期の結婚式で思い出したが、研究室の同期のもう1人、natali-a さんが WWW 2012 に research paper で通っているらしい (LinkedIn で知った)。彼女は結局松本研は D1 で退学してイスラエルに帰国したわけだが、がんばっているなぁと思う。「小町くんはこんなところにいて楽しいの?」と M1 のときに言われたのを思い出すなぁ。自分は都会を好きでもないし、そのときは情報系の研究にキャッチアップするだけでいっぱいいっぱいで、NAIST に引きこもって新しいことを知るのは楽しかったのだが、結局その後毎年1回くらいは外に出るようになったし、すでに奈良にずっといると病むことは見透かされていたのだろうか……。

朝来るとき、電車の中に忘れ物をしたことに気がつき、近鉄に電話。すでに電車は奈良駅に到着し、折り返し国際会館 (京都方面) に出発してしまったそうで、乗り入れしている京都市営地下鉄に電話してみてください、と番号を教えてくれる (とても丁寧)。そして教えられた番号にかけてみると、どうも烏丸の中央遺失物取扱所のようで、「今日ですか?それなら竹田にかけてください」とたらい回しにされる (かなりぞんざい)。結局竹田駅に電話したら普通に対応してもらい、無事荷物は竹田駅にあることが分かったのだが、当日の忘れ物は竹田に、翌日以降は烏丸に行くそうで。そういえば、以前も京都駅でお土産を忘れたとき、2週間経ったらもう駅にはなくて、京都警察署に運ばれていたっけな。当日に気がついて連絡してよかった。

午後、査読を片付ける。一つ終わるとまた一つ、一進一退の攻防を繰り広げているところである。

ふらっと学生室に行くと、学振の申請書の学内締切が今日だったようで、申請書の角をマジックで塗り潰しているところだった。なぜか紙で7部用意して角を塗らないといけないのだが、なんでなんだろう。紙で提出するのは百歩譲って許すにしても、角を塗るのは何のためなのだか……。

研究室で「学振toto」なるものがあるそうで、研究計画書を書いた6人のうち、誰が採用されるか当てるタスクのようである。3人がDC1、3人がDC2なので、確かに採択率だけからすると1-2人は通る計算だが、こればかりは確実に通るとも確実に落ちるとも言い難いので、なんとも言えないところである。学振に出す人みんな Dropbox で原稿を共有し、誰がどのようなものを書いているのか分かるそうだが、全員共有とは新しい。

夕方は言語教育勉強会。論文紹介は@tomo_wb くんが

  • Nagata, Ryo and Kakegawa, Jun-ichi and Sugimoto, Hiromi and Yabuta, Yukiko. 2008. Recognizing Noisy Romanized Japanese Words in Learner English. In Proceedings of the Third Workshop on Innovative Use of NLP for Building Educational Applications.

を紹介してくれる。日本人の書いた英作文に出現するローマ字を判定する、というタスクは新しいと思うが (中学生の作文では意味があるとも思う)、解き方は疑問が残る。松本先生の言うように、正解データが数千あるならSVMで二値分類器を学習するのと、教師なしにk=2のk-meansでクラスタリングするのとでは、前者のほうが明らかにベースラインとして適切だし、そもそも単語単位で文脈を見ないで判別しているのであれば、教師あり学習のアプローチなら、既存の日本語の辞書をルールベースでローマ字化するとか、あるいは kakasi でもなんでもいいのでローマ字化して学習データに追加できるわけで、提案手法との比較対象が弱すぎるのではなかろうか。

勉強会の論文紹介は、基本的にメジャーな会議のフルペーパーにしてほしいかなぁ。タスクや手法が自分のやっていることと関係なくても論文の書き方という点で参考になったりするし、どういうひとひねりをすれば優れた論文になるか、知ることができるし。どんな論文であっても、「ここはいかがなものか」というコメントを聞くのも参考になるので、反面教師にすることもできるが……。

進捗報告は[twitter:@keiskS] くん。前回からの差分について話してくれる。NL研のときにもらったコメントに対応すること、かな。英語の非ネイティブが英語のコーパスのタグ付けをするのは大変だし……。

夜、計算機係の方々に依頼したサーバの箱詰め作業に思ったより時間がかかったようで、21時近くまで残業。計算機係ではないM1の人たちも手伝ってくれたようで、ありがたい。これを一人でやることを考えると、本当に……。(元々の計画では一人でやりそうな感じだった)