午前中、電話会議。しばらく時間が開いてしまったが、やはり共同研究は定期的にミーティングしたほうがいいように思う。データをいただいたり、タスクや手法の問題点を共有したりなど。
昼から学生の中間発表。いつも松本研の学生の人の発表にたくさんコメントをくださる [twitter:@keyakkie] さんの質問力を見習いたい。「学内にいながらにして最先端の自然言語処理の話が聞けて嬉しいです」と言ってくださって、ありがたいことである。大講義室 (100人以上入る) より小講義室 (最大40人くらい?) のほうが QA タイムが活発なように思うのだが、いっそのこと全部小講義室でやってもいいんじゃないのかなぁ (3部屋全部使わないといけないときとか、あるいは他の部屋が埋まっているときは仕方ないと思うのだけど)。学会発表を模するという意味では確かに大講義室のほうがよいのだが、それよりは学生の間から次々に質問なりコメントなりが出てくれる方が発表者にとっても質問者にとっても教育的効果は高いのではないかと思う。
勉強会に出る時間もなくひたすら原稿執筆 (14日〆切)。なんとか完了。
自分は割と楽観的だったのだが、ニーメラーの「[http://ja.wikipedia.org/wiki/%E5%BD%BC%E3%82%89%E3%81%8C%E6%9C%80%E5%88%9D%E5%85%B1%E7%94%A3%E4%B8%BB%E7%BE%A9%E8%80%85%E3%82%92%E6%94%BB%E6%92%83%E3%81%97%E3%81%9F%E3%81%A8%E3%81%8D:title=彼らが共産主義者を攻撃したとき]」を思い起こす。
彼らが最初共産主義者を攻撃したとき、私は声をあげなかった、(ナチの連中が共産主義者を攻撃したとき、私は声をあげなかった、)
私は共産主義者ではなかったから。社会民主主義者が牢獄に入れられたとき、私は声をあげなかった、
私は社会民主主義ではなかったから。彼らが労働組合員たちを攻撃したとき、私は声をあげなかった、
私は労働組合員ではなかったから。////////////////////////////////////////////////////
彼らがユダヤ人たちを連れて行ったとき、私は声をあげなかった、
私はユダヤ人などではなかったから。
////////////////////////////////////////////////////
そして、彼らが私を攻撃したとき、
私のために声をあげる者は、誰一人残っていなかった。
夜は言語教育勉強会。thichinh-t さんが
- Shane Bergsma, Dekang Lin, Randy Goebel. Web-Scale N-gram Models for Lexical Disambiguation. IJCAI 2009.
を紹介してくれる。ウェブから抽出した N-gram ベースの言語モデルの話で、普通に生成モデルとして使う話と、識別的言語モデルとして使う話とを比較していて、識別的言語モデルがいちばん精度がよかったが、生成モデルでも工夫して使えば識別モデルに迫るくらいの精度が出せますよ、という話。タスクとしては英語学習者の作文でよくある前置詞選択の問題と、文脈依存のスペル訂正と、そして代名詞が指示先を持つか否か (It is promising. のように指し先がある it と、It is important to know … のように形式的に用いられている it を区別する) という3つの問題で評価している。識別モデルもあまり凝ったことはしていなくて、訓練データ周辺のターゲットとなる単語周辺の N-gram をそのまま使うだけだし、生成モデルも単に頻度をカウントして使っているだけ (スムージングの問題があるが、Google N-gram だから単純なスムージングで問題ない?)。ただ、いろんな性質の異なるタスクでちゃんと比較しているところが「落とされにくい」論文だと思う。長所としては、シンプルだから他の人も簡単に実装できる、というところかな。Chantokun に組み込んで試してもらいたいところである。
論文紹介のあとは yu-s くんが進捗報告 (発表練習)。10分間の発表練習だし、すぐ終わるかと思いきや、けっこう議論になる。発表練習の場合、発表者がちゃんとスライドを事前に印刷して持ってきてくれていたら、細かいコメント (で参加者で共有しなくてもよいと思われるもの) は書き込んで発表者に渡したほうがよいのでは? どこまでを共有すべきでどこからは個別でよいかは悩ましい問題だが、あらゆるコメントを全員が共有する必要はないんじゃないかなぁ。(まあ、コメントを聞くことによって学ぶこともあるので、多めにコメントがあるのは、全くないよりはよいと思うのだが……)
あと、yu-s くんの発表はそうではなかったのだが、いつも2ページ目に目次を入れる人が後を絶たない。15分以下の発表なら、2ページ目に目次は必要ないような。どうしても目次を入れたいなら、最初の数ページで背景と問題設定まで説明したあとで、そこから後ろの構成を説明する目的で入れるのはありかと思うが……。