統計的機械翻訳を用いた第2言語学習者の作文誤り訂正

朝雹が降ったらしい (起きたのが遅いので遭遇しなかったが)。奈良市では初雪とのこと。道理で寒いと思った…… (寒くて何回か起きた)。

昼、機械翻訳勉強会。@tomo_wbくんが

  • Chris Brockett, William B. Dolan, and Michael Gamon. Correcting ESL Errors Using Phrasal SMT Techniques. COLING/ACL 2006.

を紹介してくれる。フレーズベースの統計的機械翻訳(SMT: Statistical Machine Translation)を使って英語学習者(ESL: English as a Second Language)の誤り訂正を行なう、という論文。いろいろと突っ込みたいところはあるが (そのうちいくつかは理由があってそうなっているのだろうが)、ネタとしてはいいのではないかと思う。
最近のこういう話としては

  • Huichao Xue and Rebecca Hwa. Syntax-Driven Machine Translation as a Model of ESL Revision. COLING-2010.

というのもあり、tree-to-tree のモデルなんかも試されていたりして、統計翻訳の最近の発展に伴っていろんな周辺分野が統計翻訳の恩恵を受けているのかも。

今日はひたすらメール書きとデバッグ。う〜む、それぞれなかなか時間を取られる。