第二言語の学習段階に応じて誤り方も変わってくる

午前中から午後にかけて、木曜日の打ち合わせのための資料作り。けっこう考えなければならないところがある。

夕方、[http://clt.mq.edu.au/research/projects/hoo/hoo2012/:title=英語誤り訂正タスク]の進捗報告。3月はいろいろとばたばたしそうだし、2月にある程度見通しが立っているといいのだけどな〜。既存の手法にどういう問題点があり、それをどう解決するか、というストーリーが立っていると、だいぶ進めやすい (実験してみて予想と違う、ということはありうるが、それは実験してみるしかない) のだが、なかなか……

まあ、コーパスに存在するいろいろな誤り (←学習者の書いた作文誤り、という意味ではなく、コーパスをリリースするときの自動変換プログラムに存在したバグによって混入してしまった誤り) をがんばって検出しているという意味では、現時点では間違いなく NAIST がトップだと思う (汗)

夜、NAIST 誤用コーパスアノテーションミーティング。「吝嗇」という単語を使う日本語学習者がいたのだが、中上級者になってくると、辞書を引いてこういう難しそうな単語を使いたがる傾向があるらしい。逆に、初心者のほうが語彙が限られているので、なにが書きたいのか想定しやすい、と。なるほどなぁ、レベルによって見るべきポイントも違うんだなぁ、と納得。ちなみにこの単語、「りんしょく」と読んで「さもしい」とか「けち」とかいう意味なのだが、日本語母語話者でも知らない人は多いのでは……。

ミーティングが終わったらもう22時半。時間の経つのはあっという間だ。