質より量、量こそ質

朝来て講義資料の印刷。学外からもアクセスできるところに講義資料を移そうと思ったのだが、Apache の設定が簡単ではなかったので断念。夏休みの課題かな……。

今日の講義はようやく前半が終わり、次回は中間試験。授業を14回 (+1回の試験) しないといけないようで、今日が7回目だったので、ちょうど半分である。始まる前はどうなることかと思ったが、今のところは持ちこたえている感じ。

昼は科研費の報告書作成。4ページ書けばいいだけなのだが、Wordのフォーマットしかないので、やたらと面倒くさい。2段組なのだが、段組をまたいで図表を入れるのはどうやれば……(体裁を変えるなと書いてあるので、やっていいかどうかも分からない)。これを研究費の最終年度の度に書くのはしんどいな。科研費の若手 (B) というの、申請時に支給期間を2年から4年まで自分で選べるのだが、助教1年目のときは3年後に大学で研究を続けているかどうか分からなかったため、2年間で申請していたのである。今後3年間は大学にいるだろうから、次の研究費は最低3年で申請したい。

午後に委員会関係の仕事で同僚と雑談。首都大ではいかなる研究費を使おうが学生が研究発表してはいけない (あくまで研究するのは教員) ことになっているそうで、人文系の文化が強くこうなっているとかなんだとか。もっと学生本位にしたほうがいいと思うのだけどな〜。(学振もらっている学生はどうなるんだろうか?)

(2013-06-01 追記) 学生は研究発表してはいけないけど、情報収集するのはよいので、論文がアクセプトされたのに学生が国際会議等に参加できない、などというわけではありません。単に書類をどう書くかという問題なだけで……。(秘書の人がいたら全く意識しないでも勝手に作文してくれるような書類で、首都大だとほとんどの教員が秘書を持たないので、自分で作文する必要があるから意識しなければならないこと)

ACL 2013 の採択論文リストに short papers が追加されたようだ。我々の発表は以下。

使っているリソースはほぼ同じで、対象も同じ動詞、タスクが誤り訂正なのか問題生成なのか、という違いである。結論も同じで、大規模な学習者コーパスを使うとけっこう効果がある、という話であり、どういう設定で大規模な学習者コーパスが有効か、というのはかなり分かってきたと思う。効果がないタスクもあるし、最近使っている Lang-8 のようにウェブから抽出したコーパスはクリーニングも必要なのだが、専門家が作った小規模コーパスより、素人でも大規模に作ったコーパスのほうが有効なタスクがいろいろあるのだ。

夜に電話会議。前も書いたかもしれないが、ソースコードの共有とバグ追跡システムを導入するとだいぶ捗る。論文を書くときもバグ追跡システムみたいなものがあるとよいのだが……(どれを直してどれを直していなくて、どこはどうしたのかが分かるので)