今週後半はシンポジウムと基調講演が目白押し

午前中、今年のオープンキャンパスについて自分の仕事はなにか検討。研究室的にもいろいろ去年5月のオープンキャンパスを思い出すと朝から晩まで人が来るのでは、と思わなくはないのだが、この時期のオープンキャンパスだとすると去年3月のサイエンスフェスティバルのほうが近いのかもしれない。

ちなみに id:ny23 さんの日記、注釈付きデータ駆動の研究が辿り着くところで紹介されている、今週金曜午前中に早稲田で開かれる Chris Manning さんの講演、おもしろそうである。けっこう追記されている。というか、追記の部分が重要。

個人的には,上にも書いたように,注釈に責任を持つ人が注釈を修正する負担を少しでも減らすために(あるいは注釈を積極的に修正する気になるように),利用者と作成者が協力して注釈を洗練させていく(育てていく)枠組みが必要だと感じている.(良い喩えではないかもしれないが)スポーツでもルールは変わっていくものだし,本当にそのタスクのために良い解析モデルを作りたいのであれば,注釈付きデータの方も(解析モデルと同様に)真のゴールに向かって改善していくべきだ.それでも「注釈付きデータは固定して使わないと意味が無い」と言う人は,(再実装・再実験の手間を省いて)数字だけで効率よく論文が出したいだけの研究者としか思えない.

これには同感。ここしばらくまたタグづけ作業をしていて、コーパスを見たりタグづけツールでつけてみたりしているのだが (Tcl/Tk で書かれたツールのバグ取りしたりもね……)、コーパスはモデルとともに改善し続けないといけないものであり、手法(モデル)に関しての論文を書くためには実験設定を揃えるというのも大事かもしれないが、自然言語処理の研究者がやるべきは現実の問題に取り組むことであると思うし、コーパス(辞書)を固定してやりたい気持ちは分からないでもないが、そこで止まるとこの分野の存続が危ぶまれるのではないか、と思っている。(コーパスでも辞書でもなくていいが、なんらかの形で積み重ねていけるもの)

そうそう、自分もこの基調講演が開催される会議に参加予定。高田馬場なので実家に泊まるか根津に泊まるか微妙なところだが、今回は根津だろうな〜。木曜日は午前中のみ(Diana McCarthy さんの講演を聞く)、金曜日は全日参加するつもり。元々のタイトルは "Holistic models of linguistic structure: Discriminative joint models and domain adaptation" だったのだが、現在原稿が上がっている "Part-of-Speech Tagging From 97% to 100%: Is It Time for Some Linguistics?" のほうがおもしろそうなタイトルに聞こえる。タイトル一つで印象違うなぁ、と思った。

これから参加登録されようという方は こちらの聴講・引率事前申し込みから登録するとよいようだ。元々は参加費が45,000円と聞いて二の足を踏んでいたのだが、聴講のみの場合のディスカウントで5,000円だけ払えばいいことになったので、助かった。上記のページの案内書も文章が洒落ている。

  • 所属なし・個人としての参加:無料
  • 学生・大学院生:無料とします。ただし、初日朝の会場への誘導・質疑の際のマイク持ち・ランチ会場への誘導・飲み物の用意・ポスター用パネルの設置・机や椅子の移動と原状復帰など、可能な範囲で学会運営にご協力ください。発表・講演の聴講に支障が生じるような依頼は原則として行いません。
  • 大学教員:10,000 円。ただし、部分的な参加などの理由で 5,000 円の割引でも結構です。専任職がない、今年度の予算を使い切ったなど、事情に応じて免除します。すべて自己申告です。
  • 企業関係者:20,000 円。ただし、特定の日だけ参加という場合は一日当たり 5,000 円とすることもできます。経費で処理できない場合、個人として参加するということであれば無料とします。
  • 決済・領収書:原則として当日。ただし、経理処理の都合で早めに領収書が必要な場合はご相談ください。なお、国際会議(中南米モード)で運営していますので、必要事項を記入した用紙に主催者のサインといった比較的簡便な領収書を予定しています。

あと今週水曜日は第5回「機械翻訳技術のイノベーション」シンポジウムもちょっと顔を出す予定。今回は日中翻訳に関する成果報告会メインのようだが、日中翻訳は最近 Yahoo! JAPAN 研究所とかなんだとか、いろいろとホットになりつつある分野であるし、漢字という共通の文化を介した手法も考えられたり (もっと言うと中国語の母語話者が日本語を学習するときのバイアスについて興味があったり)、今年は NTCIR-9 の中英・日英・英日特許翻訳タスクNAIST チームで参加する予定だし、勉強のつもり。