8時間で作る前置詞誤り訂正器

スプリングセミナー2日目。例年10時ごろから開始している気がするのだが、今回は送迎バスの関係で9:20開始。

午前中は演習の続き。とはいえ、自分はオープンキャンパスの準備。ChaKi.NET をインストールしたり。iPad で動くデモを作ろうという話が前回のオープンキャンパスで出ていたが、何もしていなかったので前回と同じ感じで。

昼は懇親会。受講生の方々と交流する。女性陣がそれぞれ別々の場所でぽつーんと手持ち無沙汰で壁の花状態になっていたので、順繰りに話しかけてみたり (たぶん受講生の女性陣ほぼ全員と話した気がする)。話してみるとみなさん素直でいい人たちで、知り合いになったら楽しいだろうに、もったいない。男性陣は受講生同士話し合って盛り上がっていたりするのだが、異性に話しかけるのはハードルが高いのだろうか……。

午後も演習の続き。あまり自分がいるとやりにくいかと思い、TA のお2人にお任せする。@keiskS くんの記録を見ると、楽しくやっていた (協力: 松本研まずいジュース部の方々) ようで、なにより (笑)

夕方は英作文の前置詞誤り訂正の成果報告会。演習に使える時間が6時間程度なので、どこまでできるか不透明だったが、4人に実験の成果を報告してもらったところ、4人とも全然違う素性を試してくれて、大変おもしろかった。いちばん精度がよかったシステムは、学習者がどの前置詞を書いたのか、ということだけを素性に使ったシステムで、yu-s くんが作った表記と品詞の N-gram ベースのシステムより精度がよく、びっくり。N-gram の素性も含めいろいろ試してみて、いちばん結果がよかったシステムを報告してくれたのだが、こんな短時間でそれぞれの特徴があるシステムが作れるというのはすごいなぁ。

ちなみに他の人たちの戦略は、品詞 N-gram を使った人と、人手でルール相当のものを書いた人と、あとは前置詞の前の動詞・後ろの名詞のペアや距離を使った人、といった感じ。ちょっと時間が短かったので、2泊3日でやってもよかったかもしれない (笑)

スプリングセミナー終了後、オープンキャンパスの準備。一応大体終わった……かな。

夜は西大寺で松本研の受験を考えている人とご飯。駅前はどこも送別会シーズンなのか金曜日のせいか混んでいたので、ならファミリーのコリアンダイニングへ。お腹いっぱいになる。

自分はあまり受験生を増やさないよう中立でいたいのだが、結局松本研の宣伝になってしまった (汗) 他の選択肢 (研究室なり大学なり、あるいは大学に来ないことも含めて) も検討してもらえるよう、時間を取って話せる人には他の選択肢もサジェストしようとするのだが、人によっては「それならうちに来た方がいい」と言わざるを得ない人がいるし、他のところは勧めようがない場合もあるしな〜(たとえば学部は文科系出身だけど大学院では自然言語処理をやりたい、というような人は、ほとんど松本研しか選択肢がないように思う)

今年の受験生は3月のオープンキャンパスにしろ5月のオープンキャンパスにしろ、実際に NAIST に来てみて、在籍している学生と話したり、スタッフと話したりしてみて、自分に合ってそうかどうか判断してもらえるとよいかなと思う。(NAIST は本当に向き不向きがある大学だと思うし、向いている人はとても生き生きする一方、向かない人は引きこもってしまうので、入試を受ける前に一度来てみたほうがよい。2年間は通うことになる環境なので、数万円かかるとしても妥当な出費だと思う。)