金曜日の午前中は今日から毎週パターン認識と機械学習の授業(の機械学習部分)。1回目は実験に関する色々なことを話すことにしている。というのも、この授業で話さないと「訓練データ、開発データ、テストデータ」というような概念すら知らないまま修士を出てしまうことがあるようで、訓練データでテストして「精度99%!」というような残念な感じの記事を書いたりしないためにも(そもそもモデルが正しく学習できているかどうかを測るために、意図的に訓練データでテストすることはあるが)、ちゃんと紹介する必要があると思うのだ。
お昼から受験希望者の見学。実は今年度、冬季入試に関する(博士前期課程の)受験は物理的スペースの問題から全て(見学も)お断りしていたのだが、博士前期課程の定員がないなら研究生でもいい(ただし、研究生の場合は座席の保証はない)、という人に限り、見学もしてもらっているのである。博士前期課程の受験(研究生含む)の問い合わせは本当に今年は多く、3桁行くか?と思うくらいだったが、ちゃんとカウントしたら50人くらいだったので、倍に盛っていた。
とはいうものの、そもそも外部から受け入れられる人数は多くても毎年3人くらいなので、50人が受けたら10倍を超えるし(というか、そもそもうちの大学院の定員が情報科学は35人しかないし)、とても全員を(見学希望ですら)受け入れることはできないので、来年度から研究生希望者は研究計画書で選抜しようかなぁ、と思ったりする。すでに TOEIC スコア700点ない人は研究生を断っているが、英語試験のスコアだけだと今年は20人くらい研究生を受け入れないといけないので、社会人経験がない場合は博士後期課程の進学希望かどうかを聞いて、進学希望でない人の場合はお断りしている(これでも、来年4月からの研究生が2名、来年10月からの研究生が2名該当し、今のところそれらの人は受け入れ予定である)。
結局受験問い合わせのうち8-9割は中国人留学生で、修士号を取りたい(日本人の)学生を優先するか、博士号を取りたい(中国人の)学生を優先するか、というような問題になってくるのだが、アメリカが世界中から優秀な留学生を集めていることを考えると(アメリカ人はほとんどコンピュータサイエンスの博士課程には進学しないし)、日本でも(防衛大学校のような組織は別だろうが)特に国籍で判断する合理性はなく、日本語も英語も使える優秀な学生が来てくれるなら、自分は特に日本人を優遇するつもりはないのだが……。(修士号を取ったらすぐ就職したい留学生は、特に気兼ねなくお断りしているので、そこには自分も非対称性があるのだが)