友人が遠くから来る楽しいね

妻がいない生活も5日目の今日で終わりだが、娘を21時に寝かせると自分は3-4時に起きるので、寒くない季節の場合はこれがベストかもしれない。(保育園にも8時半前後に着いて、10時前に出勤できる。いつもは保育園に9時前後に着いて、10時半出勤)

本日は Duolingo の [twitter:@mhagiwara] さんに「Duolingo の大規模データからの導き出された効率的な言語習得法」というトークをお願いしていた。当日の中継もあるが、発表資料 (PDF) を公開してくださったので、そちらをご覧になるとよいだろう。

自分自身、最近は博士後期課程の学生以外(あるいは博士後期課程に進学したいといって大学院からうちの研究室に問い合わせてくる学部生以外)あまりやりたいという学生がいないが、自然言語処理による言語学習・言語教育支援の研究をしているので、現在世界中で1億5,000万ユーザが登録している言語学習アプリである Duolingo のお話はとても楽しみであった。もちろん、@mhagiwara さんは旧知の間柄であり、最近どのようなことに興味を持たれているのかということにも関心がある。同時代に日本で自然言語処理の博士号を取得した人の1人で、博士のための「けものみち」就職活動ガイドを書かれたり、一つのロールモデルになっていると思っている。

トーク本体は期待通りとてもおもしろい話で、質疑応答が10件以上続いたくらい活発な議論があり(学内からの参加が30人くらい、学外からの参加が10人くらいの合計40〜50人くらいの参加)、お招きしてよかった。特に日野キャンパスは都心に少し遠いので、こうやって学外の研究者の方々に話していただけると学生たちの刺激にもなると思っている(都心に出ていくのは他の地域と比べるとそこまで大変ではないはずだが)。

中身に関しては ACL 2016 の以下の話が興味深い。

  • A Trainable Spaced Repetition Model for Language Learning. B. Settles and B. Meeder (2016). Proceedings of the Association for Computational Linguistics (ACL).

文法誤りの自動訂正の研究をしていても、結局文法を自動で訂正してしまうと書いている本人の言語能力が向上しないので、適切なタイミングで適当な負荷をかけるのが大事だ、という話があり、訂正の精度が高くなったというのが本当に意味のあることなのかどうか、ということを常に意識する必要がある。この研究は、実際に学習者が言語を習得するプロセスに焦点を当て、学習者がどのような形で忘れていくのか、ということをモデル化して、忘れないようなタイミングで負荷をかける(もう習得した内容は何度もテストしたりしない)、ということに取り組んでいるそうである。実際は A/B テストをしていて、これらのシステム変更をしたらどれくらいユーザの挫折率が下がったか、みたいなことを測定して改善につなげているわけだが、まさしくこういう分野にこそ自然言語処理機械学習は貢献できるわけだし、かなり効果があったと聞くと(自分はその仕事をしていなくても)嬉しいものである。

言語学習の文脈では、今年の言語処理学会年次大会で甲南大の永田さんが「内文法状態推定」と呼んでいたが、学習者の言語能力というのが隠れた状態となっていて、語学能力の試験のスコアだとか個々の文法誤りだとかはそこから確率的に生成されるものであって、知りたいのはリーディングやライティングのスコアや語彙数や文法誤りの箇所ではなく、学習者の言語能力そのもの(そして、その能力をどのようにしたら効率的に上げられるか)ではないか、と思っている(もちろん、試験のスコアと相関はあるだろうし、時間によっても変動するので難しいが)。そのためには、モチベーションをいかに保つか、システムをどのようなインタフェースにするべきか、どう評価すればいいか、のような、典型的な自然言語処理では扱いにくいが、しかし実際に役に立つものにしようと思うと避けて通れない課題に対処しないといけない。Duolingo のような巨大なユーザベースをもつ企業でこそできる研究、というのが確実にあると思うので、今後の展開に大いに期待したい。

トークのあと、お昼は研究室前のエレベータホールを使って立食形式の懇親会(手配は「行事係」という係の学生にお願いしている)。研究室インターンシップでうちの研究室に今学期来ている学部3年生と、今年の10月からうちの研究室の博士後期課程に加わった留学生の歓迎会も兼ねているが、保育園の送り迎えをしている関係でなかなかディナーは参加できないのだが、ご飯を食べながら少し雑談する、というのはとても重要なことだと思うので(Microsoft Research にいたときも、世界中から研究者が来ていて、ときどきランチを一緒させてもらったのはありがたいと思っていた)、可能な限りこういう機会を設けたいと思っている。

ランチのあとは @mhagiwara さんにうちの学生と1:1ミーティング(実際は1:2ミーティングになったが)をお願いする。これも、Microsoft Research では、研究者が来ると希望する学生と1:1ミーティングを設定して研究の紹介や相談に乗ってもらったりしていたので、それをならって設定しているものである。NAIST で学生をしていたときは自分が世界中に出かけていって話を聞いていたが、教員になってからは世界中から奈良に来てもらうのが自分の仕事だと思っていたし、いまは首都大にいろんな人に来てもらってうちの学生たちに刺激を与えてもらいたいと思っている。もちろん、学生もインターンシップやアルバイトなどで外に積極的に出てほしいと思っているが、外に出てみて「これは意外と研究室の研究水準は高いのではなかろうか」と感じてもらうのも狙いの一つであり、そう考えてもらえるような環境にしたいと思っている。もちろん「こんなレベルでやってても意味がないので、早く就職したい」と思う人もいるだろうし、それはそれで正しい判断だと思う(特に開発に関しては)。

夕方は妻を迎えに行こうと思ったら、吉祥寺からタクシーで帰ってきた。2,000円くらいだったようで、家族で吉祥寺に行くときは、バスまたは車と電車を乗り継いで行くより、タクシーで行った方がいいんじゃないか? と思ったりする。(子どもがバスに乗っていても安心な年齢になったら、バスで行くのがもっとも安いし、15〜20分に1本あるので不便でもないのだけど)