教師なし機械翻訳とは何か

お昼から受験生の相談に乗る。来る前に隠れマルコフモデルだとか自然言語処理の基礎を勉強したり、うちの研究室の既発表論文を見たりしているそうで、かなり好印象だったのだが、併願先を聞いたら他大学のモバイルネットワークの研究室だそうで、しかも自然言語処理の研究室はうちしか調べていないと聞いて、大きく落胆する。

うちの研究室はそもそも内部進学者だけでも人数がいっぱいで、外部受験生はどうしても自然言語処理の研究がしたい、かつうちに来るそれなりの理由がある人に限定していて、他の分野でもいい人は他の分野に行ってほしい、と学生募集のページにはっきり書いてあるので、自然言語処理以外でもいい人は受験目的の見学は断りたい。自然言語処理にしようかどうか迷っていて見学によって行くかどうか判断したい、というような人がいることは重々承知しているが、そういう人にまで見学をしてもらうほどの余力は、少なくともうちの研究室にはない。(どうしても自然言語処理がしたい、という人だけで、定員を大きく超える希望者がいるので、そういう人を押しのけてまで、優秀ではあるが特に自然言語処理でなくてもお人にうちで自然言語処理の研究をしてもらいたいわけではないのである)

午後は進捗報告を聞く。基本的には機械翻訳のグループなのだが、タイミングの問題で学振の話を聞いたりして、いろいろ考える。教師なしニューラル機械翻訳(とそれに付随する教師なし対訳辞書構築)のあたり、明らかなるレッドオーシャンなのであるが、どうも自分が過去に取り組んできた研究と近い気がするので、一度整理して考えてみたい。教師なし学習は機械翻訳に魔法をかけるか?というブログ記事が分かりやすくてよいが、結局これうまく行くケースは限られていて、なんとか少しでも見られる結果にするためにはたくさんのヒューリスティックスが必要で、それらのヒューリスティックスはなぜ必要か、というあたりに興味がある。(ちなみに研究室の学生には何回も勧めているが、教師なし機械翻訳に興味ある人は、全員「暗号解読」という本を読んだほうがいい。マジで。)

暗号解読(上) (新潮文庫)

暗号解読(上) (新潮文庫)

夕方は保育園の全体会。娘が4歳になるのに合わせて、今月からお弁当を頼んで保育を頼んでみたところ、お弁当は2/3が残っていたが、楽しく過ごしていたようだ。これまではババ迎えでお願いしていたが、来月以降もお弁当を食べて待っているとのことだったので、また一つババにお願いすることが減ったかなぁ。