午前中、娘を送ってから出勤。お迎えは実家に頼んだので、行きすがら実家に寄って抱っこひもの使い方を説明したり。娘は抱っこひもやスリング、ベビーカーに好き嫌いがあり、嫌だと思うとギャーギャー叫ぶので、ちょっと心配……(食べ物や暑い寒いなどでは全然騒がないのだが、抱っこひもにかけてはものすごく一家言あるようだ(汗))
論文紹介で以下の論文を紹介してもらう。
- Xiaoqing Zheng, Hanyang Chen, Tianyu Xu. Deep Learning for Chinese Word Segmentation and POS Tagging. EMNLP 2013.
割と読みやすい論文で、中国語の単語分割・品詞付与に深層学習を用いるという話。まだ深層学習に本腰を入れて勉強する前の10月頭に、日本語でもこういうのできるんじゃない? 中国語で先行研究あるかもしれないし、もしあるとしたら日本語ではなく中国語だから、サーベイしといてよ、と別の学生に言っておいたのだが、まさしく中国語で1年前にすでにあったという……。
この論文、書かれている貢献が微妙(重複するものが多いし、性能的にも???)だし、アルゴリズムもなんでこうしているの?という謎が残るのだが、ストーリーは明快だし、去年にこれを発表しているなら EMNLP 的には通るだろうなという印象。先日の深層学習勉強会のときにも思ったが、文字単位の処理と深層学習というのが割と相性がいいのではなかろうか。これまでも、先頭あるいは末尾のN文字を素性に入れて識別学習する、というのはよくあったのだが、データスパースネスの問題もあるし、単語より小さく文字より大きい粒度というのは人間で特徴量を設計するのは難しいところであり(「素性テンプレート」と呼ばれる仕組みで自動的に素性を展開する方法がよく用いられるが、結局タスクとデータに合わせた「素性テンプレート職人」が必要になる)、こういうところこそ深層学習の助けを得たいわけである。
お昼は研究の相談に乗る。新しいことをやれば研究になるかというとそういうわけではなく(新しくなければ研究にはならないので、新しいことは必要であるが)、新しくかつ意味のあることをやる必要があるし、既存の研究をある程度網羅した上でそれを超えないといけないので、分野によっては結構サーベイしないといけないのである(どれくらいのサーベイが必要かは、タスクによるのでなんとも言えない)。結局最初のストーリーの段階で間違った方向に行くと、どれだけがんばっても論文にならないし、ストーリーは合っていても結果が出ないと悪戦苦闘しないといけないのである(ただし、後者はうまくいく方法が見つかれば、よい研究になるので、取り組む価値はある)。
午後は研究室の模様替え。これまで研究室の入り口を勉強会・ミーティングスペースとして確保していたのだが、年明けに4〜5人ミーティングで企業の人が来るためにスペースが足りなくなることが予想されるのと、来年度はいずれにせよ座席が足りず確保しなければならないので、この機会にレイアウトを変更してもらったのである。
模様替えの結果、かなり広くなって感動。もともとこれくらいのスペースがあったのか〜。来年度、また一気に狭くなると思うけど……。
夕方はコースの忘年会。豊田駅前に11月下旬にオープンしたイオンモールの五色という和食のお店。コース料理には飲み放題をつけておらず、飲み代は別で、獺祭がレア日本酒ということで値段がついていなかったのだが、みんなものすごい勢いで何度も注文(汗)10人で20合くらい頼んだのではなかろうか……。しかしできたばかりなせいかオペレーションがいまいちで、2時間10品のコースなのに1時間半を過ぎてまだ3品しか出てきておらず、苦情を言うと、飲み代をタダ、とまでは言わなかったが、飲み放題扱いにしてくれた。2時間でお開きのはずが3時間コースになってしまったが、味は悪くなかったし、結果的にゆっくり話せたのでこれはこれでよかったかな?