昼から機械翻訳勉強会。論文紹介と進捗報告。katsuhiko-h くんが
- Zhifei Li, Jason Eisner and Sanjeev Khudanpur. Variational Decoding for Statistical Machine Translation. ACL-IJCNLP 2009.
を紹介してくれた。ベストペーパーの選考にも残ったペーパーらしい。
アイデアは、同じ出力になるルールをまとめたいが、それは計算量が爆発するのでこれまでもっとも確率の高いルールで近似(Viterbi)されてきたところを、ちゃんと全部のルールを考慮しなおかつ計算量も爆発しない方法を考案した、というもの。計算量の爆発を抑えるため、直接ルールの展開を全部計算するのではなく、求めたい複雑なモデルといま手元にある(計算可能な)モデルの KL divergence を最小化する問題にする、というのがポイントで、この「計算可能なモデル」に(目的言語の) n-gram を用いることで、動的計画法で効率的に求められる、ということらしい。
実用上これまでの研究との違いは、普通言語モデルは 出力を e 入力を f として P (e) の n-gram でスコアつけていたが、このモデルだと P ( e | f ) で重み付けした頻度で n-gram を計算するので、翻訳モデルを考慮したような n-gram になるというところか? (このへん理解があやしいが)
n-gram 以外でも効率的なデコードができるなら使えるかもしれないが、現状なかなか難しいのかもな〜。こういうように求めたいモデルが計算困難なとき KL divergence みたいなので近さを測ってなんとかする、というテクニックは他のところでも使えるかもしれず、覚えておこうと思う。
進捗報告は来週の修士論文の目次発表練習。いろいろ今後の実験計画を聞いたりなど。実験しながら書くのってけっこうしんどいと思うので、年内に一通り実験結果揃っていたほうが楽かも……。(どうせいつかは実験しないといけないのだから、思い切ってやるしかないしね〜)
夕方、NAIST 男女共同参画室の忘年会。男性4人、子ども10人くらい含め、全部で30人近い人数だったかな?! 学食2Fでケータリングを頼んでわいわいと。ワインもたくさん。
新しく男女共同参画室に着任された方のお話を聞くと、着任される前この生駒日記をご覧になって「NAIST の男女共同参画室は男性も参加しているんだ」と思ってらしたそうだ。少しでも宣伝に貢献していたかと思うと嬉しいものである (笑)
JST のお話を少しお伺いしたのだが、研究費の審査や方向性を決めるという性格上、科学史や科学哲学に興味があるということで、科学哲学の話で盛り上がる。上司から「JST では研究費の審査にこの科学哲学者の考え方を参考にしているので、この本を読んでおくように」と言われたりすると聞いてびっくり。大学院に入学してから、実際研究費を申請する立場に立って四苦八苦しながら書いているわけだが、審査側も科学哲学の理論を勉強しているのかぁ。
自分はもともと科学哲学から自然言語処理に分野を変えたのも、外から科学の営みを見ているだけでは分からないから、中に飛び込んで研究者の生態はどうなっているのか、アカデミアはどのような形で維持されているのか体験してみよう、と思った、というのも半分くらいある。いつかは研究費を申請する側ではなく審査する側も(60歳超えてからでいいのだが)体験してみたいとは思っていたのだが、審査する側がどのようなロジックで動いているのかお聞きして、目から鱗であった。
科学哲学についてなじみがない人は、少し古い本だが「科学論の展開--科学と呼ばれているのは何なのか?」がおすすめ。
- 作者: A.F.チャルマーズ,高田紀代志,佐野正博
- 出版社/メーカー: 恒星社厚生閣
- 発売日: 1985/05
- メディア: 単行本
- 購入: 4人 クリック: 54回
- この商品を含むブログ (11件) を見る
- 作者: 伊勢田哲治
- 出版社/メーカー: 名古屋大学出版会
- 発売日: 2003/01/10
- メディア: 単行本
- 購入: 14人 クリック: 177回
- この商品を含むブログ (90件) を見る
文科系のバックグラウンドを持って理科系で PhD を取った人というのは全然科学技術政策の進行側の中にいないし、理科系で PhD を取ってから JST に入る人も自分の研究分野以外ほとんど知らない人ばかりで、視野が広い人に来てほしい、とのこと。お世辞だとは思うが「小町さんが「審査側に回りたい」と言ったらすぐ採用すると思いますよ」とおっしゃっていただいた。そういう需要もあるのかと思った :-)
そういえば、託児所を作るという話が棚上げになって参画室のみんなで憤慨していた話は、なんとか構内に場所が見つかって折り合いがつきそうな感じだそうだ。よかったよかった。東大も京大も構内に託児所があるので、大学に通う学生や研究者が子育てしやすいそうだが、NAIST だと学外に頼むことになるのでちょっと大変。生駒周辺は保育園がけっこう空いている地域らしいので、東京のように「2年後に保育園に入る予約をする」なんてことはないようなのが救いだが、やっぱり構内にあったほうが楽だよな〜
I 先生の言動がおもしろすぎるので大爆笑していたのだが、みなさんお酒が入るとおもしろさに磨きがかかりますね!(笑) 来年も参加したいな〜 みなさまよいお年を!