研究は寝ても覚めても考える

午前中は古典の論文紹介で以下の論文を紹介してもらう。

  • Kevin Knight and Daniel Marcu. Summarization beyond sentence extraction: a probabilistic approach to sentence compression. Artificial Intelligence (2002).

これは文圧縮タスクについての論文で、統計的機械翻訳のようなノイジーチャネルモデルを使った圧縮手法と、構文解析の shift-reduce アルゴリズムのような決定的な圧縮手法について紹介した研究。前者も CFG を使って圧縮したりしていて、なるほどな〜という感じ。Daniel Marcu については以前の日記でも書いたことがあるが、ちょうどこのあたりの時期、寝ても覚めても文書要約の研究をしていたころなんだろうな。

お昼は臨時の学科会議。審議事項が2件だが、スムーズに終了。審議事項とは別に何か聞こうと思っていたことがあったのだが、忘れてしまった。

午後は研究会。双曲幾何(Poincare embeddings 入門)、CNN、Jupyter Notebook(を用いたニューラル機械翻訳の実験)の3本。Poincare embeddings は最初に聞いたときはとてもおもしろいと思ったが、どうもすでに存在する階層構造(辞書)を埋め込むには適している一方、自分たちのやりたいことはデータ(コーパス)から階層構造を学習することで、それはこの埋め込み方法で実現できるようには見えず、あまりおもしろく感じなかった。まあ、新しいやり方であることは間違いなく、とても独創性が高いのではあるけれど。