秋からは修士の人たちの研究が本格化

午前中、共同研究のミーティング。9月と10月の頭は忙しかったので久しぶり。

いろいろやりたいこともあるなと再確認する。そういえば、去年も M1 の人たち (今年の M2 の人たち) と研究で動き始めたのもこの時期だし、そう考えると今年の M1 の人たちもいまくらいから動き始めるとちょうどいいのかな。

午後、機械翻訳勉強会のスケジュール決め。夏前は30人以上出席する超巨大勉強会だったが、今日出席したのは10人未満。とはいえ、例年こんなものだったような気がするので、夏前が異常だったのだろう。しかしせっかく M1 の人たち向けに機械翻訳チュートリアルを2ヶ月かけて話したのに、松本研の M1 の人が一人も残らないというのはさびしいものである……。中村研の M1 の人が機械翻訳をやりたい人もいるそうで、ほっとしたが、確かに翻訳に関する研究をやりたいなら松本研より中村研のほうがいいのかも。

ともあれ、あらゆる勉強会に出ていると研究する時間も取れないので、少な過ぎても (せっかくいろんなトピックの話が聞けるのに) もったいないが、自分の研究でいま手を動かしていない人は、勉強会に出るのはほどほどにしてそろそろ自分の研究に時間を使うほうがいいんじゃないかと思ったりする。(自然言語処理の論文書きシーズンは冬から春にかけてなので、いまくらいには実験の方向性を決めて11月くらいからは着手していないと、また来年、になってしまう)

夕方は意味談話勉強会。kodai-t くんが

  • Mike Mintz, Steven Bills, Rion Snow, Dan Jurafsky. Distant Supervision for Relation Extraction without Labeled Data. ACL-IJCNLP 2009.

を紹介してくれる。松本先生が「これまでの情報抽出とどこが違うの。こんなに精度も低いし」と突っ込んでいたが、関係によってはけっこう難しい問題なんだと思う。上位下位 (is-a) 関係は割と簡単な関係だが、どの会社がどの会社を買収したのか、みたいにいろんな関係が考えられるし、きれいにその関係が取れる (語彙統語) パターンが存在するとも限らないので……

あと @jhirwin くんが修士論文中間報告の発表練習。どこまで専門知識を仮定してよいのか、ということを考えると、やっぱり問題を分野外の人に理解してもらうのはなかなか難しい。(「携帯電話」や「検索」が通じないおじいさんたちを相手に自然言語処理について話したのを思い出した)