研究室でも iPad で論文を読む人が増加中

午前中、iPad 2クリーンインストール。Kevin さんが iPad を試してみたいというので、譲ることにしたのである。やっぱり勉強会でノートPCを開くと威圧的で、iPadのほうがよく見えるらしい。確かに自分も同感で、勉強会や研究会でノートPCを開いて激しくキーボードを叩く人を見ると、いったい何をしているんだろう、という気になるし……。4月以降松本先生も勉強会には iPad を持ってくるようになったしなぁ。M1の人たちも iPad ユーザが地味に多い。

昼過ぎ、アンビエント (環境知能学) 関係のミーティング。ロボティクス、視覚情報メディア、インタラクティブメディア設計学、自然言語処理、という4研究室の共同研究プロジェクトなのだが、やはり松本研が浮いているような……。研究ネタについて議論してみたが、なかなか接点がない。悩ましいところである。

午後、機械翻訳勉強会。松本研と中村研で交互に開催していて、今日は松本研開催の番。論文を読むとコードを書きたくなる。今日はなんだか執筆依頼が舞い込んだが、全部やりたいことができるわけではないので、なにをやらない (他の人にお願いする) か考えないと。

夕方、ソーシャルメディア解析勉強会。hiromichi-s くんの進捗報告。新しい実験をしたり、サーベイを進めていたり、着々と進んでいるようでなにより。何がベースラインになるのか、評価方法をどうするか、このあたりはスタンダードなやり方が決まっているタスクでなければ、ちゃんとサーベイしないと分からないしなぁ。

論文紹介は[twitter:@wk_kiyoshi] くんが

  • Samuel Brody and Noemie Elhadad. An Unsupervised Aspect-Sentiment Model for Online Reviews. NAACL 2010.

を紹介してくれる。この論文は2つに別れていて、前半では文単位のトピックモデルを用いて教師なしで文と単語に属性 (アスペクト) のラベル付けを行なう話と、後半では cheap but delicious のように接続詞でつながった形容詞とそれが修飾する名詞からグラフを作り、ラベル伝播によってこちらも教師なしにアスペクトごとの評価表現を獲得する、という話。非常によく準備してきてくれていて、説明も分かりやすかった。前半の話が@wk_kiyoshi くんのやりたいことに近く、参考になったが、後半の話とくっつけて1本の論文にしないで、前半をもっとしっかりやったらさらによかったのではなかろうか。後半の話は先行研究の追試のような感じになっているし……。教師なしでなくていいので、文単位ではなく節単位くらいでラベル付けできないかな?

M1の人たちもそろそろメインとする勉強会が決まってきた (松本研では研究グループのことを勉強会と呼び、学生は最低1箇所の勉強会に所属する) ようだが、今年は機械学習に興味のある人が多いのかな? 

結局日本語コーパスのデータ修正、diff を見て人手で直す。元の XML データを確認したり、直したものとさらに diff を取ってチェックしたりしていると、けっこう時間がかかる。1日で半分直したので、あと1日あれば……。