誰にでも同じようには語れない

午前4時から事務処理をしたりメール処理をしたり。やることが溜まっていてどうしようもない。

午前中は研究室インターンシップ。今日はStanford Sentiment Treebank についてお勉強、ということで

  • Socher et al. Recursive Deep Models for Semantic Compositionality Over a Sentiment Treebank. EMNLP 2013.

を(改めて)みんなで読む。しかしこの論文を読んでも Stanford Sentiment Treebank の構築方法は書かれておらず、本文には Supplementary Material を読め、と書かれているのにこのページには置いておらず、ACL Anthology の Attachment を読まないといけないという罠がある。こちらの付録を読んでみると、ちゃんとどのようにデータを収集してどうアノテートしたのかについて書かれている。最初25段階でつけられるような UI にしたけど結局ラベルが書かれている7段階にしか人間はつけないとか、結局7段階だとしても極端なスコアはつけにくいので実質5段階だとか、なるほどな〜という感じ。

お昼からコース会議だったが、自分の審議案件(博士号の申請にかかる承認と RA の申請にかかる承認)だけ先にやらせてもらい、高校生の見学対応。

高校生は群馬の女子高の高校1年生の生徒(バスで来て全員参加)。今年に高校生を相手に喋るのは3回目で、これくらいを話せばいいのでは、となんとなく思っていたが、全員真面目に聞いてくれているのにどうも手ごたえが違う。これまでの2回のイベントはそれぞれオープンキャンパスやそれに類似したイベントで、そこそこ自然言語処理に興味を持ってくれている人たちが来てくれていたのだな、と反省する(なので、理論のほうにこそ関心があった)。裏側の仕組みや理論を説明するより、最初からデモを入れたりして、NHKスペシャルクローズアップ現代的に話さないとダメだ……。

今回の高校生の見学に合わせてデモを増やしてもらったので、次回は捲土重来を期したい。何回か体験すると少しずつ経験値が上がるイベントが大学教員は多い気がするので、じっくり時間をかけて自分なりのやり方を確立していきたい。