朝起きたら頭痛は治っていたが、喉は痛いまま。コーヒーが頭痛にいいらしいので、とりあえず研究室に行ってコーヒーを飲む。
昼保健管理センターに行って健康診断。血液検査してもらったところ、赤血球の値が高いが、あとは正常とのこと。水分不足なので水分を摂ってください、と。昨日は水も飲めなかったので無理もないが……。
喉はいつも通り抗生物質と痛み止め、トローチにイソジンを出してもらう。よくよく考えると年に3回くらい薬もらいに来ている気がする……(NAISTは診察数分で薬無料でもらえるし、過去の履歴も参照してくれるので、もっとみんな気軽に利用したらいいと思う)
午後は機械翻訳の勉強会。木ベースのモデルについて終了。なんだかんだいろいろあるが、教科書としてはそんなに悪くないと思うなぁ、やっぱり。来年は今年やらなかった部分を読んでもいいか。というか、いまから来年のことを考えてどうする、という感じだが。
続いて意味談話解析勉強会。松本先生が「意味談話は画数が多くて予定表に書きにくいので、略称を考えてほしい」と言っていた(※松本先生は紙の手帳でスケジュール管理している。実は自分も紙の手帳なので同じ問題が生じていた)ので、今回から「S&D」と名乗ってみる。
論文紹介は kodai-t くんによるTwitterデータの極性判定。
- Apoorv Agarwal, Boyi Xie, Illia Vovsha, Owen Rambow, Rebecca Passonneau. Sentiment Analysis of Twitter Data. In Proc. of the Workshop on Language in Social Media. (Co-located with ACL 2011)
- http://aclweb.org/anthology-new/W/W11/W11-0705.pdf
ポジティブネガティブの2値と、ニュートラルを加えた3値で実験をしている。なにか特別なことをしているわけでもなく、データの取得方法が微妙だったり、ツリーカーネルを使ったという割には構文解析をしている訳でもなく (ただし Twitter のデータなので、構文解析器が失敗するので使わない方がよい、という可能性はある)、全体的には本会議のレベルではないが、関連研究なんかは参考になった。(実際ワークショップ自体は立ち見が出るくらい混雑していた) Twitterのデータにどこまで自然言語処理が使えるかには興味があるので、ひとまずデータが溜まってきたら見てみたい(他力本願)。
夜自分の書いた研究計画書と他の方々が書いた研究計画書(いただきもの)を見比べてみたりする。いろいろと違う点もあり、参考になる。本当にNAISTの小論文や学振の申請書を書いていたときの自分にいろいろとツッコミたくなる。よくあんな状態で出していたなと……
自分で言うのはなんだが、少なくとも自分に関しては、研究計画書を書くのにかけた時間とクオリティは比例しない。もちろん図を見やすくしたり文章の自然さを向上させたりといった点は時間をかけると明らかによくなるのだが、研究計画書のクオリティ自体はその問題についてどれだけ真剣に考えたか(深さ×期間)、に比例しており、そこがクリアできていない場合どう書いてもまとまらない。そういう意味では、機が熟していない段階でいくら書こうとしても無理で、逆に「いまこれを書きたい」と思った時期に書くしかない。(見栄え的なところは数日あればなんとかなるので。これも、たくさん研究計画書を書いて、ぼこぼこ落ちたので作成速度が速くなったが、最初は3-4週間かかっていた)
松本先生がときどき「計画を具体的に書きすぎるとそれをしないといけなくなる」とアドバイスしてくださるのだが、自分はやはり具体的に書きすぎてしまうようだ。とはいえ、どうもぼかして書く技術もないし、考えていることは割と書いてしまう性格(あとで気が変わることはよくある)なので、これは仕方ないのだろう。
いろいろ悩ましいが、清水の舞台から飛び降りる気持ちで。