自然言語処理のドライとウェット

朝からT-PRIMAL 公開勉強会 NIPS 2010 読む会に参加。@bollegala さんのトークには間に合わず、途中から (@bollegala さんはスライド公開されているのでよかった)。

[http://twitter.com/rikija:title=@rikija] さんの話、心理学実験なんかから機械学習を使って自動でバイアスを取り除くという話、おもしろい。こういうのが自動でできるようになるとするといいなぁ、と思う。

お昼、@kenichikurihara さんとリアルで初めてお目にかかる。「なんで海外に行かないんですか?」と素朴に質問されたが、いろいろ理由があって……(という話をすると納得してもらえた (笑))

ご飯は@sesejun さんと @mickey24さんにくっついて、駅前(構内?)のレストラン角笛へ。あとから manab-ki くんなど合流。バイオインフォマティクスのお話を聞いたりなどする。ウェットとドライの話なんかは自然言語処理でもあるわけで、コーパスや辞書のアノテーションをする人と、タグがすでについているデータを使う人、みたいな役割の違い。

M1で入学したころ、乾先生から「小町くんは言語現象をやりたい人なのか、それとも機械学習数理モデルをやりたい人なのか、研究の立ち位置ははっきりしたほうがいい」と何回か言われたのを思い出す。前者であれば、言語学的な分析や解析は、いまはたまたま機械学習が流行っているが、ルールを書いたりするのでもよいわけで、後者であれば、自分の提案する数理モデルの有効性を示せるなら言語データでなくてもバイオのデータでも画像のデータでもよいわけで。

現在はたまたま機械学習かつ言語処理が流行っているので、両方やらないといけないと思うかもしれないが、本来この2つは別々の話なので、どちらが優れている、というのではなく、自分がどうしたいか、という話。自分が教員になってから思うのだが、どちらをやるにしても、スタッフとしては全力でサポートするが、どちらの立場を自分が採用するか、は本人(学生)が決意するしかない。自分のことを考えても、博士に進学する(した)なら、どこかで思い切るのかなと思う。

午後はNAIST 東京事務所で共同研究の打ち合わせ。自分で予約したのは初めてだったが、簡単にできた。品川から1駅、駅から歩いて1分なので、便利でよい。最近東京駅が多いので、品川駅使うの久しぶりかも。しかし帰りは奈良で大雪という話でびびっている。明日は修士論文発表会なのに、帰れるのだろうか……。