人生思いがけないところでつながっている

NL研初日。このNL研というのは情報処理学会自然言語処理研究会という学会の研究会のことで、この分野で研究している大学の人は、報告できそうな結果が実験して得られたらまずここで発表することを検討する、というようなメジャーな研究会である。年2ヶ月ごとに開催されるので、「今回逃したら次はまた来年」ということもない。(ちなみに、この分野の人はやたら略称が好きなので、自然言語処理を英語で書いた natural language processing の最初の N と L を取って「えぬえるけん」と呼ぶのである)

閑話休題。初日は共著で発表があったので、メインはそちらに共著者の一人として参加することだったが、全部聞く。個人的には @ARAMAKI さんの Twitter でインフルエンザの流行予測する話がおもしろかった。Twitter のつぶやきに含まれる単語だけでは「インフルになったかもしれない」とか「インフルエンザが流行りそう」のように、本当はなっていなかったりする発言も含まれてしまうのだが、そこを地道に本当に罹患しているかどうかの情報(モダリティ)を判断して学習してみた、と。

40ページ近いアノテーションガイドラインを作りながらツイートにタグづけするのも大変だっただろうが、やっぱり自然言語処理的にはこういう地道なところをやるしかないんじゃないかと思う。(最後のセッションで辻井先生も「専門知識を持った人に自然言語処理のデータの作り方を習得してもらって、一緒にやるしかない。我々には専門知識がないし、自然言語処理で解ける問題は限られているので、解ける形でデータを作ってもらわないと解けない」というようなことをおっしゃっていたが)

残り詳しくは aito さんの5月16日 SIGSLP/SIGNL@東大まとめが詳しいので割愛。東北大の伊藤先生、と聞いてあれ? と思ったが、w3m とか skkfep とかの aito さんと同一人物か〜。いやほんと w3m にも skkfep にもとても長い間お世話になったので、一言でもお礼を言いたかったものである (いずれもずっと Gentoo でメンテナをしていた。自分がヘビーユーザだったもので……)。とはいえ、w3m ってもはや知らない学生のほうが多いんだろうな……。

aito さん自身それぞれの発表にコメントされていて、すごいなと思う。今日まで全然意識しなかったが、aito さんと近い研究分野にいたのか、自分……。emacs-w3m の tsuchiya さんNLPの人だったし、知らないところでいろいろお世話になっている方々がいらっしゃるというのがこの世界。