言語処理学会2009年年次大会本会議2日目: 能動的に集合知を獲得する話

2日で合計7時間しか寝ていないところ、お酒をけっこう飲んでしまったので、朝の電車を乗り逃がす。通勤・通学ラッシュ的な時間帯のはずだが、40分に1本しか電車が来ない。のんびりしている。あと、鳥取は駅前でもほとんど信号がないのだが、なぜか歩行者がいたら車は(かなり手前から)止まってくれる。信号がないとちょっと怖いのだが、これはこれで安心できる、いい町だと思った。奈良は(NAIST 周辺だけかもしれないが)信号があっても怖いし、歩行者に全然優しくない :-(

今日は初めて総会というものに出てみた。決算報告とか基本的に報告ものが多かったので、確かに関心ない人にはどうでもいいだろうな……。ACL business meeting は松本先生に「誰でも出ていいはずだから、1回くらい出てみてもいいかも」と言われて出たことがあり、そのときは議論があったのでおもしろかったが、日本ではそういう議論になるのはあまりありそうにない。

去年の言語処理学会年次大会の最優秀発表賞というものを受賞していたのだが、表彰式はこの総会の中だったので、今日ようやく賞状と副賞をもらう。こうやって評価されるのは嬉しいものである(共著者の taku さんや shimbo さんなど、みなさんのおかげである)。壇上に上がるタイミングを間違えた気がするけど……

そういえば来年の年次大会は本郷でやるらしい。行かないと。

2日目の午後は口頭発表はなしでポスターだけのようだ。ポスターも人が多くてちょっと疲れてきたのだが、個人的に楽しめたのは小林哲生さんの「ウェブを用いた幼児言語発達研究:大規模縦断データ収集の試み」かな。既存研究では大規模なデータを取ろうとすると横断研究になって個々人の発達具合はトレースできないし、逆に縦断研究をしようとすると詳細に記述しようとするあまりサンプル数数個のようになってしまう、という問題点があったが、それを Web 的ないわゆる集合値を使って大規模に集めることができます、という話。

実際に取れたデータもおもしろいのだが、(そういう目的で)本当に回してデータを集めました、というのがすごい。Yahoo! みたいな大規模なサービスを提供しているところは副次的に取れるログ的なデータは大量にあり、それを有効活用しようという話は自然な流れだとは思うが、最初から「こういうデータがほしいからこういうサービスを提供します」という流れで立ち上げてうまく行った、というのは貴重な体験談だと思う。どういう仕掛けにしたら一般ユーザの人が使ってくれるのかとか、どういう題材だと使ってもらえやすいかとか、考えないといけないところはたくさんあると思うが、Web を(たとえば Wikipedia から情報を抽出します、という話のような)受動的に使うのではなく、能動的に使って情報を出してもらえる、というのは確かに Web の可能性をちょっと感じる。すごいわ〜

夜は懇親会にも出てみたのだが、確かにこの値段でこのご飯とお酒は学会の懇親会ではこれまで見たことがない。終わったあと残った日本酒もどうぞ持って帰ってください、ということでもらってきたのだが、こんな至れり尽くせりでいいんだろうか。鳥取素敵。大変満足度の高い懇親会でした、みなさんどうもお疲れさま!