日本の機械学習の研究拠点になるIBISML

立川の統計数理研究所まで第12回 人工知能学会 データマイニングと統計数理研究会(SIG-DMSM) に参加するためにお出かけ。次回から電子情報通信学会の情報論的学習理論(IBIS)時限研究専門委員会と合併することが決まっているので、人工知能学会で開催されるのは今回が最後である。新しい研究会の名前は「情報論的学習理論と機械学習研究会(IBISML)」で、ドメイン http://ibisml.org/ もあれば Twitter アカウント @ibisml まであったりする。@shima__shima さんさすが(笑)

気持ちとしては日本の機械学習の一番大きなコミュニティを作り、世界的な研究拠点にしたい、ということが狙いだそうで、すばらしい。そういえばThe 2nd Asian Conference on Machine Learning (ACML2010)東工大で開催されるそうで、どんどん若手の研究者も育っていっているようである。(自分は機械学習をハードにやるというよりは、情報抽出やデータマイニングの観点から生暖かく見守っているという感じだが……)

招待講演のいずれでも

The Fourth Paradigm: Data-intensive Scientific Discovery

The Fourth Paradigm: Data-intensive Scientific Discovery

が言及されていて、これからはデータ中心科学の時代だ、というお話をされていたので読んでみようと思ったのだが、Amazon.co.jpでは絶版のようで……(Kindle で読めるらしいので、Kindleで読めと?)

懇親会でも産総研の方々とお話していて、データは大規模、大量にあって、「これだけデータがあるのでこれを使ってなにかしてほしい」というのが産総研でのお仕事のようで(なにやら企業と共同研究しなければならないそうで)、とにかくセンサーデータでも購買データでもなんでもいいので、自動的に大規模で多様なデータがじゃぶじゃぶ手に入る状況で、そこからなにができるか、というのが現状である。最近自分で思うのは、自然言語処理ではテキストが入力か出力で関わっていないと研究にはならないのであるが、この流れとは自然言語処理も無縁ではなく、制限なく大量にデータが手に入るのであれば、なにかこれまでにできなかったことができるのではないか、という考えである(検索のログを使う、というのはその中の一つ)。

今後年4回研究会を開催するそうで、これまで年1回だったIBISと比べてかなり発表の機会が増えてよさそう。松本研の学生さんでも自然言語処理が専門とは言いにくい人たちに対し、どの研究会に出せばいいのか悩みどころで、年4回はちょうどいいくらいかな? 来年3月は「自然言語処理テキストマイニング」がテーマらしいので、言語処理学会年次大会と時期が被ってしまうのが悩みの種(来年の言語処理学会豊橋科学技術大学でやるとの噂だし)だが、アットホームだけど議論のレベルは高いという、よい研究会になることを期待。

帰りは武蔵境からバスで帰ってきたのだが、9時が終バスなので危なかった……。実家に帰ってくるのも久しぶり。弟がプライベートで参っているらしいので、その話を兄弟でしてみたり、いろいろと難しいものですなー