いろんな分野で共通した手法が使えるが、データへのこだわりも大切にしたい

午前中、コツコツと原稿に赤入れ。この週末に研究室の廊下のタイルの張り替えがあったのだが、今日はタイルと壁の継ぎ目を張り替えていて、薬品のにおいが充満している……。

昼から講演に出る。

講演者:下坂 正倫(東京大学大学院情報理工学系研究科)
題目:人の動きのセンシングと統計的行動モデリング
概要:インターネット社会における消費行動予測,高度な知能ロボットインタラクション, 安心・安全社会実現に向けたセンサ技術に基づく人の見守り支援など,様々な分野で人間行動の計測とモデル化が必要とされている.本講演では,人の動きの計 測とモデル化に関して紹介する.特に,講演者がこれまでに取り組んできた,車載センサ,人検出センサ,画像,モーションキャプチャなどに対するモデル化に ついて,データの内訳とともに相応の統計手法を紹介する予定である.これらの技術の現在の問題点と今後の展望について議論する.

下坂は中高の同級生なのだが、巡り巡ってこんな近くの分野で研究をしているとは……。杉本先生から「奇遇ですねえ。どうです、2人とも、中学のころから変わっていませんか?」と聞かれ、下坂は自分のことを「変わっていないですね」と答えたが、自分は下坂のことを「だいぶ変わっていますね」と答えたり (いや、ずっとバスケしていたイメージしかないので……それを言うと、自分もずっと将棋をしていたイメージしかないのかもしれないが)。

トークの内容はけっこうおもしろく、センサーを使って収集した人間の行動のモデリングに HMM やら CRF やら階層ベイズやらを適用して予測する、という話と、大規模なデータから特徴的な行動 (平常の行動パターンとか、あるいは異常なパターンとか) マイニングする話。センサーはかなりセンシティブ (駄洒落じゃないが) なので、むしろ行動が分かりすぎるとプライバシーの問題があるから、部屋にいるかどうかしか分からないくらいの曖昧な検出能力のほうが、低コストでロバストに運用できて応用しやすいとか、むしろ詳細なデータが少量あるより曖昧なデータでもいいので大規模に長期間あるとおもしろい傾向が分かるとか、どこも同じなんだなぁ、なるほどなぁ、と思ったりする。

トークのあとの雑談で杉本先生や高松先生などともお話しし、言語処理だけではなく画像処理なんかのお話も聞いたり。画像の分野でも、公開データセットが充実しているので、タスクやデータのことが知らなくても機械学習データマイニングの知識があれば戦える半面、タスクやデータに思い入れがない研究は見ていて分かるし、画像処理というタスク自体が好きな立場からすると、ちょっと残念に思ったりする、などというお話。やっぱり、データに愛があるか、手法に愛があるかは違うなぁ。

自分も同じで、手法よりタスクやデータのほうに思い入れがあるので、問題が分析できたり解けたりするなら機械学習なんて使わないでルールを書くので全然平気であり、逆に言語学的な考察を無視して機械学習だけで解く (bag-of-words だけで分類する、とか……素性を作り込むのが研究のポイントでないなら、仕方ないけど)、という研究はあまり興味が持てないかも。

午後、ひたすら修論に赤を入れたり。だんだん疲労が蓄積してくる。

夜、言語教育勉強会。seiji-k くんの進捗報告。松本先生が本質的ではあるがけっこう厳しいツッコミ。あとで聞いたところによると、日曜日と月曜日の夜はどちらも2時間しか寝ていないそうで、意識朦朧とされていた (5分くらい意識がないことがときどきあったとか) とのことだが、そういう中でも研究のツッコミを入れられるのは職人芸というか、身体が覚えているのだろうか……

elga-s さんも進捗報告。こちらはちょっと現在の方向性自身があまりよろしくないのでは、という専門家の方々のコメントがあり、方向転換。せっかくデータも揃って前に進んできたところだったので、あまり大きな方向転換や、やり直しは発生させたくないのだが、仕方ない。3月で帰国されてしまうので、それまでになんとかなるとよいのだけどなぁ。

しかし統計処理とか言語処理の技術で「100%はっきり分かる技術があるなら欲しい、それがずっと欲しかったものだ」と熱望される気持ちは分かるし、期待には応えたいのは山々なのだが、工学的立場からは100%できる技術なんて存在しないので (むしろ100%可能です、と断言する人がいたらその人の言うことは信用しないほうがいいくらい)、たとえば精度80%なら何に使えるか、90%ならどうか、99%ならどうか、というような現実的な立場でいてもらえるとありがたい。「精度99%です」と言っても「1%ということは100個に1個間違えるの、そんなの信用できない」というように言われると、がっくりくる……。そもそも人間なら子どもでもできるようなことが機械にできなくてがっかりする、というのはまだ分かるが、人間でも難しいことができているのだけどなぁ (人間でも難しい、というのはあまり自明ではないので、仕方ないが)。

勉強会のあと、タグづけミーティングと、タグづけに関する修士論文の相談。今日はタグづけに始まってタグづけに終わる日だったな〜。