数字に踊らされず、実際のデータを見る

今日は朝の散歩のとき娘がしきりに何かを喋っていた。いつもは無言なのに、珍しい。

8月は毎週水曜日大学を休暇にしているので、午前中はゆったり過ごす。しかしながら、午後は別件の仕事で赤坂に行く用事があったので、お昼から赤坂に出勤。

都心方面に行くならば、と、先週木曜日にお会いする約束をしていたのに、体調不良のためにキャンセルさせてもらった方と、赤坂でランチをご一緒する。企業の方なのだが、自然言語処理や深層学習についてのお話が普通に通じて感激する。帰り際に娘におみやげまでいただいて、恐縮するばかりである。せっかくなので、何かお手伝いできればいいのだけど(たぶん、大学で学生と一緒に研究をがんばるのが、遠回りでも一番の恩返しになると思うが)。

娘さんにどうぞ、と「はらぺこあおむし」をいただき、恐縮する。娘は3ヶ月を過ぎたばかりだが、「スイミー」のようなすごくカラフルで複雑な絵が好きなようで(原色でどぎつい色のものや、単純な幾何図形みたいなのには、興味を示さない)、大変ありがたい。首もほとんど動かせなかったころと違い、最近は寝返りも少しずつできるようになってきているので、本を読むより身体を動かしたい時期のようだが、そのうちまた絵本が好きになる時期が来るだろう。

はらぺこあおむし エリック=カール作

はらぺこあおむし エリック=カール作

スイミー―ちいさなかしこいさかなのはなし

スイミー―ちいさなかしこいさかなのはなし

午後は赤坂でミーティング。今回はいろいろとデータを見たり、方針を決めたり。やりたいことはいろいろあり、けっこうボリュームがあったが、有意義な時間を過ごすことができてよかった。研究テーマにもいろいろあるが、情報抽出は今後も取り組みたいテーマの一つである。

あと、うちの学生にも多いのは、精度が数字で出ると比較しやすいので数字がどうなったかばかり気にするのだが、数字は性能を示す指標の一つに過ぎないので、ちゃんと実際の出力を見てほしい。見かけの数字はよくなっていても、体感的な性能は下がっていることも、その逆もある。自分の実装したことが本当に意図通り動いているかも、実例を見ないと分からない。

たとえば、提案手法で全体的に有意に精度が上がっていることを示ても、実例を見たら、意図した事例を正解するようになって性能が改善したのではなく、意図しないところで副作用があって数字が上がった、ということもありうる(新しい研究テーマにつながるので悪いことではないが、論文としては間違い)。数字は補助的に用いるだけにして、データを見てもらいたいのである。

帰りは駅から自転車だったのだが、父とすれ違った。時期を外した夏季休暇を取っているらしい。自分もそうだけど……。年度内で定年らしいが、仕事の忙しかった時期、夏は体力的に大変そうだったので、今年で夏のお仕事は終わりなのはよかったと思う。(自分もそのうち夏に倒れたりしそう)