ベースラインのベースラインたるゆえん

朝から急遽娘と3人で妻の実家へ。足の調子が悪かったので病院に行こうと思っていたのだが、それどころではない。

とはいえ、自分がすることは特になく、娘の面倒を見ていただけだった。

お昼にピザを食べて解散。娘は裏ごししたいちご(の汁)を食べてご満悦。お腹は満たされないが、おいしい、みたいな?

午後は武蔵境に移動して、紳士服コーナーでいろいろ買う。最近痩せてきているので、いま買うのがベストかどうか分からないが……。ここのところ自分の体重のベースラインは70Kgだったのだが、が生まれてから毎月1Kg前後減少し、現在65〜66Kgを推移しているのである。個人的には62〜63Kgくらいが妥当な体重だと思うので、あと少し減ってもよいのだけど。

ベースラインといえば、いつも読んでいる natural language processing blog でどのようなベースラインが必要かという議論があり、全く同意。実験をして言えるのは、2つの手法を比較して、共通部分と相違部分があり、性能に違いがあるとすれば相違部分によるものなので、こういうふうに変えた効果があった、ということだが、アルゴリズムだけでなく使うデータが変わっていたり、用いている素性が違ったり、といったことが往々にしてある。性能が上がったことに対して疑うわけではないのだが、単にデータが増えて上がっているかもしれないのに、アルゴリズムを変えたせいだ、という主張だと、それは本当?と言いたくなる(というか、突っ込まざるをえない)のである。

自分も M1 のころはベースラインの必要性が分かっていなかったので人のことは言えないが、学生にはちゃんと比較実験をなぜするのか、どのようにするのか、ということを理解してもらいたい、と考えている(具体的には、しつこくベースラインについてリマインドしている)。