新しいものがいいとは限らない

どこか出かけようかなと思っていたが、午前中から娘(4歳5ヶ月)の様子が少し変で、熱を測ってみると38度あったので、外には行かずに家で過ごす。最近は土日に昼寝をすることもないのだが、昼寝していたので、かなり調子が悪いのだろう。

外に行けなかったので、東大出版会の「ロボットは東大に入れるか」を読んだ(同じ名前の別の本もあるので紛らわしいが)。

これは極めて重要な本で、東ロボプロジェクトの現段階までの総括と、2018年時点でのこれからの展望が盛り込まれていて、内容的にもしっかり書かれているし、東ロボプロジェクトについて何か言いたい人は、とにかくまずこれを読むべきだと思う。自然言語処理分野の研究者の人であればほとんどの内容は既知だと思うが、各教科で取り組まれてきた(発表されてきた)ことが1冊にまとまっているし、それぞれの教科に取り組んできた人たちが実際に書いているので、信頼性も高い。

特に分野外の人に注目していただきたいのは各章の末尾についている参考文献リストで、この中にそれぞれの章に関係する基礎的な文献(論文)と、それぞれの教科に関する研究で発表されてきた論文が一覧できるので、国内外でそれぞれの分野がどういう状況にあるのか、そして個々の取り組みがどう評価されているのか、ということを一瞥できる。

たとえば、国際的に明らかに高く評価されているのは数学の取り組みで、これは自分もすごくおもしろい研究だと思っていて、この本の解説も問題が分かりやすく書かれていてすばらしい。他には世界史の取り組みもそこそこ興味深く、やる前からある程度できることは予想されていたが、実際かなりできるようになったというのは知見として意味がある(査読付きではないが、国際会議で発表されているので、リファーしやすいのもポイント)。また、国語に関しては国内の査読付き論文誌で複数論文があり、サブタスクを解くに当たって言語処理的な課題が明らかになっていく、という積み重ねがある。

しかしやっぱりプロジェクト全体として継続するのは難しい、というのは仕方ないように思ったりする。プロジェクトが完全に中止されたわけではなく、個々の取り組みは続いているし、データが公開されたので、長期的にはコミュニティにとって有用な資源になると思う。(なにかのきっかけで、みんながこぞって使うベンチマークになったり?)

このプロジェクトに限らず、企業との共同研究でも、(トップカンファレンスとは言わずとも、せめて年次大会や研究会で発表するような)論文につながらない研究に関しては、よほどポリシーや意志をもってやらないと、最先端の内容を盛り込む、というモチベーションの維持が難しい。もちろん、必ずしも最先端の内容を盛り込むことが期待されている訳ではなく、それなりに枯れた技術でそこそこ妥当な方法で問題を解くことが期待されていて、最初からそういうつもりでやればいいわけであるが。