論文を自力で読めるようにするトレーニング

朝来てとりあえずメール処理。メール処理の時間をなんとか最小化したい……。

午前中は研究室で共同研究の進捗確認。論文の内容を2時間説明してもらったが、半分ほどで時間切れ。そもそもコードを想像せずに論文の内容を理解するというのは土台不可能だと思うので、内容を説明してもらってはそれを(疑似)コードに落として解説して、ということをひたすら繰り返す。自然言語処理の教科書があればいいかな、とは常日頃思っているのだが、いま自分がほしいのは、論文なり教科書なりに書かれているアルゴリズムを自力で実装できるようになる教科書であり、それに一番成功していると個人的に思うのは「大規模サービス技術入門」

と「日本語入力を支える技術」
日本語入力を支える技術 ?変わり続けるコンピュータと言葉の世界 (WEB+DB PRESS plus)

日本語入力を支える技術 ?変わり続けるコンピュータと言葉の世界 (WEB+DB PRESS plus)

の2つではなかろうか。これらの本はもっと読まれてよいと思うのである(これらの本は、少なくともガイドなしにプログラムは書けることが前提になっているが)。問題は、いくら本を紹介しても、読んでくれる人は10人に1人いるかいないか、といったところであることだが、そんなことにめげていてはすぐに心が折れるので、10人に1人も読んでくれるんだ、と思ってしつこく紹介するのである(そういうわけで、「日記で紹介されていた本、読みました」と教えてもらえると、とても嬉しい)。

演習課題のチェックをしていると、コピペしているとおぼしき課題を見つけてしまい、同じ内容のソースコードを出してきた学生たちにそれぞれメール。課題を全部見るだけなら O(n) で済むのだが、コピペする人がいると、コピペしていないかどうかチェックする必要が出てきて、これは O(n^2) かかる作業なので勘弁してほしい。あと、ソースコードはそのまま添付してほしいと繰り返しているのに、なぜか Word で提出したり、あるいは Word にコピペして PDF に変換して添付してくる人もいて、なんでわざわざそんなことをするのか謎(PDF に変換されることによってコピペのチェックがしにくくなったので、難読化の効果はあるのかもしれないが)。

コピペでもばれなければ単位がもらえるというインセンティブがある以上、いたちごっこに付き合うのは時間の無駄だと思うし、誰かに教えてもらったら教わった人の名前を申告することで教えた人に加点するので、どんどん教え合いましょう、という方針をアナウンスすることにした。プログラミングに限らず、お互い教え合ってくれるようになってほしいし。

午後は大学院の演習。今回も国際会議の論文紹介をしてもらったのだが、終了後「毎週論文紹介はつらいです」と泣きが入る。これまでほとんど英語論文を読んでいないのに紹介するのが大変なのは分かるのだが、M1 としてこれくらいはできるようになってほしい、と思う自分は、他の先生方と比べてだいぶスパルタなんだと思った(本業の研究を圧迫してもなんなので、次回以降は隔週にすることになったが……)。

夕方は記者の方から取材。以前からこの日記を読んでくださっている方らしく、つい細かいことまでいろいろお話しする。こういうふうに来てくださることができるというのは、東京に来てよかったことだなぁ。来年発売号の記事にしてくださるらしい。楽しみ!

夜はひたすら提出課題を見てコメント。5時間くらいだろうか。25時に終わったので、それからスライドの作成。28時に研究室を出る。課題提出の〆切を23:59にしたのだが、失敗だったか……。