イラストがあるからといって初心者向けとは限らない

朝、例によって妻を車で職場まで送り、出勤。午前中は業務委託の仕事と共同研究の打ち合わせ。共同研究も、研究を分かっている(教員や学生のことを考えてくれる)かどうかで、やりやすさが全然違う。結局情報系の研究というのは、教員(教授、准教授)が手を動かしているわけではなく、学生(ポスドク)が手を動かしているのであって、一番大事なのは学生なのである。つまり、学生がいかに研究しやすい環境にするかが、研究の成否を決定していると言っても過言ではない。

この認識が共有できていない場合(あるいは、末端では共有できていても、上に伝言ゲームしていくうちに共有できなくなる場合)、けっこうしんどい共同研究になりがちなので、最初から引き受けないか、あるいは間に入って調整するのであるが、ケースバイケースなので、神経を使ったりする。そういう意味で、大学に理解がある共同研究先は大変貴重である。

昼過ぎから事務書類作成。コーパス購入やら、実習用の教科書の発注やら。コーパスも、今年度だけで100万円近く購入している。使う可能性が高いコーパスに限定して購入しているし、アカデミック価格でだいぶお安くしてもらっているはずなのだが、馬鹿にならないものである。あと、消耗品扱いで購入したものは所属が変わっても持っていけるのだが、コーパスは個人ではなく組織に対するライセンスになるので、所属が変わったら全部買い直しになりそう。一度買えば退職まで買い直す必要はないとはいえ、けっこう大きい。

お昼に献本いただいた「イラストで学ぶ機械学習」を通読。

Twitterで入手した何人かがコメントを書いており、入手するかどうか迷っていたのでありがたかった。

最初から最後まで通読してみて、[twitter:@echizen_tm] さんと同じ感想かなぁ。分かっている人には分かるだろうけど、初学者がこれを読んで分かるようになるかというと、論文へのリファレンスがあるわけではないので難しいだろうし、変に手法の名前が日本語化されてしまっているので、元の名前で検索すれば引っかかるであろうスライドや解説ブログがヒットしないだろうし、和訳したのは(編集者の)親切のつもりかもしれないが、却って不親切である。まあ、そう思うのは研究者・エンジニア視点だからかもしれず、そうでない読者にはこの方が親切なのかもしれない(そういう人がこの本を読むのか不明だが)。

これはあくまで「イラストで学ぶ機械学習」であって「イラストで学ぶ機械学習入門」ではないので、中身がガチなのはすばらしいことだし、オライリーのように邦訳された技術書の邦題がひどく入門な件についてと書かれるようなことはなく、好感が持てる。

ただ、「イラストが豊富」ということを売りにしているようだが、あまりイラストが理解の助けになっていないような……。本文は(初学者には分かりにくいということを除けば)しっかり書かれているのだが、イラストなしでスタンダードな教科書として出したほうがよかったのではなかろうか?(Matlab のコードがついているのだが、全く説明もコメントもないし、Matlab が使える前提というのはこの本の想定読者はやっぱり研究者なんじゃないかな)

内容的には新しいトピックまで一つのストーリーでカバーしていてすっきり書かれているだけに、惜しい感じである。

ちなみに前期の学部3年向けの「情報理論」の授業では同じシリーズの「イラストで学ぶ情報理論」を教科書にして、割と分かりやすい本だったと思うので、正解だった。この本はガチの理論の本でなく、学部生向けのゆるふわな感じなので、ちょっとターゲットが違うと思うけど……

イラストで学ぶ 情報理論の考え方 (KS情報科学専門書)

イラストで学ぶ 情報理論の考え方 (KS情報科学専門書)

むしろ個人的には以下が気になる。

夕方はサーバのOSインストール。Apple の USB 接続の DVD ドライブからはどうやら (BIOS的には認識しているのだが)起動できないようで、USB メモリにUbuntu server の iso イメージを書いてブート。特に問題もなくインストールできる。ただ、ハードウェア RAID になっているせいか、GRUB を書くときのマウントポイントが分からず、いろいろ調べる。dmraid で管理されているので、結局 /dev/dm-数字 となっているドライブに書き込めばいいらしいが、変に自動化されていてよくない。

作業領域の HDD は1つ3TBが6台あるのでソフトウェア RAID にしようと思っていたのだが、複数のHDDを組み合わせるとなぜか dmraid では1台800GBでしか認識してくれず、お手上げ。単体だと3TBで認識されているのに、意味が分からない……。