データサイエンティストなんて飾りです。偉い人にはそれがわからんのですよ

朝、妻を職場まで車で送るが、夜に赤坂に行って飲む用事があったので、一度帰宅して再度出勤。往復すると30分はかかるので、ちょっと悩ましいところだが、朝送るのは当分続けたい。

午前中は仮配属の学部3年生4人が来てくれたので、「言語処理のための機械学習」の輪読会の説明。前期に機械学習の理論の勉強会を入れ忘れていたので、3年生も来ることだし、とゼミをすることにした。

言語処理のための機械学習入門 (自然言語処理シリーズ)

言語処理のための機械学習入門 (自然言語処理シリーズ)

大学院の学生が輪読で読むにはちょっと適当ではないかもしれないが、機械学習そのものの授業が首都大には存在しないので、ちょうどいいくらいではないかなと期待している(あまりうまく行かなかったら来年は別のことをするけど……)。

4人に言語処理にどれくらい興味があるのか質問してみたら(上記の本は機械学習とはいえ言語処理中心なので)、割とうちの研究室を配属先に志望したいくらい興味があるそうだ。まあ、それならやっておいても損はないだろう。

昼休みを挟んで午後から大学院のプロジェクト実習のガイダンス。情報通信システムの教員は隔年で講義か演習のどちらかを担当することになっていて、自分は奇数年度に演習をするローテーションに入ることになったのだ。

とりあえずなにをやったらいいか分からなかったのだが、複数人の教員でまとまったほうがよいらしいので、グラフマイニングがご専門の片山先生と「テキストマイニング・ネットワークマイニング」と題してKDDCup のデータを使ってグループワークに取り組んでもらうことにする。人が集まるとよいのだけど……。

夕方、仮配属の学生たちがMATLABの講習会を受けていたらしいので、その報告を聞く。彼らがやるプロジェクトは顔画像認識(類似画像検索)で、OpenCV使える言語でやればなんでもよさそうな気がするのだが、前期の実習でも使ったMATLABでみんなやるらしい。

彼らがどういう環境で実習をするのかよく分かっていなかったので、一応全員にMacBook Air 13インチを貸与(今年から研究室ができたので、彼らが研究室で使える空きPCがなかった)。MATLABはサイトライセンスがあるのだが、大学で購入した計算機にしかインストールしてはいけないのである。学生のうち半数は、自分でもMacBook Airを持っているらしいが、Mac率が高くてむしろ意外であった。

夕方から赤坂に移動し、折おりというお店でデータサイエンティスト(笑)の会。Naver 時代からの LINE の方にお声がけいただき、いろいろな職場の方々合わせて8人でざっくばらんに飲みつつ話す。六本木の某社の研究所の方が、最近名刺に「データサイエンティスト」という肩書が入ってしまった、ということで「次誰がデータサイエンティストと入れさせられるか」で盛り上がったり。大学から参加しているのは自分だけであったが、実は自分も他人事とは言えない状況だったりして(汗)

自己紹介だけで延々話が尽きず、気がついたら10時半だったし……。