准教授の仕事の3割は大学運営

出勤したら人工知能学会誌が届いていた。今回は誌名の変更に加えて表紙も刷新され、いろいろと年末は表紙が話題になったようだが、編集委員の一人としては、このリニューアルは英断だと思う。変更前からかなり議論し、今回もさらに議論したのだが、こんなに編集委員のみなさんは考えているのかぁ、と畏れ多い感じである。

一個人としては、学会誌はその学会の(その分野の、でもある)公的なメッセージと見られるものなので、若い女性(がケーブルでつながれて掃除をしている)と見える表紙が続くより、家事を中心とした擬人化にしても老若男女取り混ぜて、いろんな形が見られれたほうがよいと思うし、12月の編集委員会でもそのように意見を述べた。他の編集委員が賛同するかどうかはともかく、そういう意見があることはみなさん分かった上での決断なのである。

東京に来てから編集委員会に出る頻度が逆に下がってしまっていたが、こういう時期に参加しないのはもったいないと思うので、できるだけ参加したいものである(ただし、2月は修士論文の発表会と、3月は大学院の入試説明会と被ってしまっている)。

午後は NLP セミナーで論文紹介をしてもらう。

  • Rishabh Mehrotra, Scott Sanner, Wray Buntine, Lexing Xie. Improving LDA Topic Models for Microblogs via Tweet Pooling and Automatic Labeling. SIGIR 2013.

Twitter に対するトピックモデルを作りたいのだが、ツイートは発言が短いのでなかなかよいトピックモデルが作れない、という問題を Tweet Pooling という手法で解決する、という話。Tweet Pooling という用語が適切かどうか分からないが、要は発言の一つ一つを文書だと思うから短くなってしまうので、複数の発言をマージして1文書にする、という発想で、効果的だったのはハッシュタグが共通のツイートをマージする戦略だった、とのことである。

日本語だとどうか分からないが、表記の正規化をしないで安直にトピックモデルを適用するとなると、表記が少し違うだけで別の単語にされてしまうので、全く同じ文字列を書くことが要求されるハッシュタグでまとめあげる、というのは分からなくない。まあ、そういう背景があるからこそ、これはマイクロブログ一般における話ではなく、Twitter 限定の話でないかと思うのだが……。

ともあれ、こうやって自分で読んだことのない新しい論文を紹介してもらうとすごく楽しいものである。既に一度読んだことのある論文を温故知新で読むのも悪くないが、よほど古典ですごくよく書かれているような論文でないと、いまいち感が漂うし……。

セミナーのあと、就職活動について雑談したりする。企業の人の話を聞きたい人は、海外に行く際のアポの取り方(特に学生の人へ)を読んでほしい。自分が何をやりたいのかも分からず、憧れの企業だから話を聞きたい、というのは相手の時間を無駄にする可能性が高いので、調べれば分かる範囲のことは調べて「自分はこういうことがしたいので、こんな人を紹介してほしい」のように言ってくれればいいのだが……。「自分が何をやりたいのか分からないので、話を聞いてから考えたい」と考えるのかもしれないが、それなら別にその企業の人に話をしてもらう必要もないし、よほど人のよい人でもなければ紹介するのが申し訳ないのである。(企業の方から「話したい」と申し出てくれるのでなければ)

夕方は大学院の演習を取ってくれている人が機械学習のツールの使い方について質問に来る。この演習テーマは全然研究室の研究テーマとは関係ないようで、指導教員からも「演習に時間を使って研究が進まないのは本末転倒だから、そんなに時間を使いすぎないように」と釘を刺されているそうだが、ちゃんと演習をやろうという姿勢がすばらしい。そもそも機械学習はおろか人工知能系の勉強をこれまでしてきていないので、プログラムを書くのは相当しんどいと思うのだが、前回までに言った内容を踏まえて、どこが分からないのか整理してきてくれるので、教え甲斐がある。

夜にコース幹事のお仕事。単に書類をまとめたりメールを送ったりするだけで3時間……。確かに誰かがやらなければならない仕事で、かつ教育研究上必要な仕事なので、そういうものだと思うが、けっこう大変。自分の体感では、仕事時間の3割くらいだろうか(今年は上述のような学会運営に関する仕事がさらに1割強)? いま仕事時間の1割くらいしか研究に回せていないので、プラス3割使えるといまの4倍研究できるのだけどな〜。授業関係が落ち着くまでの最初の2-3年のことだと思うので、いまのうちはいましかできないことをしておかないとね。