他人と仕事をするときはインタフェースが重要

午前中、NICTの委託研究ミーティング。普段はスムーズに行けば間に合う時間だったのだが、あらゆる信号で赤になって止められてしまい、遅刻。申し訳ない。(Polycomが不調でまだ始まっていなかったが……)

この委託研究は数カ所で分散して開発しているのだが、やっぱり企業の人の着眼点 (進め方) と大学の人の着眼点 (進め方) はだいぶ違うなぁと思う。先日英語の文法誤り訂正タスクで毎週進捗報告ミーティング開催したときも、それぞれのコンポーネントを作っている人が違うので、似たような状況だったのだが、前回の宿題がどうなったかとか、それぞれのコンポーネントをどうつなぐか、というところを早く決めたほうがいいとか、ちゃんと動いているかテストできる環境を早く作ったほうがいい (結局バグだらけだったし) とか、口うるさいことを毎週言っていた。自分も企業に入ったら甘々なんだろうとは思うが、大学の中にいると企業の人の気持ちも分かるような感じ……。

なあなあではなく前に進めようと思うと、どこにいても似たようなポイントに気をつけないといけないんだろうか。多分それが唯一の方法ではなくて、自由にやらせてうまくいく、というやり方もあるのだろうが、まだ自分はその域に達していないようである。(松本先生は、こだわりのある一部のテーマ以外はほとんど放任主義なので、バランスを考えると自分が細かく進捗を聞いたりするほうがよいのかなと思うし)

帰り道すがら、京都の夏は死ぬほど暑い、という話をお伺いする。南部 (自分たちが住んでいる宇治川のあたりとか) に行くほど涼しいと。あるいは逆に北部に行くのもありだと。やっぱりそうだよな〜。北部なら下鴨のあたりに住みたいのだが、通勤時間が1時間40分前後になるかと思うと、踏ん切りがつかないのである。(多分妻の通勤は自転車で10分くらいになると思うが……) お互い今の職場のまま、あるいは子どもが産まれるまでは、今の住まいでいいかなと思ったり。

昼から機械翻訳勉強会、に出る予定だったが、学内の実習の準備で30分ほど遅刻。松本先生もいるし、そこまで自分が毎回出ることもないのかなと思った。(日中英の翻訳には興味があるのだが、それ以外の言語対にはあまり食指が動かず……。構文解析とか意味解析が威力を発揮するような設定が好きなのである) 

夕方、M1向けの学内実習の説明。Kevinさんの実習テーマ、おもしろそう……。自分は数用意してみたが、難しい。最初松本先生に少しだけ挨拶を、とお願いしたところ、その後しばらくいてくださり、自分の実習テーマに関してコメントをいただく。もう少し具体的な手法にまでパーツパーツを落とし込んでおき、あとは実装するだけ、というところまでこちらで考えておいたほうが、M1向けであればやりやすいのだろうな (自分自身、インターンシップをしていて、実装の方針まで given であったことは1回もなかったのだが……)。やっぱり小講座だとこうやってアドバイスもらえるのがいいなぁと思う。実習人数は10人で、Kevinさんと2人で担当するので、5:5か4:6に分かれるとよいのだが……。

最近研究室内の全体ミーティングでちゃんと発表を準備して来ない人がいるのはよくない、という話があり、松本先生が注意喚起のアナウンス。あまり締め付けを厳しくするのも居心地悪くなる人がいるかとは思うが、なあなあでグダグダの話が続くとみんな疲れるし、特にM2の人は就活に時間を取られて数ヶ月全く進捗がないという人もときどきいて、非常によろしくなかったので、数時間でもいいからとにかく前回からちゃんと研究的な差分があるように喋る、というのは大事かなと思った。

夜、ソーシャルメディア解析勉強会。最初はhiroshi-tくんの進捗報告。M1の人向けに噛み砕いた話で、分かりやすくてよかった。その後、わざわざ東京からこの勉強会に参加したいとお2人でいらした企業の方に1時間ほどお話いただく。「テキストマイニング」という単語をどのように受け止めてらっしゃるのか気になるが、やりたいこととデータはおもしろいと思うので、こういうデータに興味のある学生の人がいたらいいなぁ。論文は[twitter:@shirayu]くんが

  • J. Foster et al., "From News to Comment: Resources and Benchmarks for Parsing the Language of Web 2.0," in Proceedings of 5th International Joint Conference on Natural Language Processing, 2011, pp. 893-901.

を紹介してくれる。いろいろなドメインのデータを学習、テストに用い、さまざまな構文解析器について調べた、という話。最近の統計的機械翻訳でも、どのような構文解析器を使うかで新聞記事での精度は同じくらいでもけっこう結果が変わってくるという話があり、頑健に動く解析器ってなんだろうか、と考えたりする。最終的に最大化したい評価指標があるなら、それを最適化するように学習する、というのが単純なやり方だとは思うが、計算が大変そう。

最終新幹線の時間が微妙だったのと、けっこう雨が降ってきたので、車で京都駅までお送りする。道中大学院生活についてお話したり、研究生活についてお話したり。途中何回も雷鳴や稲光が轟き、視界を遮るほどの大雨が降ったり、心中寒い思いをする。天気予報では晴れだったのに……。