学生のうちにチームワークを身につける

連日の終電で体力が削られていて、ちょっと寝坊してしまう。添削待ちの原稿が5本。

午前中はよく分からないが研究紹介を頼まれたので、2時間身動きが取れなかった。5分でいいと言われていたのだが、この時期に2時間取られるのはしんどい。

昼、共著者と原稿・研究についてディスカッション。結局コミュニケーションをちゃんと取っているか、物理的に会える距離にいるならちゃんと顔を合わせて話しているか、といったことが大事なんだと思う。先日 [twitter:@yuchang] が言っていたようだが、企業の人が学生に求めるのは、チームワークであって、スタンドプレーでもいい学生と違うことであるそうだ。

確かに大事なのはちゃんと話を聞くこと、事前に相談すること、仕事を任したり任されたりできること、できないときはできないと報告すること、どういうスケジュールでどうなっているのか連絡すること、そういう基本的なことができるかどうかだと思う。そういうのができない学生が実に多い。もちろん学生だから完璧でなくてもいいとは思うのだが、気がついたら自分で意識的に改善しようと気に留めるとよいだろう。できない、あるいはできていないことは別にどうでもよくて、できないならヘルプに入るし、できていないならどこが障害なのか一緒に解決までの道のりを考えて前に進むだけであって、責めたりする気も評価を下げたりする気もないのだけどなぁ。(まあ、最後の段は自分に限ったことかもしれないが……)

午後、来年度のシラバスを確認したりする。大学は今の時期に来年度誰がどの科目を担当するか決めているようで (自分は教務、つまり学生教育に関する大学運営の仕事をしたことがないので分からないが)、この授業を担当できますか、という問い合わせが来たりする。松本研も来年度は全学の共通講義を担当することになっているそうだ。全部で8回の授業を松本研の教員で分担するようだ。自分もデータ構造とかアルゴリズムのプログラミング演習をやろうかと思っているので、久しぶりにコードを書いてリハビリしようかな。ちなみに冒頭の問い合わせはちょっとできなさそうだったので、申し訳ないがお断りしてしまった……。(こういうのって許されるのだろうか。他の人にお願いするようだけど。)

夕方は産総研一杉さん による「大脳皮質とベイジアンネット」というお話。今年の言語処理学会年次大会でも招待講演されるそうなので、同じような話かと思ったら、たぶんもっとざっくばらんに話していただくような感じであった。基本的には、以下のような疑問 (先入観) に対する答えをいろいろお話してくださった。

  • 脳についてはまだ分かっていない?→実はすでに膨大な知見がある。
  • 脳は計算機と全く違う?→実は脳は普通の情報処理装置。
  • 脳はとても複雑?→実は心臓よりは複雑だが、割と単純。
  • 計算量が膨大だから、シミュレーションできない?→実は脳全体でも現在のコンピュータで計算可能。

個々のお話は一杉さんのページで公開されている資料にも詳しいようなのでそちらに譲る (あと年次大会で聞く人も楽しみにしているだろうし) が、やっぱり気になるのは実環境でどのようなデータがあって、それをどのようなアーキテクチャで人間が処理しているか、かな。簡単だ、簡単だ、と繰り返されていたが、処理系が単純であるということと、それが本当に動くかどうかは別問題で、実際どのように環境からのノイズを減らすかとか、事前知識をうまく使うとか、そういうところが重要なのでは、という気がする (それは問題ではない、とおっしゃっていたが)。脳の計測も計測精度、あと空間分解能や時間分解能の問題があるだろうし……。脳の可塑性についても、ちょっと腑に落ちない感じの説明であったが、やはりこういうサイエンスの領域はおもしろい研究分野である。

終了後、ちょっと実験内容が気になって、素性のファイルや結果のファイルを見せてもらったりする。何年もいると、数字を見るだけでなにかバグっていることは分かるのだが、どこがバグっているのかはすぐには分からないことがあり、見せてもらわないと分からないのはまだまだ自分の修行が足りない。松本先生や乾先生はどこがバグっているのかまでピタリと当てられるので、いつもマジシャンかと思っていた。しかし時間切れで深追いできず。

夜は言語教育勉強会。最近再び勉強会の公用語が英語になってきている。言語を問わず、勉強会でもっとみんな発言すると、気軽に話せるようになるのでは? と思う (言語教育勉強会はどちらの言語でもかなり活発に発言のある勉強会でよいのだが)。

最初は budi-i さんがインドネシア語の学習者の誤りタグ付けについて話してくれる。インドネシア語インドネシアの国語だが、これが母語でない人も多いので、第2言語話者が多く (そもそもインドネシアは人口も2億人いる)、学習支援の需要があるのだが、そもそもインドネシア語の学習者コーパスが存在しないらしい、ということで、数千文アノテーションしているのである。hiromi-o さんの話では、日本語学習者コーパスである NAIST 誤用コーパスアノテーションに最初の1年かかったらしいので、数ヶ月〜1年かかるのは仕方ないんじゃなかろうか。

自分も学部時代、マレー語を半年勉強したことがあるので、なんとなく見ると知っている単語がときどき出てくる (インドネシア語はマレー語の一方言だった) のだが、半年勉強しただけでは全然分からない (そもそも10年前だし)。ちゃんと勉強しておけばよかったなぁ……。

次に [twitter:@shirayu] くんが研究の進捗報告、というか研究の方向性についての相談タイム。なかなか論文につながるような結果が出ない、という悩みである。目に見える成果がなくても実力はついていると思うので、気長に考えて成果がなくても腐らず淡々とやるだけかなぁ。

今年は英語学習者の母語推定と文法誤り訂正の2つの共通タスクがそれぞれ NAACL と ACL という会議に併催される会議で行われるので、それの参加メンバーの調整。とりあえず両方松本研から参加することにはなりそう (今回自分は去年のようには関われないと思うが)。文法誤り訂正は、ちゃんと作ってオープンキャンパスでデモできるくらいになればいいなぁ。母語推定のほうは、デモがあってもピンと来ない感じだが、こちらは研究的になんか新規なことができたらいいかな。

上にも書いたように、学校にいるとなかなかチームワークを発揮する機会がないので、こういうチャンスを活用してグループで研究開発する楽しさ、難しさが分かればなと思っている。少なくとも1人はチームで働いた人がいて、ある程度交通整理をしてくれないと、経験的にはなかなかうまく行かないものである。あと各メンバーは言われたことだけをやるのではなく、それぞれがアイデアを出したりコードを提供し合ったりして、協調して一緒に話し合って進めていくものだが、こういうのも大学院ではそんなに体験できるわけでもないので、こういうイベントを積極的に活用してほしい。(特にM1の人たち)

最後に kensuke-mi くんが

  • Fan Bu, Hang Li, Xiaoyan Zhu. 2012. String Re-Writing Kernel. ACL.

を紹介してくれる。この論文、去年の ACL のベストペーパーで、トークも聞いたはずなのだが、内容を全然思い出せない。トークがかなり分かりがたかった記憶しかない (自分の日記でも華麗にスルーしていた)。やりたいのは、文字列の書き換え同士のカーネルを定義する、ということで、たぶん一番こういうのを使いたいアプリケーションは含意関係認識タスクで、前提と帰結のペアが与えられたとき、それと類似したペアを抽出したい、みたいなときに役に立つと思われる。言語教育・学習の文脈でこれを使えないかと考えてみたが、ある作文に対する添削が与えられたとき、その添削に近い添削を検索する、みたいなときに使えるかもしれない。

終了後、研究の相談x3。もっと時間があれば詳しく聞けたのだが、待っている人がいたので順番に聞くしかない。研究でない相談は断ってしまい、申し訳ない。早いうちにもう一度時間を作って話を聞いてあげたい。

12月に納入してもらった計算機があるのだが、まだ最低限の設定もされていなくて、せっかくの学会シーズンに活用できていないのはもったいないので、Java のインストールだけしておく。計算機係のみなさんが忙しいらしいので手を動かさざるをえなかったが、こういう細々とした仕事であっという間に時間が過ぎて、12時間研究室にいて1行も添削できなかった (論文添削キューに7本溜まってしまった)。申し訳ない……。徹夜しないと、あるいは休日出勤しないと毎日の仕事をしているだけで仕事が減らない。先週末は論文チェックのキューを空にすることができたので、今週末の連休に期待。