研究室を見学するときは学生メンバーとも話そう

最近は朝7時くらいに散歩に出かけているのだが、7時に出かけても帰ってくる8時前には汗びっしょりになっていたりするので、6時くらいに出かけたほうがいいのかもしれない。最初は外に出るとすぐ寝ていた娘も、最近は景色をよく見ている(大きな木を裏側から見るのが好き。木漏れ日がいいのだろうか?)。

ひらがなが好きなようなので「あいうえおの本」を買ってみたところ、ものすごくお気に入りの本になった。大興奮で、何時間読んでいても手足をバタバタさせている。

あいうえおの本 (安野光雅の絵本)

あいうえおの本 (安野光雅の絵本)

自分も読んでいて楽しい。何回読んでも飽きない。あいうえおがどうというより、絵がきれいで、本当によく考えられていて、すばらしい。どうやら、他の絵本もひらがなに興味があって見ていたわけではなく、単純な幾何学模様のようなものではなく、複雑な模様が好きなようである(「スイミー」も好きなようだ)。

そういえば、先日言語処理学会20周年記念論文賞が発表され、以下の2編が選ばれたそうだ。

どちらも述語項構造解析に関する研究で、かたや辞書、かたやコーパスの話。こういう基盤の技術やリソースは重要なのである(一方、なかなか国際会議では評価されないので、こうやって日本の学会でオーソライズする意味がある)。

ryu-i さんの論文は自分も共著者に名を連ねていて、事態性名詞のアノテーションに関する部分を担当したが、NAIST松本研に入学したその月に、右も左も分からない中、アルバイト代をもらえるということで始めた(夏休みまでは、これが修士論文になると思っておらず、自分で研究テーマを模索していた)のだが、いま考えると大変贅沢な環境で、事例を見て議論し、アノテーションして議論し、解析器を作って解析してみて議論し、というような自然言語処理の研究のイロハを教えていただいたように思う。

辞書もコーパスもないタスクだったので、辞書を作るべきかコーパスを作るべきか、解析も機械学習を使うかどうか、などいろいろな選択肢がありえて、結局2年間で(その当時の実力でできることは)全て試したので、振り返ってみると、とても多くのことを学ばせてもらったものである。やっている最中は、そんなことは全く思っていなかったが……。

松本先生や乾先生などスタッフが超一流なのはもちろんのこと、松本研のすごいところは学生の層(OB/OGの層も)が厚いことである(入学直後は、当時D2だった ryu-i さんのことを、あまりに研究能力があったのでスタッフだと思っていた)。自分も ryu-i さんがいなかったら博士後期課程に進学せず就職していたかもしれないが、大学院で自然言語処理の門を叩き、乾先生がミーティングでおっしゃることがよく分からなくても、あとで夜な夜なご飯を食べているときに ryu-i さんが意図を教えてくださったりと「翻訳」してくださったことがとても大きかった。自然言語処理に入門したばかりの人は、そういう「通訳」してくれる人がいないと、言われていることがほとんど分からないので、独習が難しい分野だなと思うのである。(「のれん分け」のような形で研究室を作るときも、教員以外のメンバーが1人でもいるかどうかで大きく違うのだな、と今になって思う)

自分も修士の学生を分野外から受け入れることができるので、自分が松本研で気長に育ててもらったように、時間をかけて勉強できる環境を作っていきたい。遠回りに見えるかもしれないが、最初は英語や数学、プログラミング(アルゴリズムやデータ構造)の基礎や論文・ソースコードの探し方・読み方からじっくり勉強していくのが、実は近道なのではないかと思っている。それぞれ、既にできる学生には申し訳ないが、復習するのも悪くないし、できる人が得意なところをお互い教え合ってもらうのが一番なので、教わる立場から教える立場になる練習も兼ねて、コツコツと勉強会をしているところである。