基礎を学んでいるのは実は教える側

朝、T社の方々5名が来訪。セミナー室・会議室というのの予約方法を理解してきたので、朝8時〜12時の予定でセミナー室を予約してみたのだが (会議室がいっぱいだったので)、セミナー室は会議用のレイアウトになっていないので、プロジェクターがよく見えるように机を組み替えたり。後で指摘されて気がついたが、変なレイアウトにするとどこが上座でどこが下座かよく分からないことになるので、無難に最初から会議室にしておいたほうがよかったかもしれない……。

研究紹介やディスカッションをしていたらちょっと遅れてしまって申し訳なかったが、11時過ぎから研究室内のプログラミングチュートリアルGraham さんの作ったチュートリアルの0回目の答え合わせと、1回目の1-gram 言語モデルの解説。0回目の演習は入力テキストファイル中の単語の出現頻度と語彙数を計算するものだったのだが、みんな1-2時間程度でサクッと書いてきてくれたようで、一安心。サンプルの疑似コードには書かれていなかったが、空白文字で split するだけだとピリオドやカンマが前の単語にくっついてしまうので、そこを分けるコードを書いてきてくれた人もいて、すばらしい。単にピリオドで切るだけだと Mr. とか省略記号のとき困るし、というわけでトークナイゼーションについても説明したりする。手を動かしてみると、少しずつこうやって知識が増えていくのだろう。

あと、1-gram 言語モデルの説明をしていて、「エントロピーって情報理論の授業で習ったのですが、いまいちよく分からないので、もう一度説明してもらえませんか」とのリクエストがあったので、たまたまいまやっている情報理論の授業のスライドを使って説明。自分自身、こうやって言語処理の文脈の中で個々の基礎的な事項の確認ができて、大変勉強になる (恥ずかしながら、授業で担当する前は、突然「エントロピーって何ですか」と聞かれても、ざっくりとしか説明できなかっただろう)。「教える側は教わる側より多く学ぶ」とは自分が教職の科目を履修していたときに聞いてからずっと心に残っている言葉なのだが、誰かに教えるというのはとても効果が高い学習方法なのだと思う。

午後は八王子〜新横浜経由で奈良に移動。新幹線車内で自然言語処理の20年シンポジウムのスライドを作成したり。思えば NAIST に来てからもう8年、3年一つのところにいるとどこかに行きたくなる自分としては、だいぶ長い間奈良にいたものである。ほんの1カ月前までは奈良にいたはずなのだが、だいぶ時間が経っているような気がする。NAIST に入学した当初もそうだったが、あまりに新しいことがたくさんあると、本当に全てが新鮮で楽しく思えて、あっという間に時が過ぎてしまうのかもしれない。