松本研究室の手引き2008

昨日は eric-n さんが新入生に向けた勉強会を企画していたそうだが、新入生が誰も来なかったので流れたらしい。(それもそのはず、まだ新入生の配属が決まっていない)

正式な配属がいつかは知らないのだが、たぶん木曜日の教授会で決まるので早くとも金曜日、例年通りなら月曜日に配属決まるのではないかな? 確か正式配属決定の日の夕方に全員 M1 は研究室に集合し、簡単な歓迎会をしていた気がする。それが毎年月曜日だったような、と思ったのだが、2005年は月曜2006年は火曜2007年は水曜日のようだ。最初自分たちの年が月曜日だったから月曜日の印象が強かっただけか……。

それで昔書いた松本研究室の手引きという文書を発掘した。NAIST に入ってから修士の2年間の生活について時系列で紹介。というか、たぶんこういうまとめ方でなくて、自然言語処理の研究を始めてから最初のジャーナルを通すところまで、という1サイクルで書いたほうがいいんだろうな、と最近では思うのだが(というのもこのサイクルが速い人もいれば遅い人もいるし、情報系でも研究室によっては全然サイクル周期が違って比較できないので)、書き直すほどの気力がないので他の人におまかせ。

早朝帰り際 makoto-y くんと立ち話。卒業後どうするかね~みたいな話をする。情報科学研究科1Fの自販機、4月23日までなぜか謝恩セールと銘打って50円で使えるらしいので、100円のコーヒーを飲んでみた。最近研究室でもお茶を飲むのは(利尿作用があるし、カフェインも入っているしで)控えていて、健康マニアのゆうちゃんがしていたようにお白湯を飲んでいたりするのだが、ときどき濃い味のものも飲んでみたくなる。ジャンキー

ChaIME で次の入力を入れると自動確定になる機能が有効になっていなかったので、修正。あとインタフェース的には文節モードと制約つき解析入れるといいんだろうか。前者はあまり気が進まないが、後者はまあできそうである。

仮名漢字モデル、いまは毎日新聞13年分から取っているのだが、どうもこれはコーパスとして少ないようなので、これも Google 日本語 N グラムから計算したほうがいいんだろうか。