翻訳できなくてもいいじゃないか、人間だもの

午前3時からメール処理など。メーリングリストの宛先を携帯電話にしている人は、もしかしたら起きてしまうんじゃないかと思わなくもないのだが、そういう場合は携帯ではないメールアドレスに変更してくれるだろうし、あまり気にしないことにする。(情報系の学生だから、なんとかなるだろう)

午前中は自然言語処理の基礎勉強会(SLP)で、とうとう4章のNグラムに突入。たぶん夏休み前は4章でおしまいだろう。NAIST松本研と同じスタイルで読んでいるはずなのだが、松本研より回数も時間も多いはずなのに、松本研のほうが(練習問題まで解いているのに)先に進んでいるのはなんでなんだろうか……。英文読解的にはうちの学生の方が読めている気がする(文法を間違える人はまずおらず、よくあるのは専門用語を専門用語と気づかないで誤読するケース)が、機械的に英語を日本語に置き換えればよい、と思っている人もいるようだ。英文読解の練習でもあるのだが、機械として置き換えるだけなら機械翻訳でいいので、人間としては内容を理解しようとしてほしい(「これはどう訳せばいいんですか」と聞かれるが、訳語の選択が問題ではなく、内容を言葉で説明してくれればよい。なんとなれば、単語は英語のまま説明してもいい)ところ。

お昼は石川研究室と合同の共同研究ミーティング。せっかくM1の人たちが中心になってあれこれやる気になっているのに、研究的にはこうしたほうがいい、なんて興ざめな話をしすぎてしまった気がする。修士論文の研究は研究でしっかりやるだろうし、論文にすることはまず考えず、もっとアプリケーション寄りで自由にやってくれたほうがよいように思った。あとから研究にしようと思っても挽回不可能なことが多いので、この段階から相談に来てくれるのは大変ありがたいのだが、自分のアドバイスのスキルが足りていないので、猛省。

午後は研究会で進捗報告を聞く。さすがにもう7月なので、そろそろみなさん研究色を出してきてほしいところ。サーベイでもいいので、1日1本ペースでがんがん論文を読んでほしい。

中国語の形態素解析に関する進捗報告を聞くと、やっぱり知らないことが多くておもしろい。単語分割の結果を見るだけで楽しめる。この分野で何か新しいことをしたいというのではなく、単なる前処理で、自分がおもしろがっているだけなのだが、なにかできないかな?

研究会にはうちの研究室を受験希望の学部生が見学で来ていたので、研究会のあと、少し雑談。遠路はるばる新幹線で来てくれたそうで(最初は夜行バスの予定だったが、諸事情により変更になった)、お疲れ様である。自然言語処理の研究がしたい、というのは大歓迎だが、東京に来たい、というお話に関しては、どうせこの分野は就職すればほぼ関東なので、わざわざ大学院で東京に来なくていい気もする。あと、首都大は東京と呼ぶにしてはあまり東京でないし、結局平日はほぼ毎日研究室に来るわけで、週1日以下の頻度で都心に行くことが可能、くらいの気持ちだろうか(東京の大学に通っていれば、週3日以上アルバイトできる人、というような案件に応募できるというメリットがありそうだが、うちの研究室では研究室の勉強会が週3〜5日あるし、平日週3日通う必要があるアルバイトは不可能)。

結局地方でちゃんと研究している大学院に進学し、夏期など長期のインターンシップで住居を提供してもらって関東に来るほうが、コストパフォーマンス等考えるとお得だと思うけど……。1時間半以内で通勤できると、そこから通って、と言われる(首都大のあるあたりはギリギリ1時間半圏内で関東全域に通勤可能)し、地方と比べると家賃も高いので、実家から通学している人でないと、下手に東京に住んでいるとインターンシップに行くメリットが逆に薄れそう。

また、博士後期課程の進学希望の院生の人も見学というか相談で来ていたので、少し雑談。この分野で博士後期課程に進学するつもり、というだけで嬉しいので、必ずしも自分の研究室に進学したいという人でなくても相談に乗っているのである。確かに自分の研究室に博士後期課程に行きたいという人が来てくれるといいなと思うのだが、個人的にはどの研究室に行くかはいろいろなパラメータで決まると考えているので、人によっては最適な進学先は異なるだろうし。

あと、M2まで自然言語処理関係の研究をやっていると、研究の話ができて楽しい! しっかり勉強したり、論文をたくさん読んだり、実験したりされているのだろうなと、ほれぼれする。まだうちの研究室の中では研究の話ができない(ようやく一通り勉強が終わりそう?)ので、夏以降こういう話ができる研究室になるといいな、と思うのであった。