基礎勉強から研究につなげるためのステップ

朝、書類の準備。午後紹介する論文を印刷したり。ようやくコピー機の使い方が分かってくる。印刷と同時にホッチキスもしてくれたりして便利。しかし人数に比べてコピー機の台数が少ない気がする。コピー機は事務の人たちと共用だし、リソグラフ (講義資料をコピーできるもの) に至っては学生とも共用だし、教員はそれぞれプリンタや複合機を個人的に購入しているから必要ない、ということなのだろうか。

昼は学部4年生を対象に、大学院の筆記試験免除の説明会。

筆記試験免除制度について説明すると、首都大のシステムデザイン研究科の情報通信システム分野では、一定の基準を満たした学生に対し、英語と数学の試験を免除し、面接だけで合否を判定する制度があるのである。英語の筆記試験と言っても、TOEFLあるいはTOEICのスコアを提出するだけなので、スコアがある人にとっては、実質的に数学が免除になるだけであるが……(そして、複数の大学院への出願を考えている場合は、TOEICあるいはTOEFLのスコアはほぼ確実に持っている)。ただ、筆記試験免除制度を使うには首都大が第一志望であることが前提なので、他の大学院を受験する場合は筆記試験も受ける必要があるらしい。逆に、他の大学から来る場合でも、首都大が第一志望の場合 (合格したら入学を確約する場合) は筆記試験免除の申請ができるそうである。

筆記試験免除判定も絶対的な基準ではなく、相対的な基準だそうで、就職で抜ける人も考慮すると、あまり厳しいわけではないし、免除にならなくても普通に筆記試験を受ければいいだけなので、どちらかというと内部進学者が外に行くモチベーションを下げる戦略の一つらしい。首都大の大学院に進学してくれる人が減ると大学院としては研究が困難になり、大変になるとは思うのだが、大学院進学の中で他大学への進学と首都大への進学という選択肢で学生を奪い合うというよりは、実態は大学院進学と就職とで競争が起こっているので、取るべき戦略は学生が大学院に行かず就職するモチベーションを下げる (?) ことなのではないかなぁ。もっと言うと、大学院に行くメリット・就職するデメリットをいくら言っても、損得勘定に頼って動いている限りは容易に逆転される可能性があり、そんなこと言わなくても周囲が当然のように大学院に行く環境にしておくほうが、(付和雷同を好む) 日本人的にはよいのではなかろうか。

説明会は学部3年生の講義に使われる部屋を借りて昼休みに行ったのだが、学部3年生がたくさん弁当を食べていたりして、部屋を空けてもらうのにちょっと心苦しい気持ちになる。学部4年生になると研究室に座席をもらえるのだが、学部3年生は授業 (講義や実験) がたくさんある割には固定の席が (日野キャンパスに拠点を持つサークル活動でもしていない限りは) ないようで、講義室が自分たちの部屋みたいな状況になっているらしい……。昼休みにやるにしても、いつも空いている部屋を借りたほうがいいように思った。

午後は研究室の全体ゼミ (研究会)。

  • Feifei Zhai, Jiajun Zhang, Yu Zhou and Chengqing Zong. Machine Translation by Modeling Predicate Argument Structure Transformation. In Proc. of COLING-2012, Mumbai, India, 8-15 December 2012.

を紹介する。述語項構造の対応関係を使って並べ替えを行って機械翻訳をする、という話 (中英)。日英翻訳で似たような研究を修士のときにやったことがあるので、最近はどんな感じの研究があるのかと思って読んでみた。日本語以外にもこういう述語項構造解析 (意味役割付与) 器が利用可能な言語対はあるので、他の言語でどうかというのも興味があった。結論も割合「まあそうだろう」という感じ。もっと統語的な変換が複雑なものが扱えるとよいのだが、複文や重文、態の変換みたいなものも扱えるようにできないかな。

紹介しながら統計的機械翻訳の基礎だとか、述語項構造解析の基礎だとか、動的計画法だとか説明しながら読んだので、1時間半で半分くらい読んで論文は終えたのだが、どうするのが効果的なんだろう。基礎の勉強をみっちりやる必要もあるのだが、勉強ばかりしていても研究に到達しないので、最新の論文で学んでいる (これまで学んできた) ことがどのように使われているのか、というのを知る必要がある (その方が理解も定着する) だろうから、論文の輪読も必須なのだが、やっぱり自分で読まないことにはどうしようもないしなぁ。松本研は、机の上に論文の山がうず高く積まれている人がいたり、国際会議の論文が公開される度に論文読み会が開催されていたりして、そういう意味ではいい環境だったなぁ。うちだけでやっていると規模的に厳しいので、複数の大学の研究室合同で論文読み会をしたりしたほうがいいんだろうか……。

一休みして自然言語処理の基礎勉強会。日本語の教科書としては「自然言語処理の基礎」

自然言語処理の基礎

自然言語処理の基礎

がページ数の割にはそれなりにトピックをカバーしていて、かつ談話理論に関しては多少詳しく書いてあったりと独自性があってよいのだが、分担して輪読するにはあまり向いていなかったため、人工知能学事典の第7章全25項目を読むことにした。1回2項目、1人1項目 (1-2ページ) でやってもらうことにして、どの項目を誰が読むのかは各自相談してもらうことにしたら、先頭から順番に読むことになったらしい。各項目は (事典なので) それぞれ割合独立して読めると思うのだが、最初からのほうが分かりやすいのかもしれない。今回は「言語資源」と「形態素解析と品詞タグづけ」。説明用のスライドを作ってきてくれたり、結構気合いが入っていてすばらしい。全部で13回やれば読み終わるので、夏休み前には一通り基礎が終わる計算である。

勉強会のあと、先日公募が始まった未踏IT人材発掘・育成事業の紹介をしてみたり。首都大のいろんな学年の学生に「未踏って聞いたことある?」と質問してみたところ、1割も知っている人がいなくてびっくりしたのだが、なにか作りたいソフトがある人を支援するという制度で、25歳未満が対象なのであるが、1年弱時給1,600円で好きなソフトが書けると思えば下手なバイトをするよりお得だし、採択率は20%前後なので何回か応募すればどこかで通る可能性も高いし、アイデアがある人は、B4、M1、M2と3回くらい挑戦してみるといいんじゃないかなぁ。

夕方は研究費の報告書作成 (今日が〆切)。次の〆切は来月だが……