言語についての知識が活かせる自然言語処理

連日車で通勤するとしんどい。今日からはまた平常通り電車に戻る。通勤時間が1時間かかるのはいただけないが、全部車を運転するのと20分だけ車だと、後者のほうが圧倒的によい。3月に引っ越すことになると思うが、職場までドアツードアで40分以内、可能であれば20〜30分程度を目指したい。

午前中はCJE++で進捗報告。人数が多いので、進捗報告の対象者数も増えてしまったらしい。[twitter:@mulgray] くんの進捗報告のあと、Kevin さんとランキング学習について少し話す。なぜトーナメントモデル (ペアワイズで比較する手法) が強いのか、という話で、トーナメントモデルは何回も試合を繰り返して最終的な候補を決定するので、非線形なモデルを学習することができるからでは、という話、なるほど!と納得。実際、逆に言うと、係り受けの有無でここまで違うのは、非線形性をどのようにモデルに入れていくことが大事、ということだろうか。deep learning とか……(汗)

昼を挟んで共同研究のミーティング。着実に成果が出そうな (論文が書きやすい) テーマにするか、それよりチャレンジングなテーマにするか、悩ましいのであるが、まだ時間はあるのでチャレンジしてもいいんじゃないかと思ったりする。

午後は研究室の全体ゼミ。去年の秋に来た budi-i さんと xiaoyi-w さんの所信表明。最初の研究発表は、実験結果がなくてもやりたいことを話せるので、けっこうおもしろい。段々と、実験結果がないと話せなくなっていくし……。

学生全員が揃ったので、松本先生から来年度についてのアナウンス。こうやって研究室のメンバー全員で集まるのも、今年度はあと片手で数えるくらいしかないのである。いろいろあるようだが、きっとなんとかなるだろう。

合間合間でスプリングセミナー2013の準備。今年も受付担当なので、ウェブサイトを準備したり、写真を差し替えたり、メーリングリストに流したり。たった2-3日の実習とはいえそこそこ教員とTAの負荷は高いのだが、教えることで学ぶこともとても多いので、こういう機会があるのはよいことだと思う (年に1回でいいと思うが……)。ちなみに松本研は去年と同じ実習テーマで、

  • テーマ: 英語作文における前置詞誤りの検出
  • 概要: 英語を書くときどのような前置詞を書けばいいのか迷った経験はありませんか?言語処理技術を用いて、前置詞の誤りの自動検出に挑戦してみましょう。
  • 受け入れ条件: Basic Python programming and English skills.

である。興味のある人はどうぞ。TA が手伝ってくれるので、人文系の人でもOK。実際去年は人文系の人と半々だったかな?人文系の人の方が、最終的には精度も高く、なるほどと思うようなシステムを作っていたような気がする。必ずしもプログラミングができるからといって結果につながらないというのは、やっぱり自然言語処理特有なのであろう。

夜は Kevin さん、[twitter:@haplotyper] さん、tetsuo-s くんの4人で高の原へ。Kevin さんは帰宅したが、残りの3人で夕ご飯。松本研でも言語学に関する勉強会や輪読会が昔はあったのだが、最近は言語自体に興味のある人が急速に減っていて、ここ5年くらいそういう研究をしている人がいないという話をする。自然言語処理が流行っているとはいうが、言語からの興味というよりは、アプリケーションがたまたまあるから注目されているだけで、言語の側から見るとむしろ後退していたりするのかもしれない。