これまでのNL研と今後のNL研

近鉄に乗るのが1本遅れてしまい、乗るはずだった新幹線を乗り逃す。いや、本当はエクスプレス予約で変更すればよかったのだが、雪で名古屋到着が20分遅れているとウェブに書いてあって、京都に数分遅れで着いても大丈夫じゃないか、と思って行ったら、すでに出ていた後だった、というわけだが……。

ちなみに iOS 4.2 になってから「Rapidy」も「EX 予約」も新規予約はできるものの、予約の変更ができなくなってしまった問題だが、どうも iOS 4.2 の制限によるものらしい。Mobile Safari のメモリ制限が厳しくなり、かつエクスプレス予約のサイトが変態的なので起きる問題だとか。Opera Mini を使うと予約変更できると聞き、試してみたところ確かに Opera Mini だと変更できるので、困っている人は Opera Mini を使うと幸せになれるかも。

iOS 4.3 のリリースがそろそろのようだが、iOS 4.3 で直っていたとしても、自分の iPhone 3G では iOS 4.3 はサポートされているかどうか分からないし、今年の4月で買ってから2年だし、そろそろ買い替え時期かなぁ。ちなみに iPhone 3G 白なので、本体にヒビがたくさん入っているという……(でも Apple Care にも入っておらず、気がついたのが保証期間切れてからなので、どうしようもない)

目的の新幹線に乗れなくても後続する新幹線の自由席には乗れるだろう、と思ってのぞみの自由席に乗っていたら、特急券のチェックで「IC 早特の場合は予約した便に限り有効なので、乗車券分は有効ですが、特急券は買い直していただくことになります」と言われて4,410円払うことに……。えー、そんな殺生な、と思ったが、利用既約にでかでかと書いてあるので、そういうものらしい。乗車券まで向こうにならなかっただけましだと思い、泣く泣く払う。次からは乗り遅れたらちゃんと変更しよう……。

気を取り直して新横浜で下車し、町田経由で成城学園前へ。情報処理学会 第200回自然言語処理研究会(NL研)・第101回情報基礎とアクセス技術研究会(IFAT) 合同研究発表会に参加するためである。場所はNHK技術研究所だったのだが、ここは奈良先端大に入学する直前、奈良だと運転免許がないとまずいだろう、と思って免許の教習所に通っていたので、懐かしい。最初は成城学園前から送迎バスを使っていたのだが、豪徳寺から自転車で30分くらいで行けることを知ってからはもっぱら自転車で通っていた。

奈良で車をもらってからもしばらく怖くて運転できなかったのは、三軒茶屋あたりで路上教習することが多く、ばんばん人が飛び出して来るので怖い、という印象が運転にあったためだが、実際運転するようになってみると、奈良先端大の周辺はほとんど人が歩いていないので、全然怖くないのであった (笑)

さて、聞きたかったのは研究会の歴代主査の人たちが一同に介したパネル討論。奈良先端大から松本先生、北陸先端大から島津先生、東大から中川先生、慶応大から岸田先生(こちらはIFATの元主査)当日のログは @shuyoさんがまとめてくださったNL研 #signl200 まとめ(その2)が詳しい (@shuyo さんありがとうございます!)が、論点をまとめると

  1. ここ30年の自然言語処理がどう歩んできて、これからどういう方向に進んで行けばよいか。
  2. NL研は最近発表者数が少ないが、なぜか。また、NL研を魅力的なものにするにはどうすればいいか。
  3. 日本の自然言語処理のレベルはどうか。NL研は国際的な自然言語処理に貢献できているか。レベルを上げるにはどうすればよいか。

ということ。

個々の先生方がどのような発言をされたかは(自分の編集バイアスがかかっているが)上記のまとめを読んでいただくとして、「これからのNLP」について自分の意見を書くと、これからは応用が重要なのは間違いないので、具体的な応用を見据えた研究をするとよいと思う。

そう書くと「大学は応用なんてこと言わないで、基盤技術をやってほしい」と思う人もいるのだろうが、これまで自然言語処理は「使えそうだけど使えない」技術の代表格だったようで、最近使われ出しているのがむしろ珍しい話であり、統計的手法(機械学習)がブレイクしたのがたまたまだったんじゃないかと思う。むしろ、なんでもかんでも機械学習に走ってしまうほうが「言語」処理としては憂うべきことであり、学生も含めちゃんと実データを見て問題を分析することが大事かなと。

別の方向性から言うと、自然言語処理を使う人を育てるのと、自然言語処理(たとえば形態素解析器)を作る人を育てるのと、両方とも重要で、片方だけでは言語処理の未来は暗いだろう、ということ。「自然言語処理を作る」というのは、コーパスを作る人、辞書を作る人、解析器を作る人、などなどを含む。どれが欠けてもだめで、いまはどちらかというと自然言語処理を使う人が増えつつあるので、需要が産まれていることを喜びつつ、地道にリソースやツール・ライブラリを作れる人を養成しましょう、と。

これもこう書くと、「じゃあ世の中で必要な自然言語処理って形態素解析が90%だから、形態素解析器の研究する人を育てればいいんですね」と思う人がいるかもしれないが、そういうことではない。個々の学生や若手エンジニアは、それぞれその場その場でやるべきこと・やりたいことをやってもらうのがよいと思うし、そういう環境を用意できることが大切だと思うが、それと同時に「この分野のテキストをうまく分かち書きできる形態素解析器作ってほしいんだけど」と言われたら、さくっと作ってしまえるくらいの実力をつけましょう、ということ。

もちろん頑健性やコードの保守性、速度・メモリの使用量など、しっかり使えるものを作るのは大変なのだろうが、自分でそこに手を入れられない(と思っている)状況でただ「使うだけ」というのと、動作を理解して使うというのとはけっこう違うんじゃないかな。

あと「NL研の魅力を上げるには」ということについては、たぶんこれはNL研の魅力がなくなったのではなく、言語処理学会の年次大会が広く認知されてきたので、それ以外の研究会で発表するインセンティブが相対的に減ってしまったのかなと思う。NL研より電子情報通信学会のNLC研究会のほうが先に発表件数の現象にあえいでいると思うのだが、招待講演やチュートリアルを目玉にするとか、全員が同じ宿に泊まり込む形式にするとか、若手の発表を奨励するとか(毎年5月の学生セッションで奨励賞を出したり、9月にNLP若手の会と連続開催するのはそういう意義もある)、言語処理学会と別の色を出していくという方向性がよいと思う。(あるいは似た研究会を全部マージする、という手も考えられるが、それは「そもそも魅力を上げる必要ないんじゃない?」というようなちゃぶ台返しに近い)

最後の「日本のNLPがこの先生きのこるには」問題については、どうするべきかよく分からない。世界的に日本の自然言語処理のプレゼンスが低いのは事実だが、これは必ずしも自然言語処理だけの問題ではなく、人工知能、もっと言うと情報科学全般に言えることであろう。最初から日本国内の研究会や年次大会など相手にせず、直接国際会議のみで発表する人もいるし、活躍されている個々の方々を見ると、日本人だから、とか日本だから、ということはないのだろうと思うのだが……。

ただ、いまウェブへの応用の需要が高く、自然言語処理の研究が精力的にできる修士卒業後数年の人材が、ウェブ系企業に吸収されてしまって、アカデミアで論文を書いたりはしない、というのが現状なのだと感じるし、論文をなんで書かないといけないの? データもあるしコード書いてユーザの役に立てるなら論文書く必要なんてないじゃない? と言われると、自分は反論する気はないし、問題視するべきことかも分からない (アカデミアのことだけ考える人からすると大問題なのだろうが)。

とはいえ、論文を読むだけの人が増え、書く人が育成されないと、巡り巡って読む論文も出なくなってしまうので、なんらかの形で論文の循環サイクルを作らなければ分野全体で閉塞していってしまうのだろうが、修士号取ってエンジニア、あるいは企業の研究所に就職する、という選択肢と、博士前期課程に進学してもらう、という選択肢を比較して、博士後期課程への進学が魅力的に映るようにしないと、どうやっても解決しない問題のように思えるし、博士に進学してもちゃんとやっていけそうな人ほど進学しない、というのは根深い問題だと思う。

一つ方策があるとすると、修士号取得後しばらくエンジニアとして働いた人が課程博士として戻って来ることを奨励する、という道だと思うが、それなりに定収入のある人が仕事を辞めて学生になる、というのはサポートがしっかりしていないと取りづらい選択でもあるし (NAIST も以前は「社会人再チャレンジ制度」と言って社会人経験のある人は通常の授業料免除制度とは別に授業料を全額免除していたが、予算が尽きて制度はなくなってしまったようだ)、日本の社会構造上なかなか難しそうである。あるいは、エンジニアで入社した人のうち、研究に親和性の高い人を研究所配属に転換するとか。そういう柔軟な運用を許容している企業もあるようだが、ウェブ企業は(若手エンジニアに夢を見させないためかどうか分からないが、)研究所への異動はありえないのでそういうことは考えないように、と釘を刺すこともあるようで、それぞれの企業の方針ではあるが、なんとかできないかね、これ。

終了後成城学園前から小田急〜千代田線と乗り継いで根津へ。今日は4度目の正直で根津 釜竹に行く。蕎麦屋かと思ったが、うどん屋だった。しかし予想に反してここおいしい! 先日「根の津」に行ったが、圧倒的に「釜竹」のほうが好みだな〜。ボリュームも相当あるが、釜揚げうどんを待っている間に肴を頼んで酒を飲みつつちびちびやるのもよい。日本酒も「根の津」は「とりあえず讃岐うどんだから四国の酒を用意しました」という感じがミエミエだが、「釜竹」はちゃんとうどんに合うおいしい酒を用意している (20種類くらい揃えていて、今回は「而今」をもらったが、うまいね〜。選ぶのに迷ってしまった……)。店内も無駄に(笑)オシャレだし、一度行ってみるとよいと思う。