NAIST サイエンスフェスティバル 2010 春: ウェブを対象にした自然言語処理研究をしたい場合には

NAIST サイエンスフェスティバルのために奈良に帰ってきた。今回のお仕事は(最後の) NAIST 学生ツアーガイド。以前もやったことがあるのだが、そのときは NAIST ジーニアスという少し恥ずかしい名前だったので、ガイドくらいなら順当である。

午前10:30と午後1:10から1時間くらいかけて3つの研究室を回るのだが、自分は自然言語処理学講座インタラクティブメディア設計学講座贈情報処理学講座の3つを担当。

午前中は人が来ないだろうとたかをくくっていたら、蓋を開けてみると9人集まり、びっくり。最初は松本研から回るのだが、みなさん熱心に聞いてらっしゃる。受験生もいれば、近隣の一般の人もいれば、という感じ。id:masayua さんが全体でどういう研究をしているか話し、kmurakami さんが言論マッププロジェクトについて話す。kmurakami さんかっこいいですな〜

残りの2つの研究室は画像系の研究室なのだが、デモを見させてもらってすごいなと思う。自然言語処理は画像と比べるとどうしてもデモが見劣りしてしまう。デモのために研究をしているわけでもないのだが、分野外の人に内容を分かってもらう努力は必要。

結局心配だった学内プロジェクトのほうは [http://twitter.com/tettsyun:title=@tettsyun] くんが [http://twitter.com/rytktur:title=@rytktur] くんを一日手伝ってあげていたようで、デモも説明も大変だったようだが、無事終わったようである。急遽手伝ってあげた @tettsyun くん偉い! 

午後のツアーは午前と打って変わって1人だけ。ぼちぼち人が来ているので、そちらの人たちの混じって聞いてもらったりした。matuyosi さんが言論マップについて解説していたのだが、学生から「この研究は乾先生が中心になって進めているプロジェクトだと思いますが、さ来年度に入学するとしてたとえばこういう研究をしたかったらどうすればいいですか?」という質問が出たりして、乾先生が東北大に行く(行った)という話が受験生の人たちにまで伝わっているのか、と少しびっくり。(真剣な受験生ならある程度情報収集はしているのかもしれないが)

ひとまず2010年度はまだ kmurakami さんも matuyosi さんもいるし、言論マップ系の研究も盛んだとは思うが、それ以降はどうなるんだろうなぁ。matuyosi さんは「乾先生は東北大に行ったので、こういう研究をしたいなら東北大に進学したほうがいいでしょうね」とおっしゃっていたが、いずれにせよ言論マッププロジェクトの予算が2010年度で切れるので、東北大に進学したからといってウェブを題材にしたこういうテーマの研究プロジェクトが立ち上がっているとは限らないだろうし、なかなか難しいところである。ひとまずウェブを離れて考えると、乾研究室は修士の2年間で自然言語処理の基礎(どのように問題を設計するか、コーパスにタグづけするか、辞書を構築するか、などなど)を叩き込んでくれるので、自然言語処理の研究をしたいのであれば、間違いなくお勧めの研究室である(いま学部3回生で大学院では自然言語処理をやろうと思っている人は選択肢の一つに加えてみてはいかが)。

一つ思うのは、自然言語処理を標榜する研究室である以上、ウェブのデータは無視できないものなので、研究室のスタッフの人たちがウェブのデータを好きであるかどうかに関わらず、ウェブのデータを用いた研究は恐らく可能(というかある程度はやらざるを得ない)だし、「ウェブかどうか」という軸で判断するよりは、「言語処理的なアプローチを取りたいかどうか」で判断したほうがいい。もっとも、自然言語処理の研究室はデータマイニング機械学習分野の研究もしていたりするので、必ずしも言語に関係することをやらないといけないということではないし、最初から「自然言語処理には興味ありません」と宣言して入学してくる人もいるし、最終的な決め手はオープンキャンパスに行ったときの雰囲気とか、先生と話したときの感触とか、自分の直観ではないかなとも思う。

途中 @kur さんが遊びに来てくれたり @aprikipさんが遊びに来てくれたり、そういう意味でもなごやかな1日であった。