IJCNLP 2011 本会議1日目: 日本語の研究だから通じないということはない


写真は会場近くのコンビニ、セブンイレブン (チェンマイに至る所にある) で買ったサントリーの「DAKARA」の現地味。確かアセロラ味だったかと思うが、イチゴの絞り汁を限りなく薄くしたような味で微妙だった。

朝からオープニングセッション。朝食に行くと、松本先生と [twitter:@shirayu] くん、[twitter:@Wildkatze] くんがいたので同席させてもらう。NAIST 勢は結局全員無事着いたらしい。(自分以外全員バンコク経由だったが、遅延などもなかったそうで)

朝イチのセッションは中国の検索エンジン会社、百度の人の基調講演だったが、内部の技術的な話はほとんどなく、あまりおもしろくなかった。Web API を20,000ほど提供しているというのと、検索ボックスから入力するのと比べて API 経由でのアクセスが全体のアクセスの30%を占める、というような統計は興味深かったが、もっと技術的な話をしてもらうか、完全に技術から離れた話にするか、どちらかにしてほしい。

初日の午前中は機械翻訳のセッションに出る。全部の発表が翻訳の前処理としての並べ替えに関するものだったのだが、セッションのタイトルは "MT I" のような大きなくくりではなく、今年6月の ACL のように、"MT: Reordering" のようにテーマ名を書いてくれると分かりやすいのだけどな〜。(でも今回の会議はセッション名に "Other NLP Techniques" のような投げやりなものもあったので、そこまでまとめることができないくらい多種多様だったのだろう)

午後から共著の発表が3件あったので、たまたま並ばずにすぐ入手できたカオサイという現地のカレーヌードルをいただく。これはおいしい。(結局滞在中このときしか食べなかったのだが、いま考えるともっと食べればよかった) そしてランチの時間に [twitter:@tomo_wb] くんの最後の発表練習につき合う (かわいそうなことに、@tomo_wb くんはこの日ランチは食べられなかった)。体調も悪い中、発表できるかどうかも心配だったが、なんとか発表はできそうでよかった。(なんとなれば自分が代わりにするつもりだったので)

自分の Macbook Air をつないで発表できるかと思いきや、会場に用意されたノート PC にファイルを移動してくれと言われて手間取ったが、なんとか準備完了。隣の部屋で、同じ時間に発表することになっていた [twitter:@shirayu] くんのほうは、どうやら会場のノート PC で2画面モードにすることに手間取り、結局自分の PC をつないでもいいことになったようだ。それなら最初からそうなっていればいいのに……

@tomo_wb くんの発表、iPad に原稿が書いてあったそうで、iPad を手にもって前を向いてくれればもっと聞きやすかっただろうが、よくよく考えてみると iPad 1 はかなり重たいので、20分ずっと持っているのはしんどいな、と思ったり……。日本人でスライドを使って発表する人全員に言いたいのだが、聞きにくる人はあなたのおしりや背中を見に来ているのではないので、少なくとも話すときは聴衆に身体を向けないように意識したほうがよい (全国大会などでありがちなのは「スライドに向けて語りかける人」国際会議でありがちなのは「原稿に向けて語りかける人」で、どちらも聞きに来ている人に向けて話していない)。

「声に出して読みたい日本語」など著書をいろいろ出されている斎藤孝先生の教職の授業を取ったことがあるのだが、授業をするときは、ずっとでなくていいので、一人一人アイコンタクトをするように、と繰り返し言っていた。90分授業があって100人学生がいたら、1分に1人以上アイコンタクトをすれば全員とアイコンタクトできるし、「目と目を合わせよう」と意識していると、自然と身体が前を向く、と。90分の中の一瞬でも、「この人は自分に向けて話しかけてくれた」という気持ちになれると、聞いている人はポジティブな気持ちになるらしい。これも言うは易く行うは難しで、聞いている人全員と目を合わせようと意識しても、自分も特定の一人一人を見て顔を確認したりできず聴衆一帯を漠然と眺めるくらいしかできなかったりすることもあるのだが、意識して繰り返し実践するしかないのかなと思う。

@shirayu くんの発表は質疑もたくさん出て、日本語の述語項構造解析というテーマでどこまで聴衆に伝わるか分からなかったが、ポイントは伝わったようでよかった。

コーヒーブレイクを挟んで teruaki-o くんの発表。こちらは明治時代の文語文の濁点の自動付与というタスクで、日本語ネイティブの人でも「それにどんな意味があるのですか」という質問がときどき来る中、海外の人を含めて今回共著で発表した中でもっとも反響が大きかった発表で、自分でも意外で光栄だった。木田さんからも「たとえば現代語でも iPhone なんかだと濁点を入れないで入力したいことありますよね。「たくてん」で「濁点」を変換候補に入れるようなの。そういうのに応用できそうですよね」とコメントいただいて、確かにそうだなぁとはっとする。古文という文脈だけで考えていると、テキストの集合も (多かれ少なかれ) 有限なので適用範囲が狭いように見えるが、少し視点を変えると現代にも通じる共通した手法であるということで。teruaki-o くんの次の発表の人がキャンセルになったので、25分間待機時間があったのだが、次から次に海外の方々からの teruaki-o くんの発表に関する質問が来ておもしろかった (笑)

夕方はレセプションとポスターセッション。レセプションの最中に雨が降ってきて、散々。建物の中に入って雨宿りしていると、辻井先生がぷらぷらしていたので、先ほどの @tomo_wb くんの発表でいただいた2つの質問に補足したり。辻井先生自身はいま我々が取り組んでいる日本語学習者支援の話、おもしろく聞いてくださっているようだが、日本語学習者より英語学習者のほうが世界的には多いので、英語学習者の支援にも取り組んでほしい、とのこと。これは [twitter:@keiskS] くんにもがんばっていただかないと (笑)

ポスターセッション自身は早々と切り上げる人もいて微妙な感じで収束。3時間もポスターで拘束した上、隣で大音量の演奏や踊りをされてはたまったものではないと思う。今回の国際会議、ポスターの人はかわいそうだったなぁ。

結局ポスター発表の人はレセプションでほとんど食べられなかったこともあり、席を移動して食べ直し。今日到着したという [twitter:@zzzelch] さんも合流して、[twitter:@Wildkatze] くんと H 鳥さんのお疲れさま会。

@Wildkatze くん曰く、この店はメニューがおもしろい、ということで、メニューをみなさんで検分。英語メニューの後ろに日本語メニューを発見。

「かき からい すっぱいサラダ。」このあたりはよいが「まなかつよ にんにくあげる。」はかつおのことだろうか。「野菜 炒 め。」のようにどうも形態素解析に失敗している (でも翻訳したらこうはなよないような……) 事例や、発音の間違いとの複合技「はちみす あひる焼 き。」などもある。よくよく考えてみると、空港でも "putyourshoes" みたいに複数の単語がつながっている表現を見かけたりしたのだが、単語の分かち書きに関してタイ語が独特で、必ずしも発音される順番に子音や母音が書かれるわけではないらしく (複雑)、他の言語でも分かち書きのポイントがずれているのかもしれない。

お疲れさま会、[twitter:@uchumik] さん、[twitter:@nokuno] さん、[twitter:@tkng] さん、[twitter:@odessa_mydns_jp] さんというなにやら某社の同窓会的な面々ではあるが、あやしい日本語メニューを見て形態素解析IMEネタで盛り上がったり、「ビール7個」と注文してビール瓶が7本出てきてびっくりしたり、いろいろと楽しかった。

夕食後、部屋に移動して @odessa_mydns_jp さんと @uchumik さんとで翌日の打ち合わせ。さすがに発表前日になると大きくスライドはいじらないほうがよいので、細かい修正ばかりになるが、@odessa_mydns_jp さんの @uchumik さんのスライドに対するコメントを聞いていて、ああ、こういうふうにするのがいいのか、と非常に勉強になる。さすが。自分ももっとがんばらないと。