セミナーは一人でするものではなくみんなで作るもの

朝から新宿。ここ1-2週間プレッシャーとの戦いで、かなり追い込まれていた。というのも、第4回自然言語処理セミナー「誤り検出・訂正」というチュートリアルを頼まれていて、午前10時から16時半まで (昼休みを除いて) ひたすらセミナーをする、という依頼を引き受けたので、本当に5時間以上も話し続けることができるのか、心配で仕方がなかったからである。

資料の〆切も無理を言って延ばしていただいたりして、なんとか最終的にはスライドを287枚用意したのだが、だいたい学会発表では1枚1分で話すので、300枚近くあっても5時間ぶんだし、足りないのではないかと気が気でなかった。そもそもこれまで一番長く人前で話したのは今年1月のトークの90分 (このときはスライドを133枚用意したが、結局使ったのは20枚くらい) で、ひとつのトピックで5時間話すというのは想像もつかない長さなのである (NAIST のスプリングセミナーでは毎年3時間くらい話しているのだが、トピックは自然言語処理のいろんな話題だし、聞く人が2-3人しかいないので、どちらかというと雑談のような感じ)。

実は同じく NAIST 助教の [twitter:@neubig] さんも第3回自然言語処理セミナー「機械翻訳」をされていて、@neubig さんに至っては10時から16時半までを2日間やる、という途方もない感じで、聞いてみたらスライドは277枚だったそうで、もはや何枚あればいいのか、全く分からない……。

開始30分前に会場に行くと、今回お声がけいただいた内元さんに出迎えてもらい、スライド機器の設定をお手伝いいただく。内元さんからご依頼いただいたときはまだ異動の話も存在していなかったし、引っ越しと日程が被るとは全く予想していなかったので、気軽に引き受けた (前も書いたが、自分は頼まれたら1回は引き受けることにしている) のだが、こんなことになるとは……。

このセミナー、かれこれここ4-5年やっているそうで、定員は60人らしいのだが、毎回30-40人の登録があるところ、今回だけ70人の登録があり、申し込みを締め切った、と聞いてさらにびびる。登録して来ない人も多いので満席になることはないでしょうが、ということだったが、他の方々が人の集まりそうなトピック (機械翻訳以外にも、ソーシャルメディアの解析や基盤技術は関心が高そう) をやってらっしゃるし、時期的にも年度末の忙しい時期なので、むしろ少ないのではないかと想像していたのである。

続々と人が集まってきたので心中穏やかではなかったが、結局全体で30人ほどの方々がお見えになったようで、3人がけの机に2人で坐って全部の机がほぼ埋まるくらいだったので、人数的にはちょうどよかったかもしれない。会場の方々に挙手でアンケートを取ってみたところ、半分くらいが学生で、残り半分は社会人。研究をメインにされている方 (学生含む) も半分程度。学校あるいは職場で研究に関するプログラミングをする方は1/3くらいだそうだ。年齢層はバラバラで、20代から60代くらいに見える人まで同じくらいいらっしゃる。男女比は (よく思い出せないが) 4:1 くらいであったように思う。Mac を使っていた人も、2割くらい。

午前中は10時から12時半までで、タスクの概要と [twitter:@tomo_wb] くんの統計的機械翻訳を用いた誤り訂正、そして [twitter:@keiskS] くんのスペル誤り訂正と品詞付与の同時解析の研究の話をする。前半部分はもっとチュートリアルっぽく、基礎的なことを話そうかと思っていたのだが、他のセミナーの方々が割合丁寧にやってらっしゃるので、全部のセミナーに出ている人は同じような話を何回も聞くのは飽きるだろうからと、今回は最先端の話を中心に、アラカルトでいろんなタスクの話をすることにしたのである。自分がやっていない研究の話をするのは非常に苦しい、というのもあるが……(そもそも誤り検出・訂正は自分が手を動かした部分はほとんどなく、一緒にやってきた学生の人たちの研究成果ばかりだが……)

時間配分に関しては、マニアックなトピック (このテーマで5時間も話せるのか、みたいな) だったのでヒヤヒヤしていたが、30分 (1つの話題) 話すごとに QA タイムを入れたところ、会場から次から次に質問があり、とてもありがたかった。それぞれの質問も、毎回いろんな方がしてくださって、大変刺激的であった (仕事で言語処理研究をしている人、開発をしている人、学生の人などいろんな立場の方々から)。スライドではこちらが用意した話題中心になってしまい、重要でも忘れている話題があったりするので、本当にいろんな質問があってよかった。トークをするからには自分が持っていることを最大限お伝えしたいと思うのだが、今回の QA タイムでは「この質問がなかったらこの話はできなかった」ということに何回も気がつくことができたのである。

一区切りして、お昼休みを1時間挟んで13時半から再開。[twitter:@tuxedocat_tw] くんが NAIST のスプリングセミナー用に用意してくれた 英語前置詞誤り訂正演習 をみなさんにやっていただく。誤り訂正のツールを使うような演習を期待されていたような気がしなくもないのだが、終わってみるとそういうツールの裏側がどうなっているのか見てもらえてよかったのかなと思った。(ちんぷんかんぷんの人もいたかもしれないが、質問しやすい雰囲気だったせいか、いろいろ聞いてもらえて、詳しく説明することができて、どんな感じで実際の訂正が行われているのか、実際に作るとしたらどういうことをする必要があるのか、分かってもらえたかなと思う)

演習が一段落してから、@tuxedocat_tw くんの動詞選択誤り検出・推薦に関する研究を紹介。それぞれの研究の配置 (順番) はそれなりに考えたので、みなさん「こういう研究はないんですか」と質問してくださると「いい着眼点ですね、それはちょうど次にお話しします!」と答えることができて、嬉しい感じであった (笑)

午後のセミナーは3時間あったので、10分休憩を挟んで [twitter:@pavlocat] くんの時制誤り検出・訂正の話を紹介。これもいろいろ質問・コメントがあり、大変興味深い。どういう質問があったのかまとめておきたいのだが、あまりに多すぎて (5時間のトークで30件以上あったような?) 思い出せない……。英語学習者支援という文脈で、なにがこれまで取り組まれてきてなにが未解決問題か、ということをたっぷりお話できたので、個人的には大満足である。

最後、日本語学習者の誤り訂正・検出に向けて、というわけで [twitter:@tkyf_7] くんの日本語学習者の作文の形態素解析についての研究を紹介。時間が30分くらいしか残っていなかったので駆け足になってしまったが、質問の数と内容は、説明に時間をかけた英語学習者の誤り検出・訂正と比較しても引けを取らない感じである。もう少し時間を割いていくつかの話題を話してもよかったかもしれない (ちゃんとくんの話もすればよかったんじゃないでしょうか、と、セミナー後に質問に来られた学生の方からもコメントいただいたし、今回 hiromi-o さんとやっている NAIST 誤用コーパスの話はほとんどできなかった)。あと、誤り検出・訂正ワークショップを開催した知見についても時間があったら話そうかと考えていたのだが、こちらは時間がなかったので割愛。時間配分については検討の余地がある。(ただ、毎回こんなにみなさんが熱心に質問してくれるとは限らないので、かかる時間を予測するのは難しい)

最後質問を全部受け終わったのは17時過ぎ。疲れたけど、なんだか爽快感がある。セミナーが始まる前は「一人でこんなに話せない、どうしよう」とナーバスになっていたのだが、終わってみると、自分一人でやっていることなんてなにもなくて、それぞれの話は上に挙げたような (彼らだけではないが) 学生の人たちが一生懸命研究してくれた成果であるし、セミナー自身もこんなに活発に質問・コメントしてくださる方々がいなければ成り立たなかったし、一人でやると思っていた自分が間違いだった。セミナーをする機会をくださった ALAGIN の方々はもとより、一緒に研究してきた人たち、そして参加してくださった受講者の方々みなさんに感謝の気持ちでいっぱいである。こういう経験は、なかなかできるものではないので、研究者冥利に尽きる幸せなことである。別れ際内元さんから「このセミナー、基本的に2回セットでお願いしているので、来年もできたらお願いしたいです」と言われて、一瞬フリーズしたのであるが……。(あと、もらいものの資料が多いので、ウェブで資料の再配布はできない……。)

今週一番タフな用事が終わった開放感から、お腹が空いたので 新宿サザンタワーのエルトリートというメキシコ料理屋さんで夕食。たまたま入ったのだが、安くてボリュームがあっておいしい。デザートと食後のコーヒーつきのコースでお腹いっぱい食べて、お酒も飲んで、1人3,000円。お腹普通だったらアラカルトで頼んでお酒飲んでも2,000円くらいで済むんじゃなかろうか……。並んでまで入ろうとは思わないが (時間帯によっては予約していないと難しいらしいことを後で知る)、空いていたらまた来てもいいな〜。