何年も継続すると見えてくる

朝5時からメール処理。今日と明日は情報処理学会第232回自然言語処理研究会(NL研)で日中はほとんど何もできないことが分かっているので、朝の時間に仕事をしないと全てが止まるのである。

朝はほぼ朝一で娘を保育園に連れていき、出勤して健康診断。たまたま健康診断の日に研究会がヒットする、というのも運が悪いのだが仕方ない。来年は40歳なので人間ドックに行こうと思っているのだが、今年は職場で受けるのである。健康診断の待ち時間で同じコースの先生方と雑談をするが、深層学習ってどうなんですか、という話を振られたりして、いや〜、やらないと論文通らないのでやりますが、やったからといって通るわけでもないですね、と答えたりする(国際会議の論文という観点では、うちの研究室は深層学習を使っている研究より、使っていない研究の方が通っている)。

お昼は NL 研の運営委員会。現地担当の幹事は会場の設営の他に運営委員会の準備もあるので、当日は色々と忙しい。お弁当の手配について、たまたま検索で出てきたこまちの台所というところにしてみたが、自分の兄弟や親戚がやっているお店ではない。会場の設営も、午前9時から会場を予約してあったのに、冷房を入れてくれるのは午後からだそうで(こちらから学会のスケジュールを伝えたことはないので、わざわざ調べていただいているということは、大変有能であるが)、汗がしたたり落ちる中、照明や動画配信の確認をしたり。

運営委員会ではいつも Skype 参加を受け付けているのだが、今回は新しい MacBook を持って行ったため、USB スピーカーがつながらなかったので、うちだけクリアにつながらず頻繁に聞き取りにくいことがあって申し訳なかった。これデュアルマイクだし、いつも1:1で研究室あるいは自宅から Skype しているとき特に音質が問題になったことはないので、大学のネットワークの問題だろうな……。

NL 研の発表のトップバッターはうちから。

  • 塩田健人, 小町守, 瀬戸口光宏, 市橋立. 法律相談 SNS におけるユーザー投稿文書を用いた著者役割推定. 情報処理学会 自然言語処理研究会, Vol.2017-NL-232, No.1, pp.1-7. July 19, 2017.

かれこれ弁護士ドットコムさんと共同研究をするのは3年目なのだが、いくつかやってきた研究内容のうちの一つを今回発表。弁護士ドットコムは法律相談 SNS に関しては弁護士の登録数日本 No.1 で、やはりトップシェアだからこそ見えてくる色々な課題があって(どれもが論文につながるわけではないが)、これもそのうちの一つである。

研究としては、例えば離婚の相談があったとき、離婚を請求された側の相談なのか請求した側の相談なのか、ということを区別したい、という需要があり、ではそれがどれくらい難しいタスクなのか、ということを調査したのが今回の研究である。解けるものは解けるのだが、そもそも人間でも難しい事例や、人間は分かるけどこれ単純なモデルでは無理ではという事例もあり、そんなに簡単でもない、という印象。

ウェブ系の企業の方々は、自然言語処理の研究の直接的な応用先でもあり、研究室としては共同研究等でご一緒したいとは思っているのだが、複数年度に渡って共同研究をしてくださる方がなかなかない(そもそも3年後に自分が同じ会社で働き続けている保証もないので、仕方ないだろうが)ので、こうやって継続的にお付き合いできるのは大変ありがたく思っている。

今回の動画配信は全部 Softbank 回線を iPhoneテザリングして行ったもので、2日間で 6GB ほど使ったようだが、回線的には安定していたようで問題なし。ただ、自分は 20GB まで使えるプランを契約しているから今回問題なかったが、前回完全にテザリングしようとしたときは、月間使用量を超えてしまっていた。次回の NL 研は宮古島開催が決定しているのだが、ちゃんと配信できるかどうか若干不安である。

夕方は後片付けをしながら NAIST 松本研ご一行を研究室にご案内。松本研と比べると、狭いスペースにひしめきあっているのをご理解いただけたと思う。内部進学生ではなく大学院から修士に来て2年間で就職する人にとっては、NAIST と比べてうちはいいところがない(立地がそれ以外と比較して100倍くらいの重みを持つ人は違うだろうが)ので、外部受験の(博士後期課程に進学希望でない)人はみなさん NAIST に進学すべきである。