仕様書コーパスを作って書き換え規則を自動抽出したい

昨日から取りかかっているのだが、朝から仕様書作成。本当は先週海外出張中にドラフトを用意するはずだったがそんな余裕はなく、帰国してから査読締め切りに追われていて、ようやく取りかかることができるようになったのである。

しかしこの「仕様書表現」はどうにかならないものか……。あらゆる物品が難読化されている。(製品を表現で特定してはいけないので、仕方ないが) これこそ自然言語処理で生成したい。それが何を指しているのかは大体空気を読めば一意に決まるので、逆向きに使えば仕様書から属性抽出ができるかもしれないが (笑)

昼は CJE++ に出る。今回は ACL リビューということで、スライドを使って1人持ち時間10分で内容をどんどん説明していく。けっこうおもしろそうで見落としていた論文が見つかってよい。ただし勉強会の時間だけで論文の内容を読み切れないので、結局自分で時間を取って読まないとなぁ。

午後は全体研究会。M2の5人が順に進捗報告。頻繁に回ってくるのはけっこういいかもしれない。秋学期は勉強会も隔週くらいで回ってくるようにしたほうがいいのかな。去年は言語教育勉強会所属の人数が多くて回り切らなかった (結局 M2の人たちには論文紹介しないで進捗報告だけしてもらった) が、今年はソーシャルメディア解析勉強会の人数が多いので、どうするか考えておかないと。

夜はNAIST真ん中の池でBBQ。研究室では毎年4月に松本先生のお宅で新入生歓迎BBQをやるのが恒例になっているが、自分が松本研に入ってからここでBBQをするのは初めてではなかろうか。そもそも4月から1回もこの手の集まりに出ていなかったので (その時間がなかった)、出られる程度には落ち着いてきたってことかな。

そういえば、来年は研究室ができてから20周年記念に当たるので、BBQの前後に20周年記念会をやるという話。学生のころは自分がそのときまで松本研にいるとは思っていなかったが……。在学生は全員ポスターをやってもらおうか、というアイデアもおっしゃっていたので、この機会に全員にポスターを作ってもらうのはよいきっかけだと思い、賛成しておく。特に博士後期課程の人は、全く話す内容がない、ということはありえない訳だし。

夜はご飯を食べてから4時間は横になれない (消化できない) ことが分かったのだが、逆算すると12時に寝ようと思うと8時には食べ終わってないといけないということか……。