研究ネタは前々から仕込んでおく

朝、[twitter:@matsuura_] さんと [twitter:@kazushi_] さんに教えてもらった道を参考に、行きは国道24号を南下、京奈和有料道路に乗って田辺西で降り (150円)、府道71号から関西外語大学の北を通って京阪奈墓地公園とくろんど池を突っ切り、高山竹林園の横を通ってNAISTに来たところ、50分で到着。1時間を切ったのは初めてで、びっくり。自宅〜徒歩〜電車〜徒歩〜車〜大学ルートだと、1時間5-25分かかるので、コンスタントに50分で着くなら車通勤もありかもしれず。

ただ、やはり電車通勤のほうが自分の時間が取れるし、1日1時間歩く時間が取れるので、1時間15分が1時間になる程度なら電車通勤に軍配が上がるかな。45分になるならちょっと食指が動くが……。

午前中、ひたすら週末のメールの返事。NLP若手の会シンポジウムや、入札案件の仕様書作成など。注意事項や過去の入札に関する文書をいただいたのだが、こんなに注意して書かないといけないのね。こうなる経緯は分からなくもないが、まさに誰得……。

お昼ごろ、英作文誤り検出・訂正ワークショップのコンテストのアナウンス。けっこう各チームの性能や出しているシステム出力に違いがあるようで、結果が楽しみである。

午後、「使っているパソコンが壊れたので研究室のノートパソコンを貸してください」という人が続いたのだが、なにか呪われているのだろうか。計算機関係のお仕事は、ちゃんと計算機係に引き継いでおかないとな〜。

夕方、共同研究に関するミーティングが1つ流れたのだが、[twitter:@shiraily] くんと学内実習のミーティング。久しぶりに論文を読み返す。1週間くらい集中してこの問題について考えてみたいのだが、1週間これ以外のことを考えないというような働き方ができない。とはいえ、幸い彼も学部時代に関連するタスクに取り組んでいたそうで、心強い。大学院まで来ると、研究も共同作業だなぁ。

勉強会の直前に、S根さんが研究室来訪。ちょっと雑談でもできるのかと思いきや、弾丸日程でお帰りになったようだ……。ニューヨークから韓国に来ると、日本もご近所なんだろうな〜。

夜は言語教育勉強会。[twitter:@shirayu] くんが

  • Bergsma, Shane and Post, Matt and Yarowsky, David. 2012. Stylometric Analysis of Scientific Articles. NAACL-HLT.

を紹介してくれる。これは論文の著者が英語ネイティブかどうか、男性か女性か、そして論文がACLに通った論文かどうか、という3つのタスクに取り組んだ、という話。素性はbag-of-wordsと文体的な素性、そして統語的な素性の3種類。エラー分析はおもしろいし、どのようにデータを用意したのかも読み物としておもしろいが、手法的には微妙な感じ。(そこがポイントではないのだろうけど)

ある文章を書いた人の母語を推定するというタスクには自分も興味があり、書いたテキストの言語を自動判別する言語識別は一般的にも関心が高く、先日サイボウズ・ラボから[twitter:@shuyo]さんにNAISTまでお越しいただいてトークをお願いしたのだが、母語を推定するのはあまりない着眼点では?と思って5月ごろ多少調べたところ、取り組んでいる人がいないわけではないタスクではあるが、著者の属性推定だと思うと大量に研究があるし、学習者の作文の質の推定だと思うとこちらも大量に研究があるし、どう位置付けるかがポイントかな。

帰宅すると23時を過ぎていたが、帰る時間が遅いとご飯を食べる時間も遅くなり、逆流性食道炎の再発が気になるな……。