コーパス名

「日本語書き言葉コーパス」という名前で松本研では参照していたプロジェクトのページができていた。もともと kotonoha というコードネームがあったと思うのだけど、この tokuteicorpus.jp というサイト名はさすがにどうかと……。ちなみに NAISTツール班の分担らしい。

とはいえ ryu-i さんと自分も最近公開準備中のコーパスの名前をどうしようかと打ち合わせ。主に照応(coreference)と述語項構造(predicate-argument structure)に関する情報がついたコーパスなのだが、大きな名前をつけてもなあ、ということでいろいろ検討。

照応(COReference)だし nozomi-k さんも喜ぶ CorCha (紅茶)はどうですか、と言うと、やはり茶がつくのはツールがよさそうとのこと。飯田の「い」と小町の「こま」を取って「生駒コーパス」はどうですか、と言うと、そこまで生駒が有名になってほしいわけではないとのこと。照応(COreference と事態(Event)についてついているから COE コーパスとかいかがですか。だめですか。そうですか。

結局 NAIST テキストコーパス(仮称)のままなのだが、おもしろい名前がある人はぜひタレコんでください。