今日は CJE 勉強会の論文紹介担当だったので
- Su Nam Kim, Timothy Baldwin, "Disambiguating Noun Compounds", 22nd AAAI conference on Artificial Intelligence (AAAI), 2007, British Columbia, Canada, pp.901-906
- http://www.cs.mu.oz.au/~snkim/documents/aaai07.pdf
を紹介した。話としては単純で、たとえば day という単語は day dream のように修飾語の位置(dream を修飾)に現れるときは「日中」の意味で使われることが8割以上で、independence day のように主辞の位置(independence が day を修飾)に現れるときには「特別な日」の意味で使われることが9割、といったように、複合名詞は名詞中のどの位置にその名詞が現れるかで意味がかなり決まる、という現象があって、その情報を使って語義曖昧性解消しましょう、という話。
あとは各単語の意味(語義)が分かっているかどうかで意味役割が推定できるかどうかの評価もしていて、ラベルは AGENT(student protest)/OBJECT(flood water)/MATERIAL(apple pie)/TOPIC(computer expert) など20ラベルを当てるのだが、これも語義が分かっていると意味役割も推定しやすい、という結果。まあそうかなという感じ。人間がつけても一致率が52%らしいので、もっともうまく当てるシステムを作れたとしてもこれが上限になるのだが、そもそもつけるのが難しい(どういうラベルを定義するか、どういうアプリケーションを想定するか)問題なのだろう。
研究会はゆうちゃんと harendra-b さんと campbe-h さんの留学生3人。留学生ばかりになるのは珍しい。スライドも英語ばかり。自分も英語で作ったほうがいいんだろうな、と思った。
研究会後はミーティング。ryu-i さんにお世話になりっぱなし。