午前中、NTTでミーティングがあるのを忘れてタグ付けミーティングを入れていたのでスケジュールの組み直し。申し訳ない。自分に全然空いている時間がないので金曜日になってしまった。うーむ、こんなに時間ってないものだったっけか?
というわけでNTTへ。進捗報告と議論。鳥バンクをいじってみたのだが、これは真面目に使おうと思うと相当しんどそうである。
昼からEMNLP読み会。@shuyoさんがいろいろ書かれているので参考になる。自分がチョイスしたのはこちらの論文。
- Tara McIntosh, Unsupervised discovery of negative categories in lexicon bootstrapping. EMNLP-2010
紹介する少し前に@masaoutiyamaさんが感想を書かれていて「あら、先を越された」と思ったのだが、軽く紹介。
ブートストラップ手法を適用するとき、抽出対象以外のカテゴリの情報を用いると精度が向上することが知られていて、典型的には2カテゴリの単語抽出(というか分類)タスクで相互のカテゴリに入ってしまうような単語はブートストラップには用いない、という形を取る。それに加え、人手で「明らかにこれは抽出対象ではない (ブートストラップの精度を悪化させる単語だと分かっている)」というカテゴリを stop class とか negative category とか呼んで明示的なカテゴリだとして扱うと、さらによくなることが分かっている。ただ、この negative category を人手で作成すると大変(生物医学分野の専門家が15日かけて作成した、と論文には書いてある)なので、自動的に作成する方法がほしい、という問題に対し、自動的にできる手法を提案しました、という論文。
割と実験は丁寧にやっているし、理論的な根拠があるわけではないが順当な結果ではあるし、押さえるべき論文はほとんど網羅されているので、よくまとまっていると思う。ただこの論文、明らかに引用するべき論文を1本引用していないので、それは減点ポイントだと思う。
- Vishnu Vyas, Patrick Pantel, Eric Crestan. Helping Editors Choose Better Seed Sets for Entity Set Expansion. CIKM-2009.
人手でシードを選ぶとよい、という話がモチベーションにあるので、この論文は言及すべきだったと思う。(あと余力があれば以前勉強会で紹介した Zornitsa Kozareva and Eduard Hovy. Not All Seeds Are Equal: Measuring the Quality of Text Mining Seeds. In Proc. NAACL 2010.)
夜、asad-hさんによるレクチャー。Urdu に関する勉強になった。レクチャーを準備するのは確かに大変だし、学生にとってはできればやりたくないことなのだろうが、このように博士後期の学生に対してレクチャーをさせるというのは、博士の学生は卒業してから授業をする可能性が高いから、教育的効果がある、という話はこちらの本にも書いてある。
- 作者: ジェームス・D・ワトソン,吉田三知世
- 出版社/メーカー: 日経BP社
- 発売日: 2009/04/16
- メディア: 単行本
- クリック: 7回
- この商品を含むブログ (7件) を見る
図書館で借りた本なのでどこに記述があったのか見つけることができないが、MIT が前世紀からの生命科学の発展に乗ることができ、Harvard は乗れなかったのは、Harvard は旧態依然の学問分野に任期なしの教員を採用していた(つまりそういう人の首を切れるのは30年後)のに対し、MIT は古い学問分野には任期付の教員をつけることで流行らなさそうな分野を縮小し、伸びている分野に人と予算をつけることができたからだ、という記述を読んで、確かにそういう側面もあるので、任期付教員制度の導入も悪い面ばかりではないのかな、と思ったりする。
ちなみにこの本、目次は
1 子ども時代に身に付けた習慣
2 学部学生だったころに身に付けた習慣
3 大学院で身に付けた習慣
4 ファージグループが採用していた習慣
5 野心に燃える若き科学者として教わった習慣
6 価値ある科学を行うに必要な習慣
7 終身在職権のない教授として取っていた習慣
8 活気ある研究を促すために採用した習慣
9 重要ではない大統領顧問になって知った習慣
10 ノーベル賞受賞者にふさわしい習慣
11 学者として不器用なために必要となった習慣
12 おもしろい本の背後にある習慣
13 礼儀正しい学者として必要な習慣
14 二つの仕事をこなし続けるために必要な習慣
15 心ならずもハーバードを去るときに守った習慣
となっていて、それぞれ自分の人生のエピソードがつらつらと書いてあって、最後にまとめが書いてあるのだが、研究に関するヒントを得たい人は、まとめのところだけ飛ばし読みすればいいと思った。
詳細な目次は忘れられない教訓にあるが、自分の現在のキャリアに関係するところを抜き出すとここか?
第3章 大学院で身に付けた習慣
1 博士論文のための研究では若い指導者に付け
2 若いやり手には傲慢だという評判が立てられがちだ
3 最初は怖気づいた講座に出席し続けることによって自分の知的能力を拡張せよ
4 面接試験では、謙虚な態度が功を奏する
5 時間の無駄でしかない上級講座は受講するな
6 論文研究の目的は、最初は自分で選ぶな
7 学位論文の研究テーマを超えて、広い範囲に対して知的好奇心を持ち続けよ第4章 ファージグループが採用していた習慣
1 できるだけ早くファーストネームで呼び合うようにしろ
2 ありふれた考えは、賢明な精神をも支配している
3 日曜日にも研究しろ
4 運動は、頭脳の行き詰まりを打開してくれる
5 夏の終わりに実験をするのは、人間の本性に反している第5章 野心に燃える若き科学者として教わった習慣
1 それによって自分は特別な人間だとの思いが持てるような、大きな目標を抱け
2 面白そうな題が付いているセミナーでは、最前列に座れ
3 再現できない結果は、じつは天の恵みかもしれない
4 自分の実験に関心を持ってくれる人を常に確保せよ
5 退屈な人々には近寄るな
6 科学は極めて社会的である
7 退屈だと感じる前にその研究分野を去れ第6章 価値ある科学を行うに必要な慣習
1 明らかに時代に先んじているテーマを選べ
2 目に見える成果が数年以内に出せると感じる場合にのみ、その問題に取り組め
3 部屋のなかで一番頭のいい人間には絶対になるな
4 学問上の競争相手と緊密な連絡を取り合うようにしろ
5 自分と同等の頭脳を持つひとりの仲間とチームを組め 6 どんなときにも、誰かが助けてくるようにしておくこと
(本の中ではそれぞれ10行くらいずつ説明があるので、気になる人は参照されたい)