意味解析はこれからの技術ではなく、これまでさんざんやり尽されてきた技術

朝からあまり体調が優れない。

午後、20分ほどミーティング。開発をするか研究をするか悩ましい。研究にしたいなら最初から研究テーマになるようにデザインしておかないと、あとから研究にしようとしても難しいしなぁ。話していて、研究者が専門分野にタコツボ化していることを日頃問題に感じているのに、その自分自身自然言語処理以外の分野に出ようとしていないことを気づかされ、これは容易ではないことだと痛感する。まあ、それぞれ関連技術の水準がだいたい分かるからこそ、手の出しようがない、ということかもしれないが……。

やねうらおさんの 自然言語処理こそが今世紀最後の錬金術 というエントリを拝見しても、期待していただけるのはとてもありがたいので、なんとか応えたいものである。ちなみに、コメント欄でお書きになっている

1982年にICOT(新世代コンピュータ開発機構)が設立され、1992年にプロジェクトが終了 するまでに、法的推論システム(≒法律をルール化して設定すれば、ある事例が合法か違法かを判定するプログラム)や意味理解に関する研究がさかんにされて いた時期がありまして、日本は世界的に見てもかなり前を行っていたのに、もろもろの事情で頓挫してしまったという経緯があります。


現在で は自然言語処理と言うとテキストマイニング等に代表されるような、大量にデータを突っ込んで統計的に処理してしまうような研究が主流ですが、文章の意味理 解に対する研究は“まだまだこれから”という未来の技術ではなく、もう過去にある程度やり尽くされていて、(文章の表層的なレベルよりはもう少し深いレベ ルでの意味理解が当時のプログラムでも出来ていたように私は思うのですが)当時に計算資源が乏しくて出来なかったことにチャレンジするところあたりから始 めなければならないのでしょうけど、そのための人手(研究者)が足りていないと私は感じています。

ベイジアンばっかりやっている人達(←偏見?)が、早く戻ってきてくれると良いのですが…。

と「意味解析はこれからの技術ではなく、これまでさんざんやり尽されてきた技術」というのは、まさしくその通りだと思う (逆に言うと、自然言語処理分野の研究者でない方でもここまで諸事情を理解してくださっている、ということに畏敬の念を禁じ得ない)。NICT の鳥澤さんも昨年の言語処理学会のワークショップで「みんな過去の失敗から学んだほうがいいのではないか。全員で共通の知識基盤を持つべきではないか」ということをおっしゃっていて、自分もそれに賛同するのである。(Lisp とか Prolog とかでコードを書いていた人たちと、C++Java でコードを書いている人たちの間にも文化の断絶があるような気がしている。自分はどちらでもないが……。)

そういえば今年の言語処理学会チュートリアルは乾先生が 「大規模言語資源時代の意味談話処理」 についてお話される予定で、こちらは Ustream 予定らしいので、上記のようなテーマ (意味解析の現代的なリバイバル) に興味がある方は3月13日(火)13:00-15:00は空けておくとよろしいかと思われる (ちなみに、録画はされないそうなので、見たい方はこの時間に現地に行くか Ust で視聴されるかしていただきたい)。

夕方、修士論文の発表練習 (後半)。開始前から寒気がしていて調子が悪い……

終わったら速攻で帰ろうかと思っていたのだが、返信しなければならないメールがあったり、帰ろうとしたら研究の相談を受けたりとかで、19時過ぎになってしまう。家に帰る途中ですでに悪寒がしていたのだが、ほうほうのていで這って帰り、そのままトイレと寝室を往復。布団の中に入って3枚被ってもまだ寒い。電話もキャンセルさせてもらい、結局4回吐いた。熱は全く出ていないのだが、吐き気と寒気と頭痛がひどい。経験上、一度意識が飛べばすっきりするのだが、吐き気と頭痛で眠ることすらできず、22時ごろまで文字通りのたうち回る (ちなみに、寝るときは全身の筋肉という筋肉を全部弛緩させれば1分とかからず自分は寝られるので、弛緩できないほど苦しかったということだ)。

22時ごろようやく落ち着いたので、吐き気が止まっているこの瞬間で寝るしかない、と思って入眠。4時ごろ覚醒し、寒気と頭痛は嘘のように消失。立とうとするとまだ少し吐き気が残っているが、そのまま横になって安静にしていたら、9時までには問題なくなっていた。いったいなんだったのだろうか。この3日、食べたのはバナナと鍋くらいしかないのだが……。