NAIST マニアック講義録: リンク解析と周辺の話題

紹介するのを忘れていたが、NAIST は冬学期になるといろいろとマニアックな講義が開講される。そのうち今年は shimbo さんのリンク解析と周辺の話題を紹介(それぞれに PDF がある)。

リンク解析は, グラフ (ネットワーク) データの構造から有用な情報を抽出するための, データマイニングの一研究分野です. この講義ではまず, リンク解析が取り扱う 2 種類の尺度 (重要度と関連度) について述べ, それぞれの代表的な計算手法を紹介します. 後半では, 近年機械学習分野で盛んに研究されているカーネルのうち, グラフ上の節点に対して定義されたカーネルと, そのリンク解析への応用について紹介します.

ということで、いろいろなカーネルについて取り上げており、コンパクトにまとまっているので、このあたりに興味ある人にお薦め。

もう少し書くと、まずリンク解析とはなにか述べ、重要度と関連度について紹介。重要度とはたとえば PageRank みたいに大域的に重要な文書を見つける尺度(他にもたとえば HITS とか SALSA といったものがある。それぞれスライドの中に詳しく書かれている)。関連度については「この論文に似ている論文はなに?」みたいな類似度尺度を定義するもので、古典的には共引用解析とか書誌結合で使われてきた尺度(それにグラフカーネルによる解釈を与えたのが shimbo さんと takahi-i さんの仕事)。後半はノイマンカーネルとか正則化ラプラシアンの性質、そして拡散(diffusion)カーネルや通勤時間(commute-time)カーネルの話。

毎回スライドが(アニメーションを入れるとはいえ)100枚近くあるという気の入りよう。自分も開けてびっくりした。こんな濃い授業を(1ヶ月とはいえ)やってくれるのはすごいなぁ〜

しかし来年度は授業を全体的に前半にシフトさせる(NAIST は4期制なのだが1-2月の授業はみんな受けてくれないから)そうで、こういう突っ込んだ内容の授業がなくなるのはもったいないなぁ(なくなると限ったわけではないが)。それぞれの研究室の勉強会で学べばよい、というスタンスなんだろうか…… 毎年毎年どこかしら変えてよりよくしようという姿勢は評価するべきだと思うが、変化が早すぎて数年で状況ががらりと変わってしまうのもいいんだか悪いんだか。