TinySVM

前 ryu-i さんから10分 TinySVM クッキングを習っていたので、昨日もらったデータに TinySVM をかけてみる。TinySVM というのは SVM に基づいた分類器で、SVM を使える分類器は他にもいろいろあるらしいのだが、TinySVM を作ったのはつい最近まで松本研にいた taku-ku さんということなので、まず TinySVM に慣れるところから。

論理生命学という授業で先日習った説明では、キノコと毒キノコが混じったところからキノコを選ぶにはどうしたらいいか、つまりキノコ採り名人が「これは色が派手だから毒キノコ」「これは見た目悪いけど食べられるキノコ」「これは派手だけど食べられるキノコ」のように素人に教えていくのと、機械学習で形がこんななのは食べられるキノコ(正例という)、色がきついのは毒キノコ(負例)というような事例を与えて訓練して、未知のキノコを発見したらそれが食べられそうか毒入ってそうか判定するのが機械学習、ということになる。分かりやすくてけっこういい喩えだった。

さて SVM を使うには素性(英語では feature)といって、分類したいものを区別するために使う特徴(上の例でいえば形とか色とか)を指定しないといけないのだが、今日の今日まで TinySVM だとどういうふうに指定すれば動くのか分からなかった(正確には自然言語処理でどういうふうに使うのか分からなかった)ので、今日初めて動かすことに成功。動いてみると楽しいものだ。