将棋と大規模データ

渡辺明頭脳勝負』(ちくま新書)を読む。

将棋を知らない人にも将棋をどうやって見ればおもしろいか解説した本で、こういった本って実は全然なかったので、すばらしい。野球自分ではしないでもプロ野球は観戦する人がいるように、将棋も自分で指さないでも将棋界の動向を楽しむ人がいたっていいわけなんだけど、将棋はそのおもしろさや美しさというのが分かるまでにけっこう勉強が必要なので、ちょっと敷居が高いのであった。その敷居を下げようという初めての試みだと思う。

ただ後半は対局の解説(とはいっても「このとき自分はどう思っていたか」という解説なので、普通の解説とは違う。「谷川浩司全集」のような優れた自戦記では、指した手の意味だけでなくそういった心の動きまで書いてあるものだが、そこまで書ける筆力のある棋士はそうそういない)なので、やはり少しでも駒の動かし方くらいは知らないと厳しいのでは、と思う。この点、相撲なんかだと「倒したら勝ち」みたいにルールが見てよく分かるので、初心者でも楽しめるのと比べると不利かもしれない。

将棋も最近の自分の興味はコンピュータ将棋なのでなんともいえないが、実際に100局以上 Bonanza と指した渡辺棋士によると

今回のボナンザは「持時間一時間=奨励会二段~三段:一〇秒将棋=プロレベル」でしょう。

だそうで、もう短時間の対局だとアマチュアレベルでは太刀打ちできないところまで来てしまった感がある。(というか、10年以上将棋のプランクがある自分は30秒将棋ではすでに Bonanza に勝てない。まだ指したことがない人はダウンロードして試してみるとよい。) 統計的手法使うとみんな同じデータセット(将棋倶楽部24棋譜)使っている限りにおいてはやり方で大きな違いが出るとは思えないが、プロの棋譜もどんどん増えてくるわけだし、これはすでに射程圏内に入っているのではないかな、というのが自分の予想。

それに関してコンピュータ将棋とgoogleと自動音声認識の機械学習に関して。というブログエントリを興味深く読ませてもらった(長いけど)のだが、

自動音声認識技術が発展しなくなった一つの原因は中途半端に成功してしまったことにあると思う。自動音声認識技術は、「データ集め」をした結果、中途半端に成功した。そこからちまちまとそのデータをどのように利用するかという研究はされていたし、ほかにどのようなデータが必要かという議論もされていたが、「根本的なところを振り返る」ということが(雰囲気的に)しづらくなった。何かしらの危機感がこの分野にあれば、「ちょっと根本的なところから考えてみましょう」という雰囲気になるとは思うのだけれど、技術的な危機感がないので「根本的なところから考える奴はうざい」という雰囲気が主流になっている。代わりに、「自動音声認識はなぜ使ってもらえないのか」という議論が2007年10月19日の研究会ではなされていた。

(snip)

もし、同様の主張がコンピュータ将棋の分野でまかり通るようになってしまったら危険である。そして、その危険な状況に陥るおそれは少なくないと思う。自動音声認識の研究者も初めから「データを集めればいい」と思っていたわけではないだろう。だいたい次のような思考経路を辿っていったはずである。「どのようなデータを集めればよいだろうか」→「そのデータからどのような種類のパラメータを抽出すればよいだろうか」→「まだ性能は充分でないのは抽出するパラメータの種類が悪いからだ」→「どうやっても性能が上がらない」→「もう手をつけるべき部分がなくなった」→「やっぱり人間には勝てないね」。その誤りは、「大規模データを使わねば研究ができない」という固定観念にある。

鋭いこと言っているなと思う一方、このエントリの末尾で Google だけは特別扱いしているのが不思議なのだけど、まあつまりdankogai さんが楽観的に書いていることに対して、音声認識ではそんなふうには進まなかったから、コンピュータ将棋でも同じように行き詰まるのではないか(そうはなってほしくない)、という話。

自然言語処理の研究で大規模データ使っている自分としても半分同意・半分判断保留というところなのだが、本当に「大規模データ」と呼べるだけのものを使っている研究室・企業ってどれくらいあるのか? というところがちょっと疑問。shima さんが大規模データの取り扱いについて書いているが、

Googleでは大量データの高速計算のために、ステミングならぬ○文字以降を切ってしまうトランケーティング(!!)の実験をしたり、確率をたった○ ビットで計算したり、ベイズ理論を壊して項を勝手に○乗したりと、リサーチをしている人間から見るとびっくりなことをしていました。大量データの世界だと常識・価値観が変わります。

ということで、「これからは単にデータの量さえ増やせばどんどんよくなりますよ」というようなバラ色生活が待ち受けているわけではないのでは、と思っている。(いや、外野から見ると「増やせば増やしただけよくなりそうじゃん」って思う気持ちは分かるのだけど……)