異をとなえん |

飛車先の歩の交換をなぜ簡単に許すのか? - GPS将棋をプロ棋士が分析する(その3)

2012.06.23 Sat

21:01:16

質問があり、前の記事の意味が不明瞭なので、自分の考えをもう一度書き直しておく。

まず、自分の言いたいことは次のようなものだ。
飛車先の歩の交換の得は短手数でわかるものではなく、長手数先に実現するものだから、今のコンピュータソフトの読みの深さでは飛車先の歩の交換の得を理解できない。
そのため簡単に飛車先の歩の交換を許す。

もう少し具体的に書く。
評価関数は局面の状況を静的に判断する。
プロの棋譜を分析・学習することで、プロの手に一番近い手を指すように局面から計算する関数だ。
これは1手しか読まないソフト同士が対決すると、学習したプロの棋譜を全て再現できるようなイメージで、私は理解している。
序盤は同じだからどこで分離するかとか、致命的な悪手を指した場合はどう関数を作ってもその手は指さないような問題はあると思うが、それは適当に調整してあるわけだ。
だから、飛車先の歩を伸ばして次に交換するぞと迫ったとき、角や銀を上げて交換を拒否する手の評価値は高いはずだ。
その手を指さないのは、評価値の計算は1手先ではなくて、ずっと先まで読んで計算しているからだ。
単純に拒否する手よりも、飛車先の交換を許して別のところで得をする形の方が評価値が高くなってくるから、ソフトは飛車先の交換を許す。

評価関数は全ての局面に適用される。
玉と飛車が接近したような形は評価値が低くなり、玉の周りに金銀が集まっているような形は評価値が高くなる。
ボンクラーズ対米長戦では、米長氏が二手目に62玉と定跡外れの手を指した。
玉飛接近で、しかもそれを簡単に解消するような手はない。
それで評価値は非常に低く、ボンクラーズは自分の方が優勢と判断した。
ボンクラーズの作者のブログの記事のグラフを見るとそれがよくわかる。
ただこれはボンクラーズの読みの範囲内の判定なので、その後局面が進み、駒がぶつかるような局面になるとほとんど互角になっていた。
つまり、米長氏は駒がぶつかるころの局面を想定してこの手が成立すると思っているけれども、ボンクラーズはそんな先の局面は読めないので、途中まで読んでそれならば有利だと判定しているわけだ。
その結果、駒がぶつかるような局面まで近づくと評価値が互角に近づいていく。

ボンクラーズの序盤の形勢判断が正しいということがあるだろうか。
それはありえない。
もしその形勢判断が正しいならば、局面の進展と共に評価値が互角に近づいていくことが説明できない。
単純に読み不足なだけだ。
時間が十分にあったボンクラーズ米長戦でも、序盤で正しい判断ができるほど読みは深くない。
それは今回のコンピュータ将棋選手権でも序盤の読みがあてにならないことを示している。

現在のソフトの読みの深さは序盤から正しい判断をできるレベルに達していない。
人間なら経験や感覚からわかる判断ができない。
もっとも飛車先の歩の交換の得は、人間にも江戸時代末期まで把握できなかった。
つまり人間は膨大な対局の経験から、飛車先の歩の交換は得だという事実を理解できたのだ。

飛車先の歩の交換を許すソフトの判断の方が人間より正しい可能性はあるだろうか。
私はそれはないと思う。
今まで述べたように、ソフトの序盤を判断する読みはまだまだ浅い。
そして、人間が膨大な対局から経験的に理解した感覚が間違っているとは思えない。

角替わり同型の将棋は最近先手有利とほぼ結論が出たように思う。
これは数え切れないほど大量の対局によって、ほぼ全ての変化をしらみつぶしに読みつくしたからだ。
全ての変化を読みつくしたならば、途中の局面の形勢判断は関係ない。
プロの間で山ほど対局があったのは、形勢不明に見えたので指す価値があると思ったからだ。
ボンクラーズが角替わり同型を後手番で指して何局も負けている。
コンピュータがいかに深く読めるといっても、人間が何十年も対局した経験による読みは上回れないのだ。

飛車先の歩の交換の得も同じようなものだろう。

ソフトが飛車先の歩の交換の得を理解するにはどうしたらいいだろうか。
序盤だけの評価関数を作るような方法はある。
しかし、この方法は序盤と中盤をどこで切り替えるかの判断が難しい。
序盤ある程度進展して、すでに感覚より読みを重視しなければならない局面かどうかの判断は、たぶん飛車先の歩の交換の得の判断より難しい。
下手にそこらへんをいじるよりも、コンピュータの能力の向上でソフトの読みが深くなって、自然に問題が解消した方がいい。
読みが深くなれば飛車先の歩の交換の得を自然と理解できるはずだ。

また対人間戦においては、飛車先の歩の交換を許しても損かどうかは微妙かもしれない。
人間は飛車先の歩の交換の得を感覚的には理解できても、それを現実の得にするのは難しいはずだ。
コンピュータの読みはすでに相当深くなっている。
歩を交換しているということは、すでに単純な序盤ではない。
そのような状況で、コンピュータの読みの範囲内では実現していない得を実現させるにはかなりの力量を要する。

それにコンピュータにとって、角替わり交換同型のような、変化が狭くなって逃げ切れない局面を選んでしまう危険性よりも、飛車先の歩を交換させて、相手の実力をそのまま発揮させた方が有利かもしれない。
なんと言っても、飛車先の歩の交換を許す定跡はほとんどないはずだ。
定跡のない局面に導いた方がコンピュータにとって有利になっている時代がきている。
コンピュータが定跡なしに指したときに一番心配なのは、駒が交換せずに入玉含みで指されるような将棋だ。
実際ボンクラーズ米長戦のあの将棋はコンピュータにとって一番嫌な指し方だったと思う。
実力が出しにくくなる。

その点飛車先の歩の交換をするような将棋は、相掛かり調で入玉模様にはなりにくいし、圧迫されることもない。
定跡形を外れているのに、実力は発揮しやすく、損しているかどうかは微妙だ。
対人間戦では理想的な気もする。
同時に力の差があるならば、コンピュータ同士の戦いでも歩の交換を許してかまわないのかもしれない。
結局は読みの深さが勝負を決めるという点では同じだ。

一応このような理由でコンピュータは飛車先の歩の交換を簡単に許していると思う。
このエントリーをはてなブックマークに追加
LINEで送る