異をとなえん |

電王戦展望

2013.03.21 Thu

22:07:32

いよいよ今週の土曜日から電王戦が始まる。
初戦に登場する習甦も長時間floodgateにようやく登場した。
そこで衝撃が走る。
習甦は序盤から時間使いまくっていて、なんと定跡データベースを使っていない。
横歩取りの将棋で先手が飛車先の歩と取る手に10分以上かけている。
対局相手のPuppetMasterが定跡を抜けたのは20手前後だが、そこまでで習甦は1時間以上使っているのだ。
二日後が本番なのだから、今回の対局は本番用ソフトとマシンの最終確認のためと見るのが妥当だ。
そうすると本番も定跡データベースを使わないで指すつもりなのだろう。
本当にそうなったら、ある種異様な対局風景になりそうで、いきなりわくわくしてきた。

定跡データベースを使わないというのは、普通に考えれば悪手である。
定跡を最善手と仮定してその中からランダムに選択する、現在の使用法では問題も多い。
定跡と言っても基本的にはプロが複数回指した手を集めただけだ。
だから、定跡だけど実は優劣がはっきりついている場合取り返しがつかなくなる。
ボンクラーズが角換わり腰掛銀同型から何度も負けていたようなパターンだ。
それを考えると、最初から自分の実力で戦うのは一つの方法だ。
ランダムに選んだ定跡が悪くて負けた場合の後悔がなくなる。
習甦が定跡データベースを使わない選択をするならば、やはり自分の実力で勝負するという側面が強いのだろう。

しかし、定跡データベースは再構築できる。
末端の局面を評価して、評価値をデータベース上に持つようにするならば、悪い局面をたまたま引き当てるようなことはなくなる。
事前に着手の思考をするようなものだからだ。
定跡データベースの全ての着手の評価値を求めるのが大変ならば、小さくしたデータベースのみで評価すればいい。
矢倉や角換わりの将棋みたいに長い定跡は落として、10手ぐらいの局面だけで評価値を設定すればそれほど手間をかからない気がする。
少なくとも横歩取りの2四の歩を取る手に10分も使うのは時間の無駄だ。

習甦はともかくとして、他のソフトは定跡データベースを使ってくるだろう。
そうするとどういう定跡を選択するかが、一つの興味対象となる。
長時間floodgateの対局を見ていると、少なくともgps将棋は居飛車を選択する可能性が高い。
gpsfish同士の戦いを見るかぎりでは、相掛かりか横歩取りの戦型ばかりになっていた。
双方ができるだけ評価値が有利になるように努力する結論が、相掛かりが横歩取りなのかもしれない。
振り飛車の将棋は飛車を振った側の勝率が高くなさそうなので、コンピュータは避けそうだ。

コンピュータ将棋ソフトとプロ棋士の対局予想では、コンピュータには時々わけのわからない疑問手を指すからプロが勝つという意見が多くある。
今回のgps将棋に勝ったら100万円のイベントでは、東大香得定跡という、gpsfishが香損をして攻めてくるというパターンが見つけ出され、人類が中盤まで優勢に進めている将棋がたくさんあった。
プロがその後を指しつげば楽勝というわけだ。
しかし、それは簡単に起こらないのではと思う。
まず、今回のgpsfishの不利なパターンが発見されたのは、公開されているソフトをそのまま使い、環境も大体似通った形で再現できたからだ。
電王戦本番ではソフトもマシンも最新のものにあげてくるだろう。
そうすると、現在の対局で見つけた問題の着手は再現されない可能性が強い。
もう一つの起こらない理由は、コンピュータが疑問手を指したのは時間が短かいからという可能性が高いからだ。
ネットでは思考時間を延ばせば指さなくなるという意見も出ていた。
本番の電王戦では4時間という持ち時間がある。
コンピュータが序盤で疑問手を指す可能性は少なくなっている。

コンピュータの弱点として、入玉の将棋が苦手というのは一番にあげられる。
実際去年の将棋ソフトで入玉対応をきちんとしているソフトはなかった。
けれどもgpsfishはかなりのところまで入玉模様の将棋に対応してきている。
実際今回のgpsfishとアマの対決では、旧バージョンを使ったときの例外を除けば、入玉でgpsfishが負けている将棋はない。
むしろ、前に指摘したアマが入玉直前に頓死した将棋では、gpsfishは非常にうまく指していたと思う。
相手が一気に入玉に成功したとしても、できるだけ相手の駒を減らし、大駒を取ってしまえば、宣言勝ちは十分に起こせる。
そういう意味で入玉をとにかく目指すという戦略は破綻しつつあるだろう。

今までコンピュータの弱点というものは既に改善されつつあるという指摘をしてきた。
それでは人類に勝ち目はないのだろうか。
そうでもない。
コンピュータ同士の戦いを見ていると、当たり前だがどちらのソフトもミスをしないということはありえない。
形勢判断が真っ二つに分かれていれば、どちらかのソフトがミスをしていることになる。
最近のfloodgateでそんな将棋の典型例があった。
PuppetMasterとgpsfishの対局で、gpsfishは最後の一手が指されるまで自分の方が勝っていると信じていた。
それがPuppetMasterの最後の手で自分の玉には必死がかかってしまい、相手玉は詰ますことができないことがわかって投げている。
gpsfishは時間がたくさんあったにも関わらず、その手を見落としていた。
gpsfishの詰みルーチンが入っていないことなどが理由かもしれない。
本番ではそこらへんも改善されてきているだろう。
けれども、詰めろ逃れの詰めろから必死に持ち込んで勝つような将棋では、最終的な判断がつくのに手数が非常にかかる可能性がある。
コンピュータはそういう手数が長くなる将棋に弱いのだ。
人間は相対的に強い。
そういう将棋になって、人間が勝利する可能性もあるのではないかと思う。
このエントリーをはてなブックマークに追加
LINEで送る

続々:gpsfishは強い

2013.03.09 Sat

21:38:52

人類vs最強将棋ソフト 勝てたら100万円!のイベントの4日目が実行された。

ガチで研究してきた人が増えたせいか、いい勝負が多かった。
しかし、最終的にはgpsfishが終盤力を発揮して勝ってしまう。
結果的には一敗もしなかった。

一番惜しそうな将棋は東大将棋部主将が指していた将棋で、ほぼ入玉が確定していたのだが最後に頓死を食らってしまう。
ただ頓死にならなければ勝っていたかは疑問で、大駒が角しかないので点数計算するとかなり足りない。
gpsfishは穴熊のままだったけれど、入玉しようと思えば戦力差がかなりあるので幾らでも可能に見えた。
だから、双方の玉が敵陣の三段目に入る相入玉が一番ありそうだ。
今回のルールでは点数計算が採用されていないので、相入玉で指し直しとなる。
gpsfish側を人間が指していたら、いつまでも入玉せずに駒を取り合っていくことで、最終的に人類の王将を詰ましてしまいそうだ。
人類が183手目に2二銀成りという手を指さなくとも苦しいのだとしたら、敗着はかなりさかのぼりそうで惜しい将棋ではなかったのかもしれない。
棋譜をつけておく。

引用開始

▲6六歩 △3四歩 ▲6八飛 △3二飛 ▲5八金左 △3五歩
▲4六歩 △6二玉 ▲4八玉 △7二玉 ▲3八銀 △4二銀
▲7六歩 △5四歩 ▲4七金 △5三銀 ▲3九玉 △8二玉
▲9六歩 △9二香 ▲9五歩 △9一玉 ▲7八銀 △8二銀
▲6七銀 △1四歩 ▲1六歩 △7一金 ▲2八玉 △5二金
▲8六歩 △2四歩 ▲8五歩 △2五歩 ▲9七角 △3三角
▲7七桂 △2二飛 ▲3六歩 △1五歩 ▲同 歩 △同 香
▲1七歩 △3六歩 ▲同 金 △3四歩 ▲4七銀 △6四歩
▲3八金 △1七香不成▲同 玉 △1五角 ▲6九飛 △3五歩
▲3七金引 △同角成 ▲同 金 △8七金 ▲8四歩 △7七金
▲8三歩成 △同 銀 ▲6五歩 △8二歩 ▲5八銀左 △8七金
▲7五角 △1六歩 ▲同 玉 △7八金 ▲4九飛 △6八金
▲1四歩 △5八金 ▲同 銀 △2八銀 ▲3八金 △1九銀不成
▲1三歩成 △同 桂 ▲1四歩 △1二歩 ▲1一角 △2一飛
▲8八角成 △3六桂 ▲2二金 △同 飛 ▲同 馬 △2四金
▲1五香 △2八桂成 ▲4八金 △2九成桂 ▲1三歩成 △同 歩
▲同 馬 △2三香 ▲2四馬 △同 香 ▲1三香成 △2八銀成
▲2二飛 △3九成桂 ▲8九飛 △7八角 ▲7九飛 △3四角成
▲3二飛成 △3三桂 ▲4五金 △4二金 ▲3一龍 △4一金
▲3四金 △3一金 ▲1五玉 △2七成銀 ▲2四玉 △1八飛
▲5六歩 △1二歩 ▲2三成香 △3六歩 ▲3二歩 △4二金
▲5七金 △5五歩 ▲1四歩 △5六歩 ▲3一歩成 △7四銀
▲9七角 △3七歩成 ▲1二成香 △5七歩成 ▲同 銀 △3八飛成
▲2三玉 △4七と ▲3五歩 △5七と ▲2四桂 △6八と
▲8九飛 △7八と ▲8七飛 △9六銀 ▲5四歩 △8七銀成
▲5三歩成 △同 金 ▲4二角 △5七飛 ▲3三角成 △9七成銀
▲同 香 △同飛成 ▲4五桂 △4四金 ▲同 金 △同 歩
▲同 馬 △7二金打 ▲3二桂成 △6五歩 ▲3四歩 △2六角
▲同 馬 △同成銀 ▲3三歩成 △5七龍 ▲2二玉 △4六龍
▲5三桂成 △4四龍 ▲4三金 △1四龍 ▲2三銀 △2四龍
▲2一玉 △6七角 ▲2二銀成 △1二角成 ▲同 玉 △1八龍
引用終了
このエントリーをはてなブックマークに追加
LINEで送る

続:gpsfishは強い

2013.03.04 Mon

21:59:54

昨日人類vs最強将棋ソフト 勝てたら100万円!のイベントは3日目が実行された。
gpsfishに戻してから、初めて一敗を喫している。

ニコニコのGPS将棋対局イベントで3人が100万円獲得 運営「青ざめてます」ということなんだけど、本当かなと思っている。
前日ほぼ同時に2敗したときあせったというのは本当だと思うのだが、それほど一つ二つの負けにこだわるならば2日目にわざわざバージョンを落としてくるだろうか。
幾ら将棋ソフトに無知でもバージョンを落とせば弱くなるぐらい知っているだろう。

逆に3日目の負けも少しソフトの動作が変な気がしている。
急に三段目に玉が二局上がってきたし、他にも成れもしないのに角が一筋に出て引くなど、指し手が少し変な部分がある。
これが間を置いて起こるならば、乱数調整で悪い目が出たと思うのだが、急に2局立て続けに起こると変な気がする。
実際放送でもソフトをいじったなどと言っていたと思う。
1敗もしないことにこだわるならば、わざわざ勝っているソフトをいじるだろうか。
パチンコの出球調整みたいに、1日1回ぐらいの割合で負けるようにしているとしか思えない。
開発者がいじるならわかるのだが、GPS将棋を利用しているだけのニコニコがそういうことをするのは良くない。

根拠もなく言っているが、そんな疑問を持ってしまった。

他の将棋自体は大体gpsfishが完勝していたが、一番惜しかったのは最後の方に指された一局だった。
2chに棋譜があったのではっておく。

引用開始

119 :名無し名人:2013/03/04(月) 18:46:12.92 ID:nvHORMIc
>>115
おー、サンキュー
7手目以降映ってたんだな
見逃してたわ

一応貼り直し

▲足立海世
△GPSfish0.2.1

▲7六歩 △3四歩 ▲2六歩 △4四歩 ▲2五歩 △3三角
▲4八銀 △4二飛 ▲5六歩 △3二銀 ▲6八玉 △7二銀
▲7八玉 △4三銀 ▲5八金右 △9四歩 ▲7七角 △7四歩
▲6八角 △2二飛 ▲6六歩 △6四歩 ▲6七金 △9五歩
▲3六歩 △7三桂 ▲7七桂 △5二金左 ▲8九玉 △6二玉
▲7八金 △6三金 ▲3五歩 △同 歩 ▲同 角 △7一玉
▲5七角 △8二玉 ▲5九銀 △5四歩 ▲6八銀右 △8四歩
▲1六歩 △4五歩 ▲2六飛 △5五歩 ▲3七桂 △4四角
▲3六飛 △5六歩 ▲同 金 △7五歩 ▲6七銀 △3五歩
▲2六飛 △3二飛 ▲3三歩 △同 桂 ▲6五歩 △9六歩
▲同 歩 △7六歩 ▲同 銀 △9七歩 ▲同 香 △6五桂
▲同 桂 △同 歩 ▲5五歩 △3六歩 ▲同 飛 △3五歩
▲2六飛 △5二飛 ▲6五金 △6四歩 ▲6六金 △6五桂
▲同 銀 △同 歩 ▲同 金 △6四歩 ▲6六金 △5五飛
▲5六歩 △5三飛 ▲5五桂 △5四銀 ▲8八銀 △5五銀
▲同 金 △同 角 ▲同 歩 △7七歩 ▲同 銀 △6五桂
▲6二歩 △同金上 ▲3五角 △5五飛 ▲5六銀 △7六歩
▲7四桂 △同 金 ▲6二角成 △7七桂不成▲8八玉 △5一飛
▲7三歩 △同 金 ▲7四歩 △同 金 ▲5一馬 △8九銀
▲7一角 △同 玉 ▲6二金 △8二玉 ▲7二金 △9二玉
▲8二飛 △9三玉 ▲8四馬 △同 金
まで124手で後手の勝ち
引用終了

115手目、▲7一角と打たずに▲86歩と突いていればどうも先手が勝っていたようだ。
2chで検討されていた。

引用開始

69 :名無し名人:2013/03/04(月) 17:22:12.33 ID:nvHORMIc
▲86歩が詰めろ逃れの詰めろになってるってことなのかな
後手玉は85に逃げられないと詰むって言ってたし

自分じゃ読み切れないので誰か検討してくれw

80 :名無し名人:2013/03/04(月) 17:31:22.30 ID:4rVw9t/q
>>69
激指だと仰る通り▲86歩が詰めろ逃れの詰めろになり先手勝ちになりそう
もうすこし詳しく検討してみる

ってか△51飛って受けも相等すごいな これ以外後手の勝ちがない状況に持っていった人間もすごいが

83 :名無し名人:2013/03/04(月) 17:33:01.05 ID:nvHORMIc
>>77
もしかしたら俺が思ってるのと違う局面なのかも
たぶん>>57が言ってるのは115手目で▲71角といきなり詰ましに行かずに▲86歩で勝ちがあったんじゃないか、ってことだと思うんだが

94 :名無し名人:2013/03/04(月) 17:38:51.37 ID:nvHORMIc
>>80
おお、ありがとう
確かに△51飛は普通じゃ思いつかない手だわ

挑戦者の人もこれは予想外だったんだろうね
その後の歩打はただの時間稼ぎっぽいし

しかし、この人強いよな
居飛車を予想して対策してたから四間飛車は予想外だったって言ってたし

111 :名無し名人:2013/03/04(月) 18:13:22.80 ID:nvHORMIc
>>80
とりあえずbonanzaにやらせてみたら、▲86歩のあと△98金▲79玉△97金と香車を外してきた
これで後手玉の詰みは逃れているみたいだが、先手玉も詰まなくなっている
簡単には終わらなさそうだけど、後手の戦力不足で先手玉はほぼ寄らなさそうなので逆転してるっぽい

130 :名無し名人:2013/03/04(月) 19:40:55.93 ID:4rVw9t/q
>>69
>>111
▲86歩と突いたこの局面後手玉の詰めろになっていて先手玉は詰めろではない

単に詰めろ逃れで受ける手と△98金と王手をし剥がしながら詰めろ逃れを目指す手2通りある
単に詰めろ逃れをする手の主な候補手は△94歩△83玉△61金だが

(1)△94歩は▲62金△81金▲32飛▲71銀△63銀と一手一手 後手玉の詰めろを解除し先手玉に詰めろをかける
という状況はどうやっても作り出せない

(2)△83玉は▲53飛△73桂▲54角というように同じく上で求める状況は作り出せない

(3)△61金は▲同馬△78銀成▲同玉△61銀▲32飛△72金▲33飛成
この局面が▲94桂や▲83銀からの詰めろでこれを受ける手 △83銀などでは一手一手で持ち駒に角があるがそれだけじゃ詰みには程遠い


(4)△98金と香車を外してくる手は
▲87玉(詰めろ)と上がり

(a)△75桂には▲76玉(詰めろ)△65銀▲77玉△78銀成▲同玉で捕まらない
途中▲76玉や▲77玉の局面で△97金と香車を取る手は冷静に▲79金で先手玉安泰 

(b)△98金▲87玉に△97金(詰めろ逃れ)は
▲同玉が詰めろで△96香と追っていく手は駒が足りず駄目 
△85桂も▲同歩が詰めろで駄目


後手に詰めろ逃れの詰めろが求められる局面でそれが皆無なので先手勝ち確定だと思う

引用終了
このエントリーをはてなブックマークに追加
LINEで送る

gpsfishは強い

2013.03.02 Sat

21:44:47

人類vs最強将棋ソフト 勝てたら100万円!のイベントはやはり面白い。

今回はgpsshogiのバージョンを古いものにしてきた。
フリーズが続いたので反省したのだろう。
でも、見ている限りではなんとなく弱いように感じる。
争いを好むというか、不安定で一発を食らう感じのある戦いに突入している。
案の定、二人に負けて200万円を人間側が手に入れる。
一つの負けは終盤の手どころの部分で逆転をしている。
もう一つの負けは入玉模様の将棋で、うまく思考ができなくなって負けている。
古いバージョンのgpsshogiの弱点が出てしまった。

ここで面白かったのは、いきなりバージョンを上げて1日目のものに戻してしまったことだ。
解説のプロ棋士にフリーズするけど強いバージョンに変えたというのではなくて、「特にどうというわけではない。硬い将棋をする方に変えた。」と説明するのは苦しすぎる言い訳ではないか。
1日目のバージョンはチェスのStockfishというプログラムの検索部分をコピーして、評価関数の部分だけをgpsshogiのものを使っている。
だから名前をgpsfishに変更しているわけだ。

gpsfishにソフトを変更すると強い。
友達をなくす手を連発して、きっちり勝っていく。
入玉模様の将棋にもきちんと対応している。
電王戦の戦いにも準備万端といったところだろう。
明日も対局がある。
楽しみで仕方がない。
このエントリーをはてなブックマークに追加
LINEで送る

松本さんとgpsfishの対局感想

2013.02.27 Wed

21:57:27

電王戦の前哨として、ニコニコでコンピュータとアマの将棋対局が放送されている。
詰め将棋メモに必要なリンクは全てはられているので参考にして欲しい。
コンピュータに勝ったら100万円の賞金が出る。
持ち時間15分、切れたら30秒の秒読みというルールでは、人間にほとんど勝ち目がないと見ているのだが、善戦していた人がいて驚いた。

善戦した人は松本さんというのだが、ブログのアンチコンピュータ戦略の記事はコンピュータ将棋について参考になることが多いので、よく見ている。
その中で作戦を持って対局に行く話が載っていたので、気になっていた。
対局は事前に用意した作戦がピタリはまって、優勢になった。

アンチコンピュータ戦略(23)

gpsfishがはまるのは思考時間が足りないらしい。
浅い読みの部分で良しと判断してしまう。
もっと時間をかければ手が変わるみたいだが、15分という持ち時間だと悪手の角を打つ。
人間と比較するとコンピュータには危険察知の能力が足りない。
局面の岐路に立った場合、深く読むことがまだできていない。
floodgateの長時間の対局は、いろいろ工夫されているがまだ不十分だ。

もっとも人間は危険察知の能力があるので震えてしまい負けることもよくある。
しかし、震えずに指しているのが常にいいかというとそんなことはない。
30秒では予想通り人間はコンピュータについていけず形勢は悪くなってしまう。
ところがコンピュータは震えないので、自分の読みに自信を持って人間だったら本能的に一発食らいそうな局面に突っ込んでしまい、大逆転の機会が訪れた。

アンチコンピュータ戦略(24)

もっとも30秒で、こんな手読める人がいるのかと思う。
飛車銀桂を捨てているから、最後の局面の必死と自分に詰みがないことを読みきっていなくてはいけない。
当たり前だけど、実戦ではこの局面に勝ちがありますよと教えてはくれない。
ただ、コンピュータの終盤だって完璧というわけではないことを示しているわけで、人間にとっては勇気となる。

最後のセリフが熱い。
「自分、こんな一生に一度の舞台で、千載一遇のチャンスを逃して負けたんですか。本当ですか。」

最後にニコニコにはってあった棋譜をつけておく。

▲7六歩 △8四歩 ▲6八銀 △3四歩 ▲6六歩 △6二銀 ▲5六歩 △5四歩
▲7八金 △5二金右 ▲5八金 △4四歩 ▲7七銀 △4三金 ▲6九玉 △3二銀
▲7九角 △4二玉 ▲2六歩 △3一玉 ▲2五歩 △3三角 ▲2四歩 △同 角
▲同 角 △同 歩 ▲同 飛 △2三歩 ▲2八飛 △8五歩 ▲4八銀 △2二玉
▲7九玉 △7四歩 ▲6七金右 △6四歩 ▲1六歩 △5八角 ▲3八角 △8六歩
▲同 銀 △7三桂 ▲6八玉 △6七角成 ▲同 玉 △6五歩 ▲同 歩 △同 桂
▲9六歩 △7三銀 ▲4六角 △6六歩 ▲同 玉 △6四金 ▲6七玉 △5五歩
▲6六歩 △4五歩 ▲7九角 △5六歩 ▲6五歩 △同 金 ▲6六歩 △5五金
▲7七銀 △7五歩 ▲同 歩 △6四銀 ▲9七角 △6五歩 ▲7四歩 △6六歩
▲5八玉 △6五金 ▲2七角 △3三桂 ▲1五歩 △7六歩 ▲6八銀 △8四飛
▲7三歩成 △同 銀 ▲6九玉 △6四銀 ▲4九角 △7五銀 ▲1六桂 △8六歩
▲同 歩 △同 銀 ▲同 角 △同 飛 ▲8七歩 △8一飛 ▲1四歩 △同 歩
▲1二歩 △同 香 ▲2四歩 △同 歩 ▲同 桂 △2三歩 ▲1二桂成 △同 玉
▲1八飛 △2四角 ▲2八香 △6八角成 ▲同 玉 △6七銀 ▲同 金 △同歩成
▲同 角 △1五桂 ▲7八銀 △6六歩 ▲4九角 △6七金 ▲同 角 △同歩成
▲同 玉 △6六歩 ▲5八玉 △6七角 ▲同 銀 △同歩成 ▲4九玉 △5七歩成
▲1五飛 △5八と右 ▲3八玉 △4八と寄 ▲2七玉 △3八銀 ▲1八玉 △1五歩
▲1四銀 △2九銀不成▲同 玉 △3九飛 ▲1八玉 △2六桂 ▲2七玉 △3八飛成
▲2六玉 △2八龍 ▲2七桂 △3五銀 ▲1五玉 △1九龍 ▲1六歩 △2四銀
▲2六玉 △2五香

まで154手で後手の勝ち
このエントリーをはてなブックマークに追加
LINEで送る

コンピュータ将棋で入玉に強くなるアイディア

2013.02.16 Sat

22:05:43

コンピュータ将棋は入玉模様の将棋に弱い。
これにどう対応したらいいか一つアイディアが浮かんだので書いてみる。

結論から言うと、トライルールで指すように実装して、トライが確定したら持将棋モードに移行するというものだ。
トライルールは何かと言うと、先崎棋士が提案した持将棋に替わるルールで、自玉が相手玉の位置(5一か5九)に到達すれば勝ちというものだ。
ただし、その位置に相手の駒の効きがあってはならないとする。

参考:その一 持将棋とトライルールその九 トライルール運用状況

コンピュータが入玉模様の将棋を苦手なのは、結論が長手数のかなたに飛んでいってしまって、コンピュータの有限の個数で予測できる範囲を超えてしまうからだ。
最終的な結論が出る前に形勢を判断するのが評価関数だが、持将棋と普通の将棋では全然に異なっているので両立できない。
これはプロ棋士が言う、入玉模様の将棋は将棋とゲーム性が違っている、と評することからもわかる。
だから、現在のコンピュータは入玉模様の将棋は苦手だ。
詰ましにいって自爆するのをよく見ることになる。

ではどうすればいいか。
入玉模様の将棋であることを擬似的に判断できれば、それでモードを変更して戦うことができる。
擬似的な判断方法がトライルールというわけだ。

トライと入玉はどのくらい一緒に扱えるだろうか。

まず、入玉が確定すればトライが確定するのは確実である。
玉が相手陣営に入って詰まなくなるということは、金を量産できる状態を意味する。
その金を寄せていけば絶対にトライできる。
守備側はどんなに努力しても桂香歩では守りようがない。

それでは逆にトライが確定すれば入玉が確定したと言えるだろうか。
コンピュータがトライルールで動作するとなると、トライできたはいいが詰まされる可能性もある。
トライして詰まされるというのは、たとえば相手が人間だとわざと玉の侵入を許し、トライした後詰ますような技だ。
これはトライが確定したと読み切れた時点で持将棋モードに移行すれば問題はない。
問題なのはトライが確定しているのに、本質的に入玉がはっきりしていない状況だ。
ただこの可能性はそれほど大きくはないと思う。

トライルールで中央からトライを目指そうとすれば詰まされる可能性が大きくなる。
できるだけ隅から寄っていった方がいい。
これは普通に入玉を目指す方法と変わらないだろう。
逆にトライルールでトライを阻止しようとすれば、中央を固めて待つだろう。
そして飛車や金のように横に動く駒がなければ、相手玉が最下段に到達した場合防ぐ方法がほとんどないこともわかる。
つまり、トライルールで動作しても、普通に入玉を阻止する指し方と変わらない。
コンピュータにとっては、トライルールで動作した方が普通に入玉を意識して指すよりもうまく指せるのではないだろうか。
とにかく判断が無限のかなたにいってしまうことがないのがうれしい。

入玉できたかどうかの判断は難しい。
人間にだってよくわからないのが本当の所だ。
人間は入玉模様の将棋になると、宣言勝ちを目指すのと詰ますのと両にらみで指しているのだと思う。
だから相手玉が詰みそうもない状態ならば、とにかく自分も入玉して駒をできるだけ取りにいく。
自玉が入玉できれば、相手玉の入玉を阻止できさえすれば勝利は必然だ。
コンピュータがこの両にらみの判断で動作するのが、持将棋モードになる。

コンピュータにとってトライルールで動作してうれしいのは、入玉という判断を擬似的で簡単な判定で代替できることだ。
トライの評価値を詰みと同じマックスの値にするのは簡単にできる。
そして、これだけの変更で自然と入玉を目指すようになるかもしれない。
今のコンピュータは20手ぐらい先読みできるのだから、阻止する駒がないと判断できればトライを目指しても不思議ではない。

持将棋モードに移行すればコンピュータは基本的に宣言勝ちを目指す。
駒取りが主体になるので、評価関数は持将棋モード用に作り直す。
大駒を5点、小駒を1点と評価するような単純な評価関数でも十分役に立つのではないだろうか。
後はコンピュータの力を利用して全幅検索で対応だ。
当然詰む詰まないについては、適宜判断する必要がある。

コンピュータ将棋のアイディアというのは、実際に実装してみると役に立たないことがほとんどと聞く。
このアイディアも実際に実装すると、それほどたいしたことがないのかもしれない。
しかし、入玉模様の将棋に関しては、基本的に別モードで動くのが正しいと思う。
とにかく、宣言勝ちを目指す機能は絶対に必要だろう。
それを実装していないソフトが悲惨な負け方をするのはよく見てきた。
モードの変換をどのタイミングにするかは、実装して研究する必要があるだろうけれども、トライルールが確定したら持将棋モードに変換するというのは、最初の出発点として考えられると思う。
このエントリーをはてなブックマークに追加
LINEで送る

続:Blunderの将棋が凄い

2013.02.11 Mon

21:26:07

floodgateで対局しているBlunderの将棋が凄いと幾つか紹介しているが、他の対局がそれほどでもないのが気になっていた。
勝ち負けの差というより、消費時間の使い方がどうも理屈に合っていない。

関連記事
Blunderの将棋が凄い
コンピュータ将棋最高峰の一局

今日その理由かもしれない記事を見つけることができた。

Bonanzaの評価関数とStockfishの探索と

長時間floodgateのソフトを修正している話かどうかわからないが、Bonanzaの評価関数部分とStockfishの探索部分をBlunderの独自開発部分と差し替えて効果を確認しているみたいだ。
それが微妙にソフトの違いにあらわれているのかもしれない。
ただ、時間の使い方とは話が違う気もする。
ソースを見てもいない人間の分析には限界があることを感じた日でもあった。
このエントリーをはてなブックマークに追加
LINEで送る