首页 常识
当前位置: 首页 > 常识 >

阿尔法狗长什么样子的(阿尔法狗AlphaGo原来是个大傻瓜)

100次浏览     发布时间:2024-10-01 08:24:17    

当今世界就行的几大棋种围棋、象棋、国际象棋、日本将棋人类棋手完败于计算机程序。最为厉害的程序是阿尔法(AlphaGo)狗系列,已经能够在不需要人类任何知识的前提下,自我对弈学棋,并战胜之前以上棋种的任何顶级程序。。

看似威力无比的阿尔法狗,其实没有那么可怕,在“奇袭象棋”年前它就像个傻瓜,为什么这样说呢?因为下这个棋,阿尔法狗学不会。原因是无法编程。

为什么奇袭象棋不能向以往棋类那样进行编程呢?原因就是奇袭象棋的车、马、炮变革为以下形式:


(图一)

(盘面不出现两个以上的车、马、炮前提下)(有丢子才有翻子权利)它们可以原位翻转使用,并记作一步棋。又由于它们的暗面保密,对手不得而知,所以棋子存在着不确定性,不能提前以程序的办法规定如何走棋。如图:

(图二)

(图二)7路黑炮卧槽处打红车,红方面临重要选择,因为7路黑炮暗面可能车,也可能是马。如果是马,若逃走九路车,必被绝杀。如果暗面是车,本毫无威胁,却丢掉了大车,实在可惜。此时,两棋手之间,经验与敏锐的洞察力可能十分重要,必须以棋盘之外的一些蛛丝马迹,来进行决策,而这些蛛丝马迹同样有真假虚实之分。非常微妙。

如果是机器,这时必须有明确的规定(编程中的明确指令),机器才会下棋,而此处如果用明确的指令,就会被对手发现规律,必败无疑。然而,命令不固定则无法编程。

不过,计算机的巨大优势是它强大的计算能力,它可以提前做出防御,不给对手走到比局面的机会(比如提前看守住卧槽),其实,人类棋手也会做到这一点,只是电脑一定比人强大,而且不会漏算。

同时,电脑很可能倒霉在这个强大上,因为处处防备本身就是一种明确的意图,被对方掌握以后同样造成被动。另外,“处处防备”面临复杂的环境,因为盘面多处都有真、假、虚、实之分。《孙子兵法》讲“故形人而我无形,则我专而敌分。我专为一,敌分为十,是以十攻一也…………故备前则后寡,……备左则右寡……无所不备无所不寡………”。可见,就算他再强大的计算能能力,也不一定有强大的战斗力。

如果是目前最先进的棋软又会怎样呢?比如像阿尔法元这样顶级棋类人工智能,如果下奇袭象棋会怎样的状态。

阿尔法元只需要规则不需要任何人类知识,围棋自我对弈四十天,完胜之前所有顶级版本,根本原因是算法先进。不过再先进,也无一例外在完全信息环境之下,是对确定性信息的计算。所谓深度学习,其实质是统计学中运用了新的算法。

奇袭象棋有很多环节利益不确定,假如机器也是自我对弈,同样的局面有多种解释,显现多样利益,到底是哪一种,究竟孰轻孰重,盘面很难判定,而机器所有的信息来自盘面,所以无法提前做明确指令。

(图三)

(图三)黑方3路马被捉,考虑红方久路车可能隐藏暗炮,若马3进5吃红兵,恐红车八平六,危险性极大。黑方决定弃马反捉红马。(图四)


(图四)

虽然,红马四进二直奔卧槽,下步即可入局。但是,黑方或”车6暗马”,下步”车6变马”,再”炮5平6”,绝杀。红方此时最为稳妥的是选择马四退三防守,争取时间,但是,进马诱惑太大一般难以把握。红马到底是进,是退,不同的人、不同的环境、不同………选择会不同,即便这些因素都相同,人的思维始终在变,一会儿认为真,一会儿认为假,随时都可能改变主意。

夸大些讲,就这一个局面,两个人可以永远的玩下去,每次都可以针对对方心理有不同的思索和决策。《孙子兵法》“战势不过正奇,正奇之变不可胜穷也”、“如循环无端,孰能穷之?”

所以,奇袭象棋是真正在展现人类的智慧,目前,再先进的程序也将无所适从。



相关阅读
乖张是褒义还是贬义(远离性格乖张之人) 一磅等于什么(生活大揭秘磅与斤) 乌镇在哪里(桐乡乌镇) 光荣军属牌发放规定怎么领(光荣之家牌怎么领要什么材料,找谁领?) 终止子与终止密码子的区别(一文读懂质粒图谱!) 红绿灯倒计时导航怎么识别的(手机导航是怎么知道红绿灯倒计时的?) 奥斯卡奖的由来简介(奥斯卡金像奖的前世今生) 酿皮子是什么做的(酿皮子,甘肃人自己的凉皮)