关键字: 围棋 国际象棋 中国象棋 人工智能 Master AlphaGo Stockfish 数据分析
柯洁与阿法狗的三番棋较量,今天(《宇视》编者注:2017 年5 月27 日)迎来了最后一场。其实早在围棋之前,其他棋类AI 就已经刮起过世界级的旋风,在过去二十年里,至少有过两次,都带有革命性、颠覆性的意义。
如果把1996年与卡斯帕罗夫对弈的“深蓝”比作横空出世的利维坦(Leviathan),最近一次在棋界刷屏的则是它的“赤屁股兄弟”比希莫斯(Behemoth),这两个人造怪物在几乎是纯智力比拼的场合中接连将一流顶尖高手挑落马下。
虽然在十多年前研究国际象棋残局的专家穆勒(Karsten Müller)就预计,顶尖围棋棋手臣服于AI 脚下并不遥远,但是这一天到来之时,还是让广大棋迷不胜唏嘘,因为对今天的国际象棋(以下简称国象)和中国象棋(以下简称中象)来说,普通PC 机上的某一款软件就可以随便吊打世界级棋手,围棋几乎已经成了棋类中保有人类尊严最后的地盘。
国象的AI 到底强到什么程度?看美国华尔街日报的一篇报道就可窥一二。2016 年4月,美国顶尖的日裔棋手中村光来了一场人机大战,但必须要“机”让一个兵(下图中白方Komodo 让了一个f2 兵),最后才勉强逼和。中村光在美国棋手中骨骼清奇天赋异禀,而且喜欢搞怪,两年前他曾心血来潮,假装以普通棋手的身份在街头摆摊挑战路人,赚了300 多美元。
冢中枯骨?枯骨也能在冢中舞
1997年卡斯帕罗夫负于深蓝之后,世界舆论大哗。颜面无光的老卡(和“三卡”中的卡尔森比他绝对算老卡)喝了半杯伏特加,涨红的脸色渐渐复了原,旁人便又问道,“老卡,你当真是世界头号棋手吗?怎么执白20多步就被反先了?”老卡看着问他的人显出颓唐不安模样,脸上笼上了一层灰色,嘴里说些话,这回可是全是“有人帮机器作弊”,“卡罗康防御太消极”之类的话,众人也都哄笑起来,棋场内外充满了快活的空气。
在卡尔森成长起来之前,国象界的很多名宿甚至认为老卡创造的2857分的等级分将是人类棋手不可逾越的高峰。
棋手个人史上最高积分前十名(注:这是棋手动态积分的最高,不是国际棋联月初公布的官方等级分),图片来源:作者截图
笔者在此模仿一下鲁迅,拿老卡砸个挂,并非不敬,而只是要说明,今天人类如果想在棋盘上和引擎一较高下,就如同孔乙己以回字的四种写法一样妄图复士大夫昨日之荣光。
虽然在过去一百多年的历史上,无论是国象还是中象,在没有AI 辅助的情况下,都经过了从战术型(tactical)到局面型(positional)的理论进化,换言之,每一步棋之后的局面分析已经取代了原有局部范围内的战术组合(哪怕这种战术组合很有美感),成为职业棋手必须优先训练的项目。但是,今天国象和中象棋手的中局变化、深度计算以及残局推演在AI 面前都成为了冢中枯骨。
但正所谓“天道损有余而补不足”,尽管棋界没有人会认为国象和中象的game tree(游戏树,直接决定棋类的计算深度)会高过围棋,但在围棋界还在纠结棋盘内的胜负的今天,国象和中象已经完成了优雅的转身,驶进了一个“互训”的新局面:即AI 的计算和数据呈现辅助棋手训练,棋手以实战场景帮助优化AI 的运算模式。当然,绝艺等围棋AI 现在也已经在这方面有了一些尝试,但仍无法与国象界的“互训”相比较。
以国象为例,在AI 的研发与反馈利用方面,已经开辟了一个具有相当深度和广度的理论范式,这一点上倒是和“逻辑经验主义”的路线图颇为类似,即通过早先较为粗糙地采用“穷举法”存储开局库,模拟人类对战,在繁复的“变招”中拣选出最优解,然后把这些暂时的“最优解”投放到世界头号棋手的实战中进行二次反馈,虽然这些过程都是在归纳主义的运行逻辑下进行的,但这种具体而微的“覆盖率演绎”模型是以达到未来可观测效应的预测系统为导向的,而且此模型对“归纳——演绎”两种古老推论模式的交互运用,能迅速提高AI 自我学习的能力。
对此,我们不能不提国象AI 居功至伟的“群像”作用。
和围棋目前阿尔法狗暂时独霸天下的局面不同,在国象的“凌烟阁功臣谱”上,至少就有Houdini,Komodo,Rybka, Stockfish 等众多实力接近的机器人高手群芳争艳,围棋迷们设想的阿尔法公狗和母狗左右互搏的局面,在国象AI 的研发领域里已能初见端倪。
《周易·系辞》中有六字真言:物相杂,故曰文,与国象的“品色繁殊,才能目悦心娱”(Varietas delectat)的拉丁文古训若合符节。
也就是说,如果能在AI 的研发中形成比学赶帮超的竞争局面,无疑对推动这个行业向前发展是极为有利的。
在著名的国际象棋对战直播网chessbomb上,已经成系统地、有规模地举办了多年的AI比拼大赛,令广大棋迷大饱眼福。如图:
图片来源:chessbomb截图
在今年最后的超级总决赛中,冲破重围的Houdini 和擂主Stockfish 展开了惊天动地的百轮大战,最终Houdini 稍逊一筹,以45.5 比54.5 负于对手,这也再次确立了Stockfish 的AI 总盟主地位。
广受棋迷喜爱的英国国际象棋解说员丹尼尔· 金(Daniel King), 在观看第70 轮Stockfish 执黑输棋的过程中,对Stockfish 评价如下:“在绝对的败势下它好像发出了嘶嘶声(hissing),和其他同类的引擎不同,在陷于绝境时并没有自暴自弃,还在执着地进行着挽回颜面的深度运算,它表现出的是一个对失败充满厌恶感的,有孩子气的棋手一样。”他这个充满人类情感的评论,也许能从侧面说明为什么Stockfish 目前是各类国象AI 的翘楚。
以王翼印度防守开局的Stockfish,在残局中形成了双马对象车高兵的不利局面,最终败北,图片来源:chessbomb截图
此外,国象AI 在微观和宏观的盘内计算和盘外资料过滤,为国象的理论研究提供了海量的经验数据(empirical data),反哺了棋手在中局搏杀中战术组合多样化能力,也纠正了大批棋迷一直以来对局面判断的固有印象。
在此仅举一例,斯堪的纳维亚防御(白方e4, 黑方对以d5)被棋界广泛诟病为出动子力太慢,在高水平对局中已经比较罕见,而且一线教练不建议初学者采用此开局(有些类似中国象棋中的飞象局,笔者对弈时,曾遇到过以飞象局对五七炮的局面,这类棋手往往对自己的中盘厚实的磨缠功底很自信,给笔者传授了不少后发制人的人生经验)。
但是Stockfish 给出了最近10 年2700 等级分以上的棋手(2700 分是世界级棋手的一道坎)的对弈数据,显示黑方用斯堪的纳维亚防御的和棋比例有65.7% 左右,负的比例为11.3%,胜率居然高达23% !这一胜率绝对超过了柏林防御和格伦菲尔德防御等一大批常见防御开局,这让棋界理论家们这些年以来不得不重新审视这一“非常规”的冷门开局。
国象AI 的迅速发展不是在一朝一夕间完成的,拿Stockfish 来说,数年来它从未停止过自我革新的步伐,虽然直到今天它仍非完美,但相比几年前已经进步许多,比如在2013 年的阿廖欣纪念赛上,首轮由中国棋手丁立人对阵亚美尼亚头号棋手阿罗尼扬,Stockfish 在中局的一个弃子变例中把局面误判为了双方重复三次的和棋,而忽略了丁立人有底线挪车(Re1)的胜招。
图片来源:chessbomb截图
中国象棋:寡与众的反差
国象中象,心同理同,汉语中都以一“棋”概括(包括围棋),含一月映万川之意。事实上此二棋界的职业棋手基本上都能兼通,这也是老一辈棋手留下来的宝贵的训练方式,如1962 年出生的棋界老江湖徐俊早年投身中象,后来半路出家转攻国象,也拿到了GM(男子特级大师)的称号。由于这两类棋种的近亲关系,笔者也时常能读到一些有趣的小品文,比如“国象如果有炮会如何”,“中象可否有兵的升变”等脑洞大开却很有启发性的探索文章。
而且,新一代的职业棋手,无论国象还是中象,都是靠AI 训练出来的“半人半机”的新型棋手,如丁立人、余泱漪、王天一、郑惟桐等,各类软件引擎是他们日常训练时不可缺少的辅助工具,这与当年叶江川、胡荣华们背着厚厚的棋书满世界跑形成了鲜明对比。围棋AI 分析专家陈经先生在文章中就曾提到,由于王天一下棋很像AI,曾被指责有作弊的嫌疑。
文中前面提到,在人类棋手被AI 吊打已成现实的情况下,国象走出了“弈”“研”结合,双翼两驱的路子,而反观中象,不得不一声叹息:呈现出了尴尬的“寡”与“众”的多重张力。
大体说来,就是进弈者众而退思者寡,善其事者众而利其器者寡,博论者众而约理者寡。在围棋、国际象棋和中国象棋这三类受众面相对较广的棋类中(五子棋和跳棋爱好者们,今天算得罪你们一下),毫无疑问中象有着最广泛的群众基础。不说别的,就拿观网这些年报道的街头摆棋摊骗钱的新闻就可见一斑,骗术的基本法其实就是靠着极为厚实的群众家底来支撑的。但很遗憾的是,中象在AI 开发程度不弱于国象的局面下(比如倚天、象棋巫师、棋瘾等实战效果都得到了业内肯定),业界在数据分析、优劣势量化的系统性反馈进展却很缓慢,尤其是在比赛资料库的建立方面很是乏力。
举一例来讲,国象中执白的一方由于是先手,那么这个先手量化为棋盘上轻重子的权重,大约应该是多少?德国莱比锡大学数学系的研究团队的计算结果是:0.37 个pawn(兵)。也就是说,执白先走的一方,一开始就相当于比黑棋多了0.37 个兵。而且马与象的兑子在何种局面下对等以及不对等,都有深度的探索。而中象在这方面的研究进展如何?笔者斗胆直言,在对AI 的研究和利用方面,国象至少领先了中象一个车的优势。
我很期待有读者拿出具体数据和文章链接打我的脸。虽然我很享受这个打脸的过程,但还是不得不问一句:就算你给了我链接,这些内容有专业且统一的发布平台吗?这就涉及到另外一个问题, 中象到今天为止, 连一个能和国象的chessbase、chessbomb 对等的网站都没有,在10 多年前中象直播的低潮期,某“王子”兢兢业业地为棋迷们手动现场直播录入棋局,却因为他是疑似“蒋胖”(蒋川)的粉丝,被其他粉丝们大骂。其实今天中象业界绝对不乏学者型棋论者,可惜由于资金以及组织问题,往往各自为战,一盘散沙,没有形成合力将棋论的深度推向更高的层次。
最令笔者感到不解而且悲哀的是,多年前的中国象棋的个人锦标赛上,棋手和裁判还在因为“长将长打”问题争论不休,一方面是比赛组织管理人员和棋手之间的沟通不到位,一方面则揭示了中象当年旷日持久的规则明晰性难题。
很多棋迷在谈到比赛规则时,讨论往往都在集中在规则的“公平度”上,而忽略了公平度之外的另一个重要前提,就是明晰性(explicity)。只有在彻底剔除规则的模糊性(ambiguity),让棋手对规则的理解明白无误且“普世”的前提下,才能谈是否公平的问题。这方面,也许可以说国象某种程度上牺牲了比赛的观赏度(比如,双方三次重复不变就是和棋),但绝对保证了规则清晰可理解:只有杀王才能算将死(checkmate),而困死对手(stalemate)只能算和棋。其实解决中象规则明晰性的问题并不难,只需类似于增加国象中的“索菲亚规则”那样的附加条款,就可以既让棋手和裁判不至于产生误会,也能保证比赛的观赏性。
另外不得不提的是,中象上述众与寡的反差,根子并不在棋盘之内,而在之外。多年以前,一篇吐槽中国象棋甲级联赛比赛现场的文章吹皱了业内的一池春水,文章尖刻地抨击了赛场内种种不专业的现象,比如参赛选手邋里邋遢,居然有穿着短裤拖鞋的棋手魏晋风度般地晃进了场内,而且进场前棋手根本没有进行防作弊的身检;比赛中喷嚏、打嗝、哈欠、屁声不一而足,裁判员和书记员时不时还嬉笑打闹一下。
当时,“屌丝”这个比较低俗的词才刚刚在网上传开尚未大肆流行,所以文内一句“棋手穿的都跟个穷屌丝似的”让笔者印象很是深刻。稍显刻薄的行文却的确反映出了中象包装不力的难堪事实。读者可以浏览下面两张图,分别是李炳贤对王天一,和王天一对郑惟桐,都是国内中象最高水平的个人赛。第一张双方在没有空调的赛场内只能穿着厚厚的衣服,第二张围观的吃瓜群众在旁边吸溜吸溜地喝水。
图片来源:见水印
让我们再看看围棋和国象,场内寂静肃穆,棋手穿着职业,工作人员也个个正襟危坐,赛后的新闻发布会的规矩、板眼更是不在话下:
图片来源:棋赛官方网站
如果把对弈比作战争,在有正式组织的高等级棋手的比赛场上,围棋和国象感觉有宋襄公拒绝“半渡而击”的贵族骑士风范,而中象就好比是张士诚和陈友谅的“盐渔互撕”。虽然自2011 年以来,中象棋协认真反省了这个问题并有了不小的改观,但某些长久存在的顽疾要治愈尚需时日,比如赵鑫鑫“买棋”案,头号棋手王天一身份造假案(弄了一个化名,参加了农民象棋比赛,被棋迷揭露后,送给了他一个“王农民”的讽刺性绰号)。就在最近,爆出了王天一因为被拖欠薪水不得不起诉“老东家”的新闻,继续给中象的管理体系敲响警钟。
结语:方寸棋盘内,家国天下中
文章写到这里也进入了“残局”阶段,也该到了贩卖点私货的时候了(此处应有画外音:好像你之前的行文就不是私货似的)。在马象联营,车炮滚滚的棋盘上,绝不是单纯的原子个人的智力较量。20 纪初,俄国棋院的成立与发展就是为了阻挡社会达尔文主义者喷出的毒液;70 年代美国人费舍尔在棋王大战中战胜苏联人斯帕斯基之后,尼克松喜笑颜开地送给了勃列日涅夫一个棋盘;80 年代有多少国人为聂卫平热泪盈眶,他和五连冠的中国女排一起,诠释了一个振兴中华、奔向四化的崭新时代精神。
当2014 年中国国象团体男队拿到奥赛金牌的时候,总教练叶江川说中国的国象已经完成了三步走的其中两步:女子棋后(已经拿到手软了),和男女团金牌(男女加起来都6个了)。接下来要完成第三步:培养出一个男子棋王。叶老掷地有声,笔者不免狐疑几句:国际象棋西方玩了上千年的东西,你满打满算真正玩才30 年都不到,要给他们留点饭碗啊。
冷战时代,美苏争霸的另一个战场,图片来源:资料图
那么中象呢? 20 年前,象棋AI 还只是海岸遥望海中已经看得见桅杆尖头了的一只航船,如今这只航船早已登陆后再次扬帆起航。中象人必须要有面向全世界的眼光和雄心,在AI 的高端研究,以及中象的推广方面砥砺前行。马嘶象鸣,吞吐韩流日潮,车驰炮击,收放欧风美雨。
(本文得到了陈经先生的修改和校对,谨此致谢)