粤文化,阅观点,悦生活……
街巷探秘:讲古佬带你品味隐藏于羊城老街巷的传奇故事
发新帖
详细内容

心理学问答:为什么AlphaGo与李世石的对弈会赢?

可乐鸡翅 发表于 2016-3-10 |0条回复 |1249次浏览

更多
QQ图片20160310155056.jpg


问:AlphaGo与李世石的对弈,谁更可能赢?

  答:近日,随着美国Nature杂志封面报道了Google的围棋AI系统AlphaGo去年10月以5:0的比分轻松战胜欧洲围棋冠军,职业二段樊麾,创下了AI系统第一次战胜职业围棋手的记录。而且,今年3月,AlphaGo将与世界冠军,韩国职业九段棋手李世石对弈。一时间,AI(人工智能)系统对人类的挑战就成为了热门话题,尤其以文科生的脑洞开得尤其巨大(此处无贬义),竟由此慨叹道:人类终于抵达永生的门槛。

  从认知科学的角度而言,AlphaGo所取得的成就固然具有里程碑的意义,但如果放置到AI与人类智力等量齐观的角度,仍然只是在原有基础上稍有寸进。而且从1980年代最早提出神经网络的概念,到去年AlphaGo战胜职业围棋手,已经经历凡30余年,进展其实并无太多出彩的地方,虽然每一次寸进都相当艰巨。

  AlphaGo与之前的围棋AI不同,从AI技术的角度,它的技术非常简单,但功能非常强大。这主要取决于它在传统围棋AI所使用的最先进的蒙特卡洛树搜索( A Parallel Monte-Carlo Tree Search)算法基础上,增加训练了两个神经网络,其中之一为“策略网络”(Policy Networks),选择下棋的步法;另一为“价值网络”(Value Network),评估棋子在棋盘的位置。这两个神经网络能够极大地精简和优化AlphaGo的搜索算法工作量。开发AlphaGo的研究团队Deepmind通过至少(截止报道采访时)2000万局的AlphaGo自我对弈训练来获得类似人类棋手下棋时的经验和模式。

  神经网络是认知心理学及庞大的学科群认知科学于30多年前提出的区别于早期基于信息加工论的模拟系统。现代认知心理学是与AI系统同步发展的一门学科。当图灵提出图灵机概念,推动和促进了计算机科学和AI的发展,并进一步推动了现代认知心理学的崛起。最早基于信息加工论的认知心理学,是试图用计算机的运算机制来推测和解释人类的大脑,那时候的AI系统是模拟人类的行为实验和基于行为实验发展的各种理论模型,忽略甚至无视人类大脑的神经生理现实。随着脑科学和生理学的发展,1980年代中期提出的神经网络(neural network,又称为平行分布加工模型,parallel distributed processing model, PDP)就抛弃了早期的信息加工论,而是直接模仿人类大脑的神经元网络来设计AI系统。像1980年代末,心理学家Seidenberg和McClellan就开发了一个可以自己学习朗读英文课文的神经网络,在没有输入任何发音规则的情况下,通过250组的训练,该神经网络对英文单词的发音准确率超过97%。

  因此,AlphaGO能战胜职业棋手,从神经网络的发展角度来看,是相当自然而然的一个成果,其关键是设计者对算法和计算规则的构造。从AlphaGo能战胜欧洲围棋冠军来看,显然Deepmind团队取得了突破。实际上,对一个设计正确了的神经网络系统来看,从战胜职业2段到战胜职业9段并没有难以逾越的瓶颈,而且从去年10到今年3月,近半年的时间里,Deepmind团队可以游刃有余地给AlphaGo足够的训练以进一步提升对弈实力。

  因此,从理论上说,AlphaGo战胜李世石的概率相当大。道理很简单,AlphaGo作为一个设计成功的AI系统,它会稳定发挥;而李世石作为人类将受到具身(embody)的认知局限,如工作记忆容量有限,记忆提取效率很容易受到情绪、动机的影响以及不可避免会出现各种认知偏误,并且在压力情境下愈加明显。AlphaGo显然就不会受到这些限制,唯一能限制它的就只有Deepmind团队的设计瓶颈。因为Deepmind设计团队与李世乭一样,具有一切人类认知的软肋和局限。

  总而言之,AlphaGo战胜李世石势在必然。至于是否在今年3月的对弈中就取胜,则要看Deepmind设计团队有没有犯致命的错误,特别是训练AlphaGo自我对弈的棋局选择上有没有真的做好准备。

QQ图片20160310155308.png


文:唐映红
微信:psy-eyes
更多
发新帖
您需要登录后才可以回帖 登录 | 注册

Copyrigh 2016 羊城网 All Rights Reserved.   

回顶部