今年5月,阿尔法狗以3:0的比分打败中国棋手柯洁,胜利宣布退役。之后,阿尔法狗的开发公司继续深化研究,终于在昨天,10月18日,最新版的阿尔法狗诞,代号AlphaGo Zero。
这个阿尔法狗0,最厉害的地方在于它能自我学习、自我成长。它是从一片空白开始,零基础学习。通过自己学习,很快成为当今世界的顶级高手,水平超过之前所有版本的阿尔法狗。
阿尔法狗0一开始就和曾拿下韩国棋手李世石那版阿尔法狗进行对决,结果取得了100:0的压倒性战绩。
这么厉害的版本,竟然是靠它自己学习成长的,这才是真正的突破,是人类在机器人领域迈出的新的一步。
它是如何自己成长的?原来,作为围棋机器人,它竟然没有使用到任何人类围棋数据!它是自己思考得来了!
这不是有点像人了吗?靠自己思考,而不是靠数据算法。
就是说,此前各个版本的阿尔法狗,都是通过对几百万人类围棋专家的棋谱进行分析计算,并在有监督的学习中进行了训练。而现在这版的阿尔法狗,从来没有接触过人类棋谱,不再需要人类数据,仅依靠多台机器和48个TPU(TPU,是谷歌专为加速深层神经网络运算能力而研发的芯片),自由随意地在棋盘上下棋,然后进行自我博弈。
短短三天时间,进行了近5百万盘的自我博弈以后,这个阿尔法狗就击败了此前所有版本的阿尔法狗,而且,已经完全超越人类。
最要命的是,即使到了这一步,它还是在继续进行训练,还是在继续取得进步。它的自我博弈的成绩也越来越好,神经网络也变得更准确。
它自我学习的过程是:一开始什么都不知道,相当于一片空白。它从单一神经网络开始,通过神经网络的搜索算法,进行自我对弈。在自我博弈不断增加的过程中,神经网络也不断调整,逐步地提升预测下一步的能力。在这过程中,它还能够独立发现游戏规则,制订新的策略,打出新的方法。这些策略与方法,是人类从没有过的。
这意味着什么?
这意味着,机器人的成长,不再需要灌输人类知识,不再受到人类知识限制,它可以自己向自己学习。
这就像,当现代科学出现以后,人类就不再依靠上帝,开始自己发展、自己进化一样。
想想现在,科学的信徒们是怎么嘲笑宗教的,是怎么蔑视上帝的,就可以想象,以后机器人也会嘲笑我们、蔑视我们。
这并不是天方夜谈地乱说,这正是新版阿尔法狗的方向!因为它在围棋方面的突破,只不过是一个试验而已,它的目标,正如它所在公司的创始人所说:“最终,我们想要利用它的算法突破,去帮助解决各种紧迫的现实世界问题。”
也就说,围棋只是阿尔法狗进行学习成长的第一个步骤罢了,它的目标,是要成为通用的、探索宇宙的终极工具,在成为改变人类命运的有力武器。
照这个趋势,人类是挡不住它的脚步了。
本文来源:【狂赞派】版权归原作者所有
责任编辑:金林舒
- 最强阿尔法狗诞生,自学3天成顶级高手,人工智能会取代人类吗?2017-10-19
- 最新科技前沿 频道推荐
-
夏普收编康达智 发力相机模组意在苹果2017-11-12
- 进入图片频道最新图文
- 进入视频频道最新视频
- 一周热点新闻
已有0人发表了评论