酷知网经验知识百科全书!
你好!请登录
登录

100:0,新AlphaGo放弃了人类?优质

669次浏览 | 2020.03.06 17:36:39 更新
来源 :互联网
最佳经验
本文由作者推荐
  • 01

    2017年10月19日,谷歌子公司DeepMind发布了AlphaGo的新版本。很多人知道AlpoaGo是一个人工智能程序,却不知道它其实是一个家族,早期战胜韩国选手李世石的是AlphaGo Lee。在乌镇击败世界冠军柯洁的是AlphaGo Master。本次发布的是AlphaGo Zero(阿尔法零),它经过3天的训练便以100:0的战绩击败了他的哥哥AlphoGo Lee,经过40天的训练便击败了它的另一个哥哥AlphoGo Master。

    AlphaGo Zero与之前版本相比,最大的区别在于,它不再依靠人类的指导来成长,即之前的AlphaGo Lee是依赖于人工录入的大量棋谱来帮助其学习如何下棋,说白了,它是在人的指导下学习,可以理解为是人类千年围棋经验教出的学生。

    而AlphaGo Zero使用了强化学习算法,即不再依赖任何棋谱,编程人员输入围棋基本规则后,不再进行任何教导,完全由其自己进行摸索,总结走棋方法,相当于人工智能完全按照自己的方法学习。AlphaGo Lee完败于摒弃了人类经验的AlphaGo Zero,这说明人类的经验可能误导了AlphaGo Lee,进而限制了它的发展。

    AlphaGo Zero的行棋方式在开局和收官阶段,与人类选手有较大的相似之处,而盘中的行棋风格的确与人类选手和之前版本的AlPhaGo有较大不同,而正是这种不同让其可以在100次与AlphaGo Lee的交战中立于不败,换个说法,如果当初AlphaGo Lee没有拜人类为师,而是向机器学习,那么对于拥有更强计算能力的AlphaGo Lee来说,胜负还未可知。

    除了零经验学习外,AlphaGo Zero的另一大特点是将之前版本AlphaGo的两个神经网络融为一体,在之前版本的AlphaGo上,如何走棋是由“策略网络”和“价值网络”两个神经网络来计算如何行棋的,即首先由“策略网络”利用之前累积的经验,判断在当前棋型下哪些位置适合行棋,之后由“价值网络”对在这些位置行棋后的种种可能进行模拟,计算胜率,最终选择出行棋位置。

    而AlphaGo Zero将二者融为了一体,对之前两个网络的特征提取等模块进行了共用,可以在计算出可能行棋的位置时便给出相应的“胜率”,大幅提高效率,减少了训练所需的时间。这也是AlphaGo Zero在训练了三天就打败了训练了几个月的AlphaGo Lee的主要原因之一。

    人工智能不仅是计算机科学领域发展的制高点,在所有行业都具有无限潜力和应用价值,目前世界各国普遍看好,人工智能技术将成长为下一次技术革命契机。即便最终人工智能没有达到革命级别的颠覆程度,AI已经在逐渐改变我们的生活。

    以往人工智能的进步都是建立在软件与硬件同步发展的基础上,神经网络算法最早在上个世纪中叶就被提出,然而受限于计算能力,神经网络算法一直发展缓慢。

    之后随着硬件计算速度的不断提高,已有的软件算法不断被实现并改进,改进的算法对硬件要求更高,从而进一步促进了硬件的发展,而AlphaGo Zero的出现完全建立在算法更新的基础上。

    前一版本的AlphaGo需要在48个TPU(谷歌专为加速深层神经网络运算能力而研发的芯片,一块成本即达500万美元)上进行几个月学习,而AlphaGo Zero只需要4个TPU加上几天的时间便可完成学习。这种零经验学习能力非常适合在蛋白质折叠和其它缺少样本的医疗领域进行应用,可以很好地解决因缺少试验样本而导致研究进展缓慢的问题。未来的相关研究中完全可以输入规则后利用AlphaGo Zero的能力进行模拟,最后利用有限的样本进行验证即可。

    AlphaGo逐渐升级之路

    故事讲到这里,实在不得不佩服谷歌深厚的技术实力与精明的商业头脑。AlphaGo从诞生伊始,就得到了deepmind团队的精心包装,仔细回想起来,可谓是“城里套路深”。

    从最初战胜低段位职业棋手开始预热或者说炒作,到战胜人类顶尖高手李世石,AlphaGo的登场已经足够华丽。不过4比1的比分还是给了人类一线希望,这仅有的胜局中,李世石剑走偏锋,直接把AlphaGo逼出了“大脑短路”的症状,可见此时AlphaGo虽已经足够强大,但尚不完美。此后各路人类高手开始卧薪尝胆,精研AlphaGo的套路,寄希望于重新捍卫人类尊严。

    随后,一个神秘的“master”在围棋界顶级棋手的对战平台上取得了60胜0负的骄人战绩,这位master到底是何方神圣,是人是妖可谓是赚足了吃瓜群众的眼球。直到华丽的60胜达成,谜底才最终揭晓。

    此后便是吸引了全世界目光的乌镇对决,AlphaGo Master把柯洁打到毫无还手之力。虽然柯洁已经表现出了真正的人类最强者战力,却仍然被AlphaGo完全压制,只要出招有任何一点闪失,立刻会陷入AlphaGo“最小优势胜”策略的陷阱,再无翻身余地。

    乌镇对决之后,人类在围棋领域已经彻底甘拜下风,别说柯洁一人,五大高手联手作战比柯洁输得更快,AlphaGo一时风光无限。

    如今,乌镇硝烟刚要散尽,谷歌又搞了个大新闻出来!人工智能在摒弃人类经验后,用三天时间自学的AlphaGo Zero打败了人类几千年的经验。AlphaGo的进化版打败了原始版,不禁叫人想起《铁甲钢拳》里叫人热血贲张的机甲肉搏,一个AI输给另一个更牛的AI,中国AI战胜美国AI,这很有可能是未来棋类竞技中的真实场景。

收到988个赞
今日头条极速版邀请码是多少 邀请码如何填写方法
今日头条极速版推出也有几年时间了,关于邀请码怎么填?网上这方面的搜索任然有不少,今日头条极速版官方邀请码填写其中一个即可。
抖音极速版邀请码怎么填 官方邀请码是多少?
抖音极速版除了看视频能赚金币以外,现在用户们都可以用填写邀请码赚钱,不过有不少的小伙伴都没有找到邀请码,更不知道邀请码填写的位置,因此错过了不少的福利,接下来小编会详解邀请
文件夹怎么压缩文件
把文件夹压缩成压缩文件夹,可以直接用鼠标右击,然后找到添加到压缩文件,再更改名称,选择保存地址就可以了。
怎么开淘宝店
开网店首先要打开淘宝的卖家中心,然后找到免费开店,在登录后进入我要开店页面,选择【个人店铺】下方的【创建个人店铺】按钮,然后阅读开店须知再开始认证申请信息,在身份认证审核通
淘宝退货流程是什么
对于需要进行淘宝退货退款的买家们来说,流程一般如下:1. 首先我们打开手机淘宝,找到“我的订单”选项,在点开后的界面里我们也可以找到所需要进行退货的订单信息。
微博水印怎么弄到中间
微博是市面上很火的一个软件,大家可能都看过很多微博上的一些图片水印,有些是在右下角有些是在中间的,有很多小伙伴都不知道微博水印怎么弄到中间,这里就详细介绍一下。
变坏的奥特曼有哪些
黑暗王子一一黑暗迪迦。黑暗迪迦是三千万年前迪迦·奥特曼的形态。黑暗迪迦登场于《迪迦·奥特曼》剧场版《最终圣战》以及《银河奥特曼》,非常强的奥特战士!是3000万年前的四个黑暗巨人之
百度网盘是什么
百度网盘(原名百度云,外文名BaiduNetdisk)是北京百度网讯科技有限公司于2012年3月23日推出的一项个人云存储服务。百度网盘可以保存用户上传的文件,并可跨终端随时随地查看和分享,百度网盘
奔现是什么意思
奔现,网络流行词,指在网络中认识的两个人由虚拟走向现实发展。奔现起源于网络交友软件,由于其行为的特殊性,还是有一定安全隐患的,但也有修成正果者。
猴赛雷是什么意思
猴赛雷是最近网络文化中一个大热的词。“猴赛雷”在广东话里是“好厉害”的谐音,“猴赛雷”,原本是“猴腮雷”的音译,用来形容猴子的脸颊,但由于2016年央视春晚吉祥物“康康”的形象设
kdl什么意思源自哪里
网络用语“kdl”是“磕到了”的首字母缩写,源自饭圈。在饭圈中,“磕”是表示追某个明星时所使用的动词,“kdl”,也就是“磕到了”,常被cp粉在磕cp的时候使用,在一些甜剧视频里的弹幕中
屌丝是什么意思
屌丝, 是中国网络文化兴盛后产生的讽刺用语,开始通常用作称呼“矮矬穷”(与“高富帅”或“白富美”相对)的人,亦称“吊丝”、“叼丝”、“刁丝”、“屌厮”等。
关于我们 | 版权声明 | 免责声明 | 联系我们
免责声明:酷知网所有文字、图片、视频、音频等资料均来自互联网,不代表本站赞同其观点,内容仅代表作者本人意见,若因此产生任何纠纷作者本人负责,本站亦不为其版权负责! 如有问题,请联系我们
CopyRight©1999-2017 www.coozhi.com All Right Reserved 鄂ICP备2024034976号-1