您现在的位置:主页 > 北京seo > ZAC老师SEO每日一贴中,《逆天的阿尔法狗零》什么鬼?_北京小威se

ZAC老师SEO每日一贴中,《逆天的阿尔法狗零》什么鬼?_北京小威se

2018-01-25 21:38

 

  作为北京小威seo优化博客,当然每天会分析网站数据,看看seo行业中,更新频繁seo网站,看看seo的发展动向,这样才能让自己不会落后,今天没事来到ZAC老师的每日一贴的博客,看了下,看到今天更新了一篇名叫《逆天的阿尔法狗零》,瞬间被这位标题党ZAC老师给蒙住了,第一感觉是:这是什么鬼?和我们的se北京谷歌seoo相关吗?那好,我就带大家看下ZAC老师的这篇关于seo相关的博文,如下文:

  上星期四,10月19号,研发了阿尔法狗(AlphaGo)的Google人工智能部门DeepMind北京seo顾问,发表了一篇标题为《从头开始》的博文,介绍了他们同一天发表在Nature杂志的论文:《不依赖人类知识掌握围棋》。

  简单说,在开发了吊打人类的围棋AI阿尔法狗之后,DeepMind现在又开发了阿尔法狗零(AlphaGo Zero),而这个阿尔法狗零:

  完全没有学习人类棋谱,纯自学

  72小时(也就是3天)后超过2016年3月战胜李世石那个AlphaGo Lee版本,战绩100:0

  21天后超过2016年底60:0战胜所有人类高手、2017年5月3:0胜柯洁那个AlphaGo Master版本,,战绩89:11

  第40天超过所有其它AlphaGo版本,成为地表最强围棋选手

  最令人震惊的是,AlphaGo Zero在3天之内,纯靠自学,达到了人类顶尖高手的水平。以前写的人工智能与SEO帖子里提到过,以前的AlphaGo是在学习大量人类历史棋局之后,再开始巨量自我对局。这次AlphaGo Zero则完全没有学习人类棋局,从零开始就是自我对局,3天内完成490万盘自我对局,并达到了吊打AlphaGo Lee版本的水平。

  下图是AlphaGo Zero水平增长曲线:

  

 

  可以看到,3天内水平突飞猛进,然后变得平缓,但还是增长中。

  以前的AlphaGo达到AlphaGo Master版本水平,走了一年多时间,大致是按“月”计时的,AlphaGo Zero的进步则是按“天”,甚至“小时”的节奏了。现在看来,AlphaGo之所以要那么长时间,很可能是被人类带歪了,被人类历史棋局误导了,被人类知识和思路限制了。AlphaGo Zero彻底抛弃人类现有知识,也就没有受到人类知识的局限,是真正天马行空地找到最优解的自由战士。

  既然抛弃人类围棋知识,刚开始自我对局时必然是随机的,或者说是胡来的。AlphaGo Games这个网站上公布了很多实际棋局,感兴趣的可以研究一下,有很多有趣的地方。最初的AlphaGo Zero自我对局确实就是乱下的,但很快发现了人北京seo优化类也掌握的大局观、布局、收官等知识,但有的东西是比较晚才掌握的,比如征子。

  聂卫平和柯洁都说过,看了AlphaGo的棋,发现很多人类对围棋的认识是错误的。在某种角度说,AlphaGo Zero没有历史包袱,没有胜负的心理包袱,没有任何人类思维限制,它对围棋的探索是自由的、没有局限的,目标是全局的最优解,所以很可能它的下法就是终极正确的。

  能让人类聊以自慰的是,AlphaGo Zero自由探索的结果说明,人类数千年的研究探索有些是错的,但总体上没有错得离谱,AlphaGo Zero从白纸一张开始,最后的下法收敛到与人类差不多的方向,比如肯定了人类的一些定式是正确的,AlphaGo Zero胡来一阵之后也是这么下。