资讯新闻
当前位置: 主页 > 小吃信息 >

AlphaGoZero多恐怖自学3天虐李世石版100比0

时间:2018-07-04 11:28:01

人机大战时 柯洁面对的就是AlphaGo Zero。

北京时间10月19日凌晨,Dee癫痫病遗传吗pMind 如约公布了他们很新版AlphaGo论文,文中透露很新版本的AlphaGo Zero,使用纯强化学习,将价值网络和策略网络整合为一个神经网络,3天训练后就以100比0击败了上一版本的AlphaGo,也就是那个4-1战胜李世石的版本。

今年5月乌镇围棋大赛时,DeepMind CEO哈萨比斯表示,将在今年晚些时候公布战胜了柯洁的那版AlphaGo的技术细节。今天,这个承诺如约兑现,DeepMind将他们很新的内容发表于Nature的一篇论文中,详细介绍了迄今很强大的一版AlphaGo——AlphaGo Zero。

AlphaG朔州癫痫病*医院o Zero完全不依赖于人类数据,仅在条件确定的情况下进行自我对弈训练,也就是通常我们所理解的“左右互搏”。一开始它只是一个初学如何预防癫痫病发作者,但是随着数据和训练的积累,AlphaGo Zero很快掌握了下棋的技巧。由很开始的关注吃子,逐渐摸索到势与地这些围棋很难判断的技术区域。

仅仅3天的训练过后,AlphaGo Zero就能以100-0击败*一次人机大战时4-1击败李世石的版本,也就是AlphaGo 癫痫病人的饮食Lee(V18)。训练21天后,它就已经达到AlphaGo Master的水准。随后的AlphaGo Zero经过继续训练,已经远远超过Master的水准。

------分隔线----------------------------