DeepMind在最新Nature论文中讲述了最新版“阿法狗”—— AlphaGo Zero从零起步学围棋,经过3天之后轻松战胜其前任AlphaGo的过程。
从零开始:
和之前的“阿法狗”不同,最新版的AlphaGo Zero已经不需要人类的样例或指导,不提供基本规则以外的任何领域知识,不需要人类数据,而是完全自我学习,在自我对弈中不断提高。3天的自学后,AlphaGo Zero以100:0的成绩完虐阿法狗,也就是之前与李世石大战的那个。而经过40天左右的自学之后,他已经击败了以往任何版本的AlphaGo。
视频画面:
不要上交妈妈的玩具 办公室出轨考的囧图
敢在今年硬刚《GTA6》!这款同类型大作8号发售
56岁家庭主妇女优出道 开车不玩腿玩腿不开车的囧图
全是10分 全是神作!满分开放世界佳作 哪个是你的菜
《宝可梦》新作现已上线NS!集结历代规则爆燃开打
任天堂第一方重大续作偷跑!离正式发售仅剩9天