编辑“︁
AlphaGo
”︁(章节)
跳转到导航
跳转到搜索
脚本错误:没有“Mainspace editnotice”这个模块。
警告:
您没有登录。如果您进行任何编辑,您的IP地址会公开展示。如果您
登录
或
创建账号
,您的编辑会以您的用户名署名,此外还有其他益处。
反垃圾检查。
不要
加入这个!
== 算法 == AlphaGo使用[[蒙特卡洛树搜索]]({{lang|en|Monte Carlo tree search}}),借助估值网络(value network)与走棋网络(policy network)这两种[[深度神经网络]],通过估值网络来评估大量选点,并通过走棋网络选择落点<ref name=DeepMindnature2016/><ref name="googlego"/>。AlphaGo最初通过模仿人类玩家,尝试匹配职业棋手的过往棋局,其数据库中约含3000万步棋着。<ref name=MetzWired2016/>後來它达到了一定的熟练程度,它开始和自己对弈大量棋局,使用[[强化学习]]进一步改善它<ref name="googlego"/>。围棋无法仅通过寻找最佳棋步来解决;<ref name=":0">{{Cite web|title = Google AI algorithm masters ancient game of Go|url = http://www.nature.com/news/google-ai-algorithm-masters-ancient-game-of-go-1.19234|website = Nature News & Comment|access-date = 2016-01-31|archive-url = https://web.archive.org/web/20190502200837/http://www.nature.com/news/google-ai-algorithm-masters-ancient-game-of-go-1.19234|archive-date = 2019-05-02|dead-url = no}}</ref>游戏一盘平均约有150步,每一步平均约有200种可选的下法,<ref name="#1"/>这意味着有太多需要解决的可能性<ref name=":0" />。
摘要:
请注意,所有对Local Chinese Wikipedia的贡献均可能会被其他贡献者编辑、修改或删除。如果您不希望您的文字作品被随意编辑,请不要在此提交。
您同时也向我们承诺,您提交的内容为您自己所创作,或是复制自公共领域或类似自由来源(详情请见
Project:著作权
)。
未经许可,请勿提交受著作权保护的作品!
取消
编辑帮助
(在新窗口中打开)
导航菜单
个人工具
未登录
讨论
贡献
创建账号
登录
命名空间
页面
讨论
大陆简体
不转换
简体
繁體
大陆简体
香港繁體
澳門繁體
大马简体
新加坡简体
臺灣正體
查看
阅读
编辑
查看历史
更多
搜索
导航
首页
最近更改
随机页面
MediaWiki帮助
工具
链入页面
相关更改
特殊页面
页面信息