【转】AlphaGo Zero 和强人工智能】的更多相关文章

AlphaGo Zero 和强人工智能 前段时间比较热门的是 AlphaGo(阿法狗)的升级版:AlphaGo Zero(阿法狗零).跟阿法狗不同,阿法狗零不依赖于任何人类对弈记录,完全从围棋的规则出发,“自学成才”,推导出所有的战略,在与阿法狗的对战中完胜.有人问我,阿法狗零是否改变了我对人工智能的看法.我的回答是:没有. 我必须承认阿法狗零是个重要的成就.在以往的文章中我没能表达这种欣赏,有些人可能误解我,以为我对它的态度是不屑.不是那样的.我尊重 DeepMind 为此做出的努力,就像我尊…
最近赢了人机大战的AlphaGo火了,火得一塌糊涂,圈里圈外,是人都在谈AlphaGo.但是AlphaGo毕竟是为特定场景特定应用设计的特定型人工智能,和通用型人工智能还是有很大差别,离人工智能普及更差得很远.所以这么说,是因为之前做过几个特定型人工智能项目(语音识别和图像识别类型的,合起来可以是视频识别,但是没做),有些体会,对特定型人工智能设计思路比较了解,近期一直在考虑通用型人工智能的事,现在已经开始做这件事.但是只是一个开始,很多东西还在琢磨.探索中,路能不能走通也是未知数.在此和大家说…
大家好哇,新同学都叫我张北海,老同学都叫我老胡,其实是一个人,只是我特别喜欢章北海这个<三体>中的人物,张是错别字. 上个月安利了一波:机器学习自动补全代(hán)码(shù)神器,然后就被打脸了,Github 宣布 copilot 要开始收费了. Github 和 OpenAI 一样,遇到微软之后就慢慢丧失灵魂了. Copilot 是微软.OpenAI.GitHub 三家联合打造的 AI 编程辅助工具,可以在 VS Code 编辑器中自动完成代码片段.相比于市面上一些编程辅助工具,Copil…
AlphaGo设计师黄士杰:“最强的学习技能在人类的脑袋里” 深度学习和强化学习结合看来才能解决彩票预测的问题 可以这么说,AlphaGo的成功就是深度学习与强化学习的胜利,因为两者结合在一起,建构判断形式的价值网络(Value Network),后来也成为AlphaGo Zero的主要理论. 虽然我们最终赢了,但这一盘棋确实有很大的弱点,如果五盘棋内,有20%的错误率,这样的AI系统,你敢用吗?所以我们决定,一定要把这个弱点解决掉,不只是解决第四盘的问题,是要把AlphaGo项目全面解决. 后…
经过比拼,AlphaGo最终还是胜出,创造了人机大战历史上的一个新的里程碑.几乎所有的人都在谈论这件事情,这使得把“人工智能”.“深度学习”的热潮推向了新的一个高潮.AlphaGo就像科幻电影里具有人的思维和情感的机器人一样,被极大地神话了,而且这让更多的人对人工智能产生了畏惧感.那么,AlphaGo的胜利真的意味着人工智能(AI)已经超越人类了吗? 答案肯定是No. AlphaGo仍只是个机器,之所以它能够战胜李世石是完全依靠它强大的运算能力和模仿能力,但本身并不具备人类拥有的智慧.面对新的规…
距离AlphaGo击败李世石已经过去数月了,心中的震撼至今犹在,全刊报道此项比赛的<围棋天地>杂志我已经看了不下十遍.总也想说点自己的意见,却也不知道从哪里说起,更不知道想表达些什么. 作为一个评论者我的身份较特殊,人工智能相关的技术领域我涉足了5年,下围棋的时间则有18年.前者的水平我不敢妄自评估,但领域内的最新技术,包括AlphaGo使用的蒙特卡洛搜索树和深度学习之类,基本也在我了解范围之内:后者的水平,大约相当于业余弱5段的样子,高中的时候在县里打打比赛拿个名次也是家常便饭.而我那些比我…
写于2016 3.8晚 AlphaGo 与 Alan Turing 如果我们可以被称为生物版本的机器人,承载着在上千年或是万年的时间内不断完善的人工智能,并正如行为主义所指出的那样,对不同的刺激做出相对应的行为,那么我们便是如何让机械的机器人拥有人工智能的最好参考. 机械的躯体与人类的躯体是不同的.我们有着许许多多的生理限制.我们的器官会退化,哪怕它们曾经是多么的灵敏.我们的大脑总是需要休息,用足够的睡眠来调整自己.我们会随着年龄的增长,经历一些不可修复的损伤.而这些是机械的躯体所不用担心的,它…
天棋哥哥大战AlphaGo Time Limit: 1 Sec  Memory Limit: 128 MB Submit: 20  Solved: 9 [Submit][Status][Web Board] Description 3月15日,人机围棋大战巅峰对决在韩国首尔落下帷幕.五番棋的最后一局中,韩国著名棋手李世乭尽管与人工智能“AlphaGo”缠斗至官子阶段,但在双双进入读秒后最终还是投子认输,以总比分1∶4结束了这场举世瞩目的人机大战. 100年后的某一天,天棋哥哥为了给李世乭报仇,挽…
这是本专题的第三节,在这一节我们将以David Silver等人的Natrue论文Mastering the game of Go without human knowledge为基础讲讲AlphaGo Zero的基本框架,力求简洁清晰,具体的算法细节参见原论文.之后我们为AlphaGo家族做一下总结,展望未来AI革命会将我们带向何方,大火的美剧西部世界和强化学习有多少联系.本人水平有限,如有错误还望指正.如需转载,须征得本人同意.   相较AlphaGo的改进 只通过自我对局强化学习进行训练学…
距离AlphaGo击败李世石已经过去数月了,心中的震撼至今犹在,全刊报道此项比赛的<围棋天地>杂志我已经看了不下十遍.总也想说点自己的意见,却也不知道从哪里说起,更不知道想表达些什么. 作为一个评论者我的身份较特殊,人工智能相关的技术领域我涉足了5年,下围棋的时间则有18年.前者的水平我不敢妄自评估,但领域内的最新技术,包括AlphaGo使用的蒙特卡洛搜索树和神经网络深度学习之类,基本也在我了解范围之内:后者的水平,大约相当于业余弱5段的样子,高中的时候在县里打打比赛拿个名次也是家常便饭.而我…