起源 故事从一个围棋说起,人类赖以自豪的智慧,为什么这么说,因为据统计,从这19乘19的方格中摆棋,可以有10的340次方的可能,用一个更形象的比拟,全宇宙的原子加起来,也比这个数要小. 也就是说,如果计算机靠暴力破解,是无法得到解的,而人凭着棋感可以走出非常高明的棋局,这就是为什么人那么高傲. 可是不幸的是,在IT男的世界里,总有一群倔人,他们决定做一只Go,可以碾压人类智慧的Go,全称阿法Go. Go的进化历程 从官方公开的论文来看,从左到右是四只Go,英文名如上,看起来非常让人困惑,至少身…
这篇是我们自开设星际随笔以来写得最长的一篇.我们也花了不少力气.包括把那5盘棋各打了两遍的谱,包括从Nature官网上把那篇谷歌的报告花了200元下载下来研究它的算法(后来发现谷 歌网站上可以免费下载的),包括也查阅了很多其他文献资料. 为了方便大家阅读,我们先列一下我们这篇随笔主要讲了哪些问题: 1. 计算机战胜欧洲围棋冠军到底为啥好像很牛逼? 2. 从棋谱看,到底AlphaGo什么水平?樊麾有没有放水? 3. AlphaGo的技术原理是什么?这次的创新在哪里? 4. 深度学习相比神经网络有啥…
天棋哥哥大战AlphaGo Time Limit: 1 Sec  Memory Limit: 128 MB Submit: 20  Solved: 9 [Submit][Status][Web Board] Description 3月15日,人机围棋大战巅峰对决在韩国首尔落下帷幕.五番棋的最后一局中,韩国著名棋手李世乭尽管与人工智能“AlphaGo”缠斗至官子阶段,但在双双进入读秒后最终还是投子认输,以总比分1∶4结束了这场举世瞩目的人机大战. 100年后的某一天,天棋哥哥为了给李世乭报仇,挽…
这是本专题的第二节,在这一节我们将以David Silver等人的Natrue论文Mastering the game of Go with deep neural networks and tree search为基础讲讲AlphaGo的基本框架,力求简洁清晰,具体的算法细节参见原论文.本人水平有限,如有错误还望指正.如需转载,须征得本人同意.   AlphaGo流程 以人类的棋局用监督学习训练出一个策略网络 \(p_\sigma\) 以人类的棋局用监督学习训练出一个策略网络 \(p_\pi\…
这是Deepmind 公司在2016年1月28日Nature 杂志发表论文 <Mastering the game of Go with deep neural networks and tree search>.介绍了 AlphaGo 程序的细节. 本博文是对这篇论文的阅读笔记. AlphaGo 神经网络构成 AlphaGo 总体上由两个神经网络构成.以下我把它们简单称为「两个大脑」,这并非原文中的提法,仅仅是我的一个比喻. 第一个大脑(Policy Network)的作用是在当前局面下推断…
一张图解AlphaGo原理及弱点 2016-03-23 郑宇,张钧波 CKDD 作者简介: 郑宇,博士, Editor-in-Chief of ACM Transactions on Intelligent Systems and Technology, ACM数据挖掘中国分会秘书长. 张钧波,博士,ACM数据挖掘中国分会会员,从事深度神经网络相关研究. -------------------------------------- 近期AlphaGo在人机围棋比赛中连胜李世石3局,体现了人工智能…
AlphaGo与人工智能 在之前的一篇文章中我指出,自动驾驶所需要的“视觉识别能力”和“常识判断能力”,对于机器来说是非常困难的问题.至今没有任何机器可以在视觉方面达到驴的水平,更不要说和人比.可是最近Google的AlphaGo战胜了围棋世界冠军,挺闹腾的,以至于对AI的误解又加深了. 本来玩个游戏而已,恁要吹成是“历史性的人机大战”,说得好像是机器挑战了人类的智能,伤了人类的自尊似的.这整个项目打着一个相当高大上的招牌,叫做“Deep Mind”.当然,其中的技术也有一些吓人的名字,什么“神…
2016年3月9日注定要写入围棋界的历史.IT界的历史以及科学界的历史.当天,韩国著名围棋棋手李世石VS谷歌AlphaGo的人机大战赛在韩国首尔举行.对弈的一方为拥有1200多个处理器的谷歌人工智能系统AlphaGo,另一方则为世界围棋冠军.韩国棋手李世石.最终,曾经独孤求败的九段高手李世石投子认输. AlphaGo对战李世石 本次人机大战中使用的三星E360显示器因为采用超广视角面板,拥有178°宽广可视角度,所以,从现场的照片中可以看到,即便是较远的距离下,屏幕中的棋盘依然清晰可见:此外,这…
在我的一生中,我见证了社会深刻的变化.其中最深刻的,同时也是对人类影响与日俱增的变化,是人工智能的崛起.简单来说,我认为强大的人工智能的崛起,要么是人类历史上最好的事,要么是最糟的.我不得不说,是好是坏我们仍不确定.但我们应该竭尽所能,确保其未来发展对我们和我们的环境有利.我们别无选择.我认为人工智能的发展,本身是一种存在着问题的趋势,而这些问题必须在现在和将来得到解决. 人工智能的研究与开发正在迅速推进.也许我们所有人都应该暂停片刻,把我们的研究重复从提升人工智能的能力转移到最大化人工智能的社…
Description3月15日,人机围棋大战巅峰对决在韩国首尔落下帷幕.五番棋的最后一局中,韩国著名棋手李世乭尽管与人工智能“AlphaGo”缠斗至官子阶段,但在双双进入读秒后最终还是投子认输,以总比分1∶4结束了这场举世瞩目的人机大战.100年后的某一天,天棋哥哥为了给李世乭报仇,挽回人类尊严,代表人类向AlphaGo发起了挑战.100年后的AlphaGo比现在强了几百倍,谷歌公司允许天棋哥哥携带一个程序与AlphaGo对战. 为了能战胜AlphaGo,现在请你帮助天棋哥哥写一个程序来判断他…