2018年星际争霸AI挑战赛–三星与FB获冠亚军,中科院自动化所夺得季军

雷锋网 AI 科技评论消息,2018 年 11 月 13-17 日,AAAI 人工智能与交互式数字娱乐大会 (AI for Interactive Digital Entertainment) 在阿尔伯塔大学举办。会上宣布了一年一度的星际争霸 AI 挑战赛结果;这也是即时战略(RTS)游戏 AI 比赛中最重要的比赛之一。
第八届(2018 年) AIIDE StarCraft AI Competition 星际争霸 AI 挑战赛共有 27 支团队参赛,包括知名机构如三星、中科院自动化所、Facebook 等,知名高校如 Stanford University,以及许多独立参赛队伍。挑战赛使用 12 台计算机进行了大约 2 星期的比赛。经过每个 bot 平均大约 2600 局、每组对手平均大约 100 局,共 34694 局车轮战 1v1 比赛之后,三星、Facebook 以及中科院自动化研究所分别以 95.91%、90.86%、87.11% 的胜率荣获前三名。
AIIDE StarCraft AI 挑战赛自 2011 年起已连续举办八届,该竞赛以星际争霸 1 为载体,以促进和评估用于实时战略游戏(RTS)的人工智能水平为目的。近年来,它更是成为博弈对抗、强化学习、模仿学习、多任务学习等乃至通用人工智能算法研究的主要平台和工具。由于包括对手不确定在内的信息不完全以及状态动作空间巨大等问题,使得星际争霸 AI 较围棋 AI 更极具挑战性,因此也吸引了包括 DeepMind、Facebook、三星、斯坦福大学、中国科学院自动化研究所在内的国内外顶尖研究机构投入研究,相关核心技术可以广泛应用在金融学、经济学、生物学、政治学和军事等领域。
前三名方案介绍
第三名 中科院自动化所,神族 bot 「CSE」
在 2017 年的星际争霸 AI 挑战赛中,来自中科院自动化所的 AI「CPAC」就以 71% 的胜率获得了第四名的成绩。雷锋网 AI 科技评论报道文章请见《中科院自动化所拿下星际争霸 AI 竞赛第四名,顺便发布了一个训练 AI“大局观”的数据集》。
今年的比赛中,由中科院自动化所智能系统与工程研究中心(CRISE)开发的神族 bot「CSE」以 87.11% 的胜率获得季军。据了解,该中心为自动化所独立建制的科研部门,致力于研究博弈对抗与自主进化智能研究,包括感知智能与认知决策智能。「CSE」的作者包括:张俊格、郭玮、尹奇跃、詹东、王琦玮、胡益珲、申生奇和黄凯奇。2017 年的 CPAC 也是由该团队主要人员开发。
「CSE」使用的种族是神族(Protoss),采用的是规则和学习联合驱动的方式。比如何时采用隐刀偷袭吸纳了人类玩家的经验知识;在建造队列为空的时候,「CSE」使用深度学习来预测待构建单位,等等。
第二名 Facebook,虫族 bot「CherryPi」
相比去年比赛中的 69% 胜率、第六名成绩,来自 Facebook 的「CherryPi」今年有了大幅改进,取得了 90.86% 的胜率。「CherryPi」首先对于每个种族的对手有 8~13 种预先准备的不同的策略,利用比赛是多场 1v1 比赛的特点,它会根据与对手的过往比赛的胜率选择最优的策略。除此之外,它还使用了一个预训练的机器模型,根据当前比赛状态估算不同可用策略的胜率,然后在某些状况下切换为胜率最高的策略。这种切换的设计也产生了「混合策略」的效果。「CherryPi」中使用的机器学习技术还包括用于绕开障碍物、避战与放风筝的寻路搜索算法、根据人类数据学习建筑布置、离线强化学习与在线学习等。「CherryPi」也是今年唯一一个使用了 GPU 计算能力的 bot。
第一名三星,人族 bot 「SAIDA」
我们都知道星际争霸在韩国尤为盛行,自 2002 年来,韩国职业星际选手陆续加入了职业战队,并由包括三星、SK Telecom 等知名公司赞助。「SAIDA」的成功很有可能来自其职业星际选手的助力。
根据介绍,「SAIDA」bot 的核心是使用了一个稳定的游戏策略,它会首先考虑防守,然后在游戏中期伺机一波带走对方。他们认为这种策略能应对绝大多数对手的策略,弱点也最少。
「SAIDA」也应用了一些 AI 技术。在 UAlbertaBot 的技术基础上(下文还会提到),他们使用了一个有限状态机来控制单位和建筑。每个单位和建筑在每种战局下都有一个特定的状态。并且使用了多个搜索算法来寻找敌方基地或者可以建造建筑的区域。
在开发过程中「SAIDA」还探索了使用 CNN 和编解码器结构向人类选手学习进攻时机、在局部游戏中用多智能体强化学习方法学习单位微操,不过这些技术并没有添加到此次参加比赛的版本中。
雷锋网 AI 科技评论消息,2018 年 11 月 13-17 日,AAAI 人工智能与交互式数字娱乐大会 (AI for Interactive Digital Entertainment) 在阿尔伯塔大学举办。会上宣布了一年一度的星际争霸 AI 挑战赛结果;这也是即时战略(RTS)游戏 AI 比赛中最重要的比赛之一。
第八届(2018 年) AIIDE StarCraft AI Competition 星际争霸 AI 挑战赛共有 27 支团队参赛,包括知名机构如三星、中科院自动化所、Facebook 等,知名高校如 Stanford University,以及许多独立参赛队伍。挑战赛使用 12 台计算机进行了大约 2 星期的比赛。经过每个 bot 平均大约 2600 局、每组对手平均大约 100 局,共 34694 局车轮战 1v1 比赛之后,三星、Facebook 以及中科院自动化研究所分别以 95.91%、90.86%、87.11% 的胜率荣获前三名。
AIIDE StarCraft AI 挑战赛自 2011 年起已连续举办八届,该竞赛以星际争霸 1 为载体,以促进和评估用于实时战略游戏(RTS)的人工智能水平为目的。近年来,它更是成为博弈对抗、强化学习、模仿学习、多任务学习等乃至通用人工智能算法研究的主要平台和工具。由于包括对手不确定在内的信息不完全以及状态动作空间巨大等问题,使得星际争霸 AI 较围棋 AI 更极具挑战性,因此也吸引了包括 DeepMind、Facebook、三星、斯坦福大学、中国科学院自动化研究所在内的国内外顶尖研究机构投入研究,相关核心技术可以广泛应用在金融学、经济学、生物学、政治学和军事等领域。
前三名方案介绍
第三名 中科院自动化所,神族 bot 「CSE」
在 2017 年的星际争霸 AI 挑战赛中,来自中科院自动化所的 AI「CPAC」就以 71% 的胜率获得了第四名的成绩。雷锋网 AI 科技评论报道文章请见《中科院自动化所拿下星际争霸 AI 竞赛第四名,顺便发布了一个训练 AI“大局观”的数据集》。
今年的比赛中,由中科院自动化所智能系统与工程研究中心(CRISE)开发的神族 bot「CSE」以 87.11% 的胜率获得季军。据了解,该中心为自动化所独立建制的科研部门,致力于研究博弈对抗与自主进化智能研究,包括感知智能与认知决策智能。「CSE」的作者包括:张俊格、郭玮、尹奇跃、詹东、王琦玮、胡益珲、申生奇和黄凯奇。2017 年的 CPAC 也是由该团队主要人员开发。
「CSE」使用的种族是神族(Protoss),采用的是规则和学习联合驱动的方式。比如何时采用隐刀偷袭吸纳了人类玩家的经验知识;在建造队列为空的时候,「CSE」使用深度学习来预测待构建单位,等等。
第二名 Facebook,虫族 bot「CherryPi」
相比去年比赛中的 69% 胜率、第六名成绩,来自 Facebook 的「CherryPi」今年有了大幅改进,取得了 90.86% 的胜率。「CherryPi」首先对于每个种族的对手有 8~13 种预先准备的不同的策略,利用比赛是多场 1v1 比赛的特点,它会根据与对手的过往比赛的胜率选择最优的策略。除此之外,它还使用了一个预训练的机器模型,根据当前比赛状态估算不同可用策略的胜率,然后在某些状况下切换为胜率最高的策略。这种切换的设计也产生了「混合策略」的效果。「CherryPi」中使用的机器学习技术还包括用于绕开障碍物、避战与放风筝的寻路搜索算法、根据人类数据学习建筑布置、离线强化学习与在线学习等。「CherryPi」也是今年唯一一个使用了 GPU 计算能力的 bot。
第一名三星,人族 bot 「SAIDA」
我们都知道星际争霸在韩国尤为盛行,自 2002 年来,韩国职业星际选手陆续加入了职业战队,并由包括三星、SK Telecom 等知名公司赞助。「SAIDA」的成功很有可能来自其职业星际选手的助力。
根据介绍,「SAIDA」bot 的核心是使用了一个稳定的游戏策略,它会首先考虑防守,然后在游戏中期伺机一波带走对方。他们认为这种策略能应对绝大多数对手的策略,弱点也最少。
「SAIDA」也应用了一些 AI 技术。在 UAlbertaBot 的技术基础上(下文还会提到),他们使用了一个有限状态机来控制单位和建筑。每个单位和建筑在每种战局下都有一个特定的状态。并且使用了多个搜索算法来寻找敌方基地或者可以建造建筑的区域。
在开发过程中「SAIDA」还探索了使用 CNN 和编解码器结构向人类选手学习进攻时机、在局部游戏中用多智能体强化学习方法学习单位微操,不过这些技术并没有添加到此次参加比赛的版本中。
2018年星际争霸AI挑战赛–三星与FB获冠亚军,中科院自动化所夺得季军的更多相关文章
- 【转载】 星际争霸2的AI环境搭建
原文地址: https://blog.csdn.net/qq_40244666/article/details/80957644 作者:BOY_IT_IT 来源:CSDN -------------- ...
- 人类又被AI碾压,这次是星际争霸
还记得2017年,那个血洗围棋界的“阿尔法狗”吗? 这个由谷歌旗下 DeepMind 公司开发的 AI ,对阵世界顶尖围棋选手,打出完全碾压式的战绩: AlphaGo vs. 樊麾 - 5 : ...
- 星际争霸2 AI开发(持续更新)
准备 我的环境是python3.6,sc2包0.11.1 机器学习包下载链接:pysc2 地图下载链接maps pysc2是DeepMind开发的星际争霸Ⅱ学习环境. 它是封装星际争霸Ⅱ机器学习API ...
- FaceBook 发布星际争霸最大 AI 数据集
简介 我们刚发布了最大的星际争霸:Brood War 重播数据集,有 65646 个游戏.完整的数据集经过压缩之后有 365 GB,1535 million 帧,和 496 million 操作动作. ...
- 星际争霸的虫王IA退役2年搞AI,自叹不如了
------------恢复内容开始------------ 金磊 发自 凹非寺 量子位|公众号 QbitA 这年头,直播讲AI,真算不上什么新鲜事.但要是连职业电竞选手,都开播主讲呢?没开玩笑,是真 ...
- 300万大奖:欢迎参加美团联合主办的全球AI挑战赛
2018年8月29日,由美团.创新工场.搜狗.美图联合主办的“AI Challenger 2018全球AI挑战赛”正式启动.美团CTO罗道峰.创新工场CEO李开复.搜狗CEO王小川和美图CEO吴欣鸿共 ...
- 20. 星际争霸之php设计模式--适配器模式
题记==============================================================================本php设计模式专辑来源于博客(jymo ...
- 19. 星际争霸之php设计模式--迭代器模式
题记==============================================================================本php设计模式专辑来源于博客(jymo ...
- 18. 星际争霸之php设计模式--观察者模式
题记==============================================================================本php设计模式专辑来源于博客(jymo ...
随机推荐
- Spark2 Dataset行列操作和执行计划
Dataset是一个强类型的特定领域的对象,这种对象可以函数式或者关系操作并行地转换.每个Dataset也有一个被称为一个DataFrame的类型化视图,这种DataFrame是Row类型的Datas ...
- 使用Properties配置文件 InputStream与FileReader (java)
java 开发中,常常通过流读取的方式获取 配置文件数据,我们习惯使用properties文件,使用此文件需要注意 文件位置:任意,建议src下 文件名称:任意,扩展名为properties 文件内容 ...
- 使用IntelliJ IDEA进行Python远程调试的需求(未完)
使用IntelliJ IDEA进行Python远程调试的需求(未完) 在研究深度学习Machlearning时,有时候需要借助ubuntu搭建的tensorflow环境,另外也有越来越多的运算程序只能 ...
- 一套准确率高且效率高的分词、词性标注工具-thulac
软件简介 THULAC(THU Lexical Analyzer for Chinese)由清华大学自然语言处理与社会人文计算实验室研制推出的一套中文词法分析工具包,具有中文分词和词性标注功能.THU ...
- The History of Operating Systems
COMPPUTER SCIENCE AN OVERVIEW 11th Edition job 作业 batch processing 批处理 queue 队列 job queue 作业队列 first ...
- function &w(){}
CodeIgniter 3.1.0 <?php //\system\core\Common.php function &load_class($class, $directory = ' ...
- pandas绘图总结
转自:http://blog.csdn.net/genome_denovo/article/details/78322628 pandas绘图总结 pandas中的绘图函数(更加详细的绘图资料可参考p ...
- HTML_css选择器
第二种增加css样式的方法,可以在head中增加style标签,style中通过选择器定位标签增加css样式 CSS选择器分为六种: 1.id选择器 2.class选择器 3.标签选择器 4. ...
- 2018/03/25 每日一个Linux命令 之 df
Linux df命令用于显示目前在Linux系统上的文件系统的磁盘使用情况统计. 就像在windows下打开我的电脑一样会统计各个磁盘一样的情况 主要用于查看磁盘空间占用情况 -- [@hong:~] ...
- Jungle Roads---poj1251 hdu1301
Description The Head Elder of the tropical island of Lagrishan has a problem. A burst of foreign aid ...