"人机"对战:电脑太简单了,我是射手 skr~skr~skr
9月17日,2018 世界人工智能大会在上海拉开帷幕。在 SAIL 榜单入围项目中,我看到了小爱同学、小马智行、微软小冰、腾讯觅影等等,这不仅让我大开了眼界,也不禁让我感慨 AI 的发展神速。犹记得去年在中国乌镇围棋峰会上,AlphaGo 与排名世界第一的世界围棋冠军柯洁对战,以 3 比 0 的总比分获胜,那时候只感觉这条“狗”真牛。
这也让我回想起了更年少打“人机”的时光——“人机”模式总是很简单,电脑很弱,给玩家的体验并不好。我也曾给设计师出过加强电脑实力的主意——这些主意听起来不错,但不足以延长游戏体验的时间。
直到最近,我觉得 AI 是一种能够提高“人机”对战体验的途径——让电脑更聪明,而不是预先设定更多的套路。
人机对战的不足:电脑太弱
我曾经有三个一起玩人机的室友。其中一个叫做二狗子,他提议周五晚上去云蛟网吧开黑玩“人机”大战。
“四瓶可乐,服务员。你和小胖都没玩过,今天玩人机熟悉一下吧。”二狗子皮肤有点黑,头转过来一边和我说着,一边登上了自己的账号。
“电脑都很傻的,你随便打就好了,选个远程,勾引过来用技能耗。这个辅助和射手就是等会和你对线的,小胖中路打这个法师,上路对这个,打野的话你就当他不存在吧,我等会会来帮你的。”按着二狗子说的,我选了一个看上去很厉害(漂亮)的打射手。
果然“人机”对战里的电脑都很傻。每盘射手和辅助都会固定前往三条路线中的下路,而且在游戏难度模式不变的情况下,射手的英雄都是固定两位更替,似乎电脑端只会使用这两套技能。
英雄之间也几乎看不出有任何配合,辅助和射手各自作战,有技能放技能,血量低于一定量的时候会立刻“光速”释放保命技能逃跑。对我这个不熟悉操作的倒是一个难题,每当残血时的快速逃跑,让我很难击败对面英雄获得点数。
还有一个特点是,电脑从来不会冒险追击,电脑控制的人物都有自己的巡逻范围,设下陷阱后再引诱,往往会在中招前早早的折返回去。就像我找到了一个位置,刚好我能击中对方,而对方准备还击时,却因为超出范围,折返回去,以此慢慢消耗对方,但往往会触发对方的逃跑机制。
二狗子把游戏改到困难模式后,电脑的英雄变得多样,释放技能更加频繁,甚至还有多人合作。开局我就被打得节节退败,但失败多次后简单总结观察,掌握了电脑方的套路后,简简单单又赢了。
并不靠谱的主意:多套路,加数值
“果然人机都很傻。”赢了之后,我总结道。“不过这人机的设计师,似乎还真的有点本事。许多看上去很傻的行为,现在想想都有点道理,”
我开了另一瓶可乐,发出哧溜的气响,“要是我来设计,肯定不这样。”
“首先,大量收集每场战斗的数据,作为一个样本。之后,根据玩家选择的英雄来选择电脑英雄的作战方式,比如碰到闪避型的玩家英雄,根据之前数据的统计,采取防御守塔的方式,消磨对方的耐心,对面就算闪来闪去操作灵活,但短时间内也无法立即攻破。碰到防御型的玩家英雄,则采取进攻欲望强的方式,抢占先机。
之后就是套路,遇到玩家在固定地点埋伏等待时,立刻更改行军路线,并根据失败率较低的样本来规划路线。
最后就是加强电脑英雄的能力,在身体素质上压制,毕竟在霸道的力量面前,大部分的策略都是以卵击石。”
我讲得似乎很来劲,但是二狗子只是敷衍地嗯嗯,然后说了一句:“我偷塔不就好了。”
到现在我还是没有办法反驳二狗子的话,因为人类玩家总有办法靠套路获胜,纵使电脑端不断采取获胜概率较大的方案——电脑在“吸取教训”后,也就是所谓的机器学习,给玩家会有很直观的体验,觉得电脑变聪明了,但这一学习方法很快就会遇到瓶颈,玩家也会随机固定出一套打法,人机游戏体验也就到了尽头。
直到最近,我觉得似乎有理由反驳二狗子的话了,虽然都到了喝轻怡可乐的年数。
人机对战的进阶:人工神经网络
“你打开这个视频看看,DOTA 2 国际赛上这个 OpenAI,就很强。才过去这么几年,现在拿来虐虐我一点问题都没有。”
二狗子直接丢了一句“懒得看”,并立马贴了一篇文章给我。
“笔记记得再厚,概率算得再准是没用的,你那一套思路最多只能把游戏从困难变成超级困难,之后提升难度只能靠改名字来唬人,人家大厂几年前就用‘人工神经网络’来优化 AI 了。”
“也就是,人造英雄对抗人?”
“是的,我给你讲讲大概原理,你听不听?“二狗子发了个“大兵”表情,并处于“正在输入中”:
“人工神经网络通过前向传播对输入值,进行权值运算,最后一层层传下去得到最终输出预测的值。再通过反向传播,与真实值做对比修正前向传播的权值和偏置。你看看这个图理解一下。”二狗子马上发了一个奇怪的图——
“不懂。你再说详细一点。”
二狗子:“上面这图提到的就是反向传播,反向传播在不断的更新参数 W 和 B 通过梯度下降的算法,运用梯度下降的算法可以找出一组 W 和 B,使得函数 C 最小,在样本上找到最优或者近似最优的 W 和 B ,之后使用 W 和 B 进行预测。你再看看这个图理解一下。”
“哦!哦!!原来是这样啊,也就是比赛 AI 那边还坐着一排游戏选手对吧。“
二狗子继续:“差不多,您是不是感觉视频里就跟真人玩家互相竞赛一样呢?这种体验才是能延长人机游戏生命周期的关键。首先从数据上,样本采集自然是不可或缺的,但是样本采集后不是死的,得活用起来,你就好比用样本来塑造一个职业选手的形象,红色样本代表进攻较强并取得胜利的对战数据,再用这个红色样本堆砌成一名红色选手,命名为好战的斯巴达,然后此基础上,让斯巴达有一定计算能力,分析游戏开始 15 分钟这一时间段的各类数据,再接着比较使用特洛伊还是长坂坡等方案的胜率。”
“我更喜欢沉稳的杰尼龟。”我总觉得得说点什么,不然显得我不如二狗子,“那就是电脑计算能力够强,5 分钟总结一次,1 分钟总结一次,那岂不是天下第一了。我还可以预知一下人类玩家的策略,这类竞技游戏套路全都输入到数据库后,比如一看见三名玩家聚在一起,我先综合比较一下战局的优劣势,AI 优势则 4 人围剿,一人守家,AI 劣势则 4 人防守,一人偷塔。AI 也要你尝尝被偷塔的滋味。”
深度学习三要素:数据、模型、计算
“恩,反正差不多这个意思,深度学习实际上就这三点:数据、模型、计算。竞技游戏像 DOTA 这种就十分考究这三点的综合程度。但往往日常功能里,按照这个框架走,就有很好的效果。你看又拍云的这个内容识别功能,就是深度学习的经典案例。你看看这个,我先去开瓶可乐。”二狗子发了一张图给我,我仿佛听见电脑的那一段,“哧溜”的气泡声。
图片中的内容,应该就是他所说的经典三点式:
- 视频直播,视频点播,图片,文本,就是数据;
- 人工处理,训练平台得到模型;
- 内容识别系统,就是计算的过程;
我尝试上传几张图片之后,马上就能得出结果了,像这样:
不知道二狗子可乐喝光了没有,我还是挺想和他有空再去玩人机对战的。对,就像那天在云蛟网吧里面的一局,电脑英雄斯维因拿了我和小胖 25 个击杀后,又轻松把二狗子秒杀的神奇局。
“要不是你们这两个猪队友,送成这样我会打不过?晚上可乐你买单。”
"人机"对战:电脑太简单了,我是射手 skr~skr~skr的更多相关文章
- 介绍一款Android小游戏--交互式人机对战五子棋
文章转载至CSDN社区罗升阳的安卓之旅,原文地址:http://blog.csdn.net/luoshengyang/article/details/6589025 学习Android系统开发之余,编 ...
- 完全自制的五子棋人机对战游戏(VC++实现)
五子棋工作文档 1说明: 这个程序在创建初期的时候是有一个写的比较乱的文档的,但是很可惜回学校的时候没有带回来……所以现在赶紧整理一下,不然再过一段时间就忘干净了. 最初这个程序是受老同学所托做的,一 ...
- Python:游戏:五子棋之人机对战
本文代码基于 python3.6 和 pygame1.9.4. 五子棋比起我之前写的几款游戏来说,难度提高了不少.如果是人与人对战,那么,电脑只需要判断是否赢了就可以.如果是人机对战,那你还得让电脑知 ...
- HTML5+JS 《五子飞》游戏实现(八)人机对战
要想实现人机对战,就必须让电脑自动下棋,而且要知道自动去查找对方的棋子,看看有没有可以挑一对的,有没有可以夹一个的,这样下起来才有意思. 当电脑用户下完棋后,电脑应立即搜索用户的棋子,然后如果没有被吃 ...
- js实现五子棋人机对战源码
indexhtml <!DOCTYPE html> <html lang="en"> <head> <meta charset=" ...
- Pyhton实践项目之(一)五子棋人机对战
1 """五子棋之人机对战""" 2 3 import random 4 import sys 5 6 import pygame 7 im ...
- 在VS2012中实现Ext JS的智能提示太简单了
Visual Studio 2012太强大了,居然能自己会去提取Ext JS的类的属性和方法,从而实现只能提示.下面就来介绍一下实现这个功能. 在Visual Studio 2012中随便创建一个We ...
- java 五子棋之人机对战思路详解
最近做了五子棋,记录下自己完成五子棋的人机对战的思路. 首先,思路是这样的:每当人手动下一颗棋子(黑子)的时候,应当遍历它周围棋子的情况,并赋予周围棋子一定的权值,当在机器要下棋子(白子)守护之前,会 ...
- std::hash实现太简单分布不匀
std::hash实现太简单分布不匀(金庆的专栏 2017.5)#include <iostream>#include <functional>using namespace ...
随机推荐
- git远程删除分支但本地git branch -a仍能看到解决
git远程删除分支但本地git branch -a仍能看到解决 在gitlab页面删除分支 但是本地能可以看到 $ git branch -a br_dev br_to_delete * master ...
- K-means算法性能评估及其优化
1. SSE误差平方和(Sum of Square due to Error): 聚类情况: 计算公式: 注:SSE参数计算的内容为当前迭代得到的中心位置到各自中心点簇的欧式距离总和,这个值越小表示当 ...
- 20181115 python-第一章学习小结part2
Python基本知识 变量,用来存储中间计算结果,在后面可进行调用被使用的东西,叫做变量. 变量的命名规则: 字母,数字,下划线组合 不能用数字开头 常见的关键字不能用啊 常量,不会变的量,称作常量. ...
- Oracle ctl模版
将txt数据装载到数据库 数据无”” LOAD DATA CHARACTER-SET ZHS16GBK truncate into table a FIELDS TERMINATED BY ‘,’ T ...
- 学习之路-->大小文件读取并分页展示
1.读取小文件,并进行分页 商品|价格 飞机|1000 大炮|2000 迫击炮|1000 手枪|123 ..... lis = [] n = 10 #每页显示10条信息 with open('小文件' ...
- 神奇高效的Linux命令行
一.为什么要学linux命令 Linux是由命令行组成的操作系统,精髓在命令行,无论图形界面发展到什么水平,命令行方式的操作永远是不会变的.Linux命令有许多强大的功能:从简单的磁盘操作.文件存取, ...
- 移动UI框架
---恢复内容开始--- 一,框架使用selenium+appium+po+unittest+python 1.其中po表示居于page of boject的思想,unittest是单元测试框架 2. ...
- oracle 报错无法从套接字获取更多数据
报错信息如下: ---查看_optimizer_join_elimination_enabled参数值 切换sys用户 select a.ksppinm name, b.ksppstvl value, ...
- 微信小程序开发----微信开发者工具使用
新建项目选择小程序项目,选择代码存放的硬盘路径,填入刚刚申请到的小程序的 AppID,给你的项目起一个好听的名字,最后,勾选 "创建 QuickStart 项目" (注意: 你要选 ...
- LSI IBM服务器阵列卡操作经历
说明:因为服务器的一个磁盘坏了,因为没有经验不敢操作.正好有一台撤下来的相同服务器,所以查找了各种教程,研究了一下各种操作.记录在这里,防止忘记.一.概念说明raid(自己百度)阵列卡组(group) ...