"人机"对战:电脑太简单了,我是射手 skr~skr~skr
9月17日,2018 世界人工智能大会在上海拉开帷幕。在 SAIL 榜单入围项目中,我看到了小爱同学、小马智行、微软小冰、腾讯觅影等等,这不仅让我大开了眼界,也不禁让我感慨 AI 的发展神速。犹记得去年在中国乌镇围棋峰会上,AlphaGo 与排名世界第一的世界围棋冠军柯洁对战,以 3 比 0 的总比分获胜,那时候只感觉这条“狗”真牛。
这也让我回想起了更年少打“人机”的时光——“人机”模式总是很简单,电脑很弱,给玩家的体验并不好。我也曾给设计师出过加强电脑实力的主意——这些主意听起来不错,但不足以延长游戏体验的时间。
直到最近,我觉得 AI 是一种能够提高“人机”对战体验的途径——让电脑更聪明,而不是预先设定更多的套路。
人机对战的不足:电脑太弱
我曾经有三个一起玩人机的室友。其中一个叫做二狗子,他提议周五晚上去云蛟网吧开黑玩“人机”大战。
“四瓶可乐,服务员。你和小胖都没玩过,今天玩人机熟悉一下吧。”二狗子皮肤有点黑,头转过来一边和我说着,一边登上了自己的账号。
“电脑都很傻的,你随便打就好了,选个远程,勾引过来用技能耗。这个辅助和射手就是等会和你对线的,小胖中路打这个法师,上路对这个,打野的话你就当他不存在吧,我等会会来帮你的。”按着二狗子说的,我选了一个看上去很厉害(漂亮)的打射手。
果然“人机”对战里的电脑都很傻。每盘射手和辅助都会固定前往三条路线中的下路,而且在游戏难度模式不变的情况下,射手的英雄都是固定两位更替,似乎电脑端只会使用这两套技能。
英雄之间也几乎看不出有任何配合,辅助和射手各自作战,有技能放技能,血量低于一定量的时候会立刻“光速”释放保命技能逃跑。对我这个不熟悉操作的倒是一个难题,每当残血时的快速逃跑,让我很难击败对面英雄获得点数。
还有一个特点是,电脑从来不会冒险追击,电脑控制的人物都有自己的巡逻范围,设下陷阱后再引诱,往往会在中招前早早的折返回去。就像我找到了一个位置,刚好我能击中对方,而对方准备还击时,却因为超出范围,折返回去,以此慢慢消耗对方,但往往会触发对方的逃跑机制。
二狗子把游戏改到困难模式后,电脑的英雄变得多样,释放技能更加频繁,甚至还有多人合作。开局我就被打得节节退败,但失败多次后简单总结观察,掌握了电脑方的套路后,简简单单又赢了。
并不靠谱的主意:多套路,加数值
“果然人机都很傻。”赢了之后,我总结道。“不过这人机的设计师,似乎还真的有点本事。许多看上去很傻的行为,现在想想都有点道理,”
我开了另一瓶可乐,发出哧溜的气响,“要是我来设计,肯定不这样。”
“首先,大量收集每场战斗的数据,作为一个样本。之后,根据玩家选择的英雄来选择电脑英雄的作战方式,比如碰到闪避型的玩家英雄,根据之前数据的统计,采取防御守塔的方式,消磨对方的耐心,对面就算闪来闪去操作灵活,但短时间内也无法立即攻破。碰到防御型的玩家英雄,则采取进攻欲望强的方式,抢占先机。
之后就是套路,遇到玩家在固定地点埋伏等待时,立刻更改行军路线,并根据失败率较低的样本来规划路线。
最后就是加强电脑英雄的能力,在身体素质上压制,毕竟在霸道的力量面前,大部分的策略都是以卵击石。”
我讲得似乎很来劲,但是二狗子只是敷衍地嗯嗯,然后说了一句:“我偷塔不就好了。”
到现在我还是没有办法反驳二狗子的话,因为人类玩家总有办法靠套路获胜,纵使电脑端不断采取获胜概率较大的方案——电脑在“吸取教训”后,也就是所谓的机器学习,给玩家会有很直观的体验,觉得电脑变聪明了,但这一学习方法很快就会遇到瓶颈,玩家也会随机固定出一套打法,人机游戏体验也就到了尽头。
直到最近,我觉得似乎有理由反驳二狗子的话了,虽然都到了喝轻怡可乐的年数。
人机对战的进阶:人工神经网络
“你打开这个视频看看,DOTA 2 国际赛上这个 OpenAI,就很强。才过去这么几年,现在拿来虐虐我一点问题都没有。”
二狗子直接丢了一句“懒得看”,并立马贴了一篇文章给我。
“笔记记得再厚,概率算得再准是没用的,你那一套思路最多只能把游戏从困难变成超级困难,之后提升难度只能靠改名字来唬人,人家大厂几年前就用‘人工神经网络’来优化 AI 了。”
“也就是,人造英雄对抗人?”
“是的,我给你讲讲大概原理,你听不听?“二狗子发了个“大兵”表情,并处于“正在输入中”:
“人工神经网络通过前向传播对输入值,进行权值运算,最后一层层传下去得到最终输出预测的值。再通过反向传播,与真实值做对比修正前向传播的权值和偏置。你看看这个图理解一下。”二狗子马上发了一个奇怪的图——
“不懂。你再说详细一点。”
二狗子:“上面这图提到的就是反向传播,反向传播在不断的更新参数 W 和 B 通过梯度下降的算法,运用梯度下降的算法可以找出一组 W 和 B,使得函数 C 最小,在样本上找到最优或者近似最优的 W 和 B ,之后使用 W 和 B 进行预测。你再看看这个图理解一下。”
“哦!哦!!原来是这样啊,也就是比赛 AI 那边还坐着一排游戏选手对吧。“
二狗子继续:“差不多,您是不是感觉视频里就跟真人玩家互相竞赛一样呢?这种体验才是能延长人机游戏生命周期的关键。首先从数据上,样本采集自然是不可或缺的,但是样本采集后不是死的,得活用起来,你就好比用样本来塑造一个职业选手的形象,红色样本代表进攻较强并取得胜利的对战数据,再用这个红色样本堆砌成一名红色选手,命名为好战的斯巴达,然后此基础上,让斯巴达有一定计算能力,分析游戏开始 15 分钟这一时间段的各类数据,再接着比较使用特洛伊还是长坂坡等方案的胜率。”
“我更喜欢沉稳的杰尼龟。”我总觉得得说点什么,不然显得我不如二狗子,“那就是电脑计算能力够强,5 分钟总结一次,1 分钟总结一次,那岂不是天下第一了。我还可以预知一下人类玩家的策略,这类竞技游戏套路全都输入到数据库后,比如一看见三名玩家聚在一起,我先综合比较一下战局的优劣势,AI 优势则 4 人围剿,一人守家,AI 劣势则 4 人防守,一人偷塔。AI 也要你尝尝被偷塔的滋味。”
深度学习三要素:数据、模型、计算
“恩,反正差不多这个意思,深度学习实际上就这三点:数据、模型、计算。竞技游戏像 DOTA 这种就十分考究这三点的综合程度。但往往日常功能里,按照这个框架走,就有很好的效果。你看又拍云的这个内容识别功能,就是深度学习的经典案例。你看看这个,我先去开瓶可乐。”二狗子发了一张图给我,我仿佛听见电脑的那一段,“哧溜”的气泡声。
图片中的内容,应该就是他所说的经典三点式:
- 视频直播,视频点播,图片,文本,就是数据;
- 人工处理,训练平台得到模型;
- 内容识别系统,就是计算的过程;
我尝试上传几张图片之后,马上就能得出结果了,像这样:
不知道二狗子可乐喝光了没有,我还是挺想和他有空再去玩人机对战的。对,就像那天在云蛟网吧里面的一局,电脑英雄斯维因拿了我和小胖 25 个击杀后,又轻松把二狗子秒杀的神奇局。
“要不是你们这两个猪队友,送成这样我会打不过?晚上可乐你买单。”
"人机"对战:电脑太简单了,我是射手 skr~skr~skr的更多相关文章
- 介绍一款Android小游戏--交互式人机对战五子棋
文章转载至CSDN社区罗升阳的安卓之旅,原文地址:http://blog.csdn.net/luoshengyang/article/details/6589025 学习Android系统开发之余,编 ...
- 完全自制的五子棋人机对战游戏(VC++实现)
五子棋工作文档 1说明: 这个程序在创建初期的时候是有一个写的比较乱的文档的,但是很可惜回学校的时候没有带回来……所以现在赶紧整理一下,不然再过一段时间就忘干净了. 最初这个程序是受老同学所托做的,一 ...
- Python:游戏:五子棋之人机对战
本文代码基于 python3.6 和 pygame1.9.4. 五子棋比起我之前写的几款游戏来说,难度提高了不少.如果是人与人对战,那么,电脑只需要判断是否赢了就可以.如果是人机对战,那你还得让电脑知 ...
- HTML5+JS 《五子飞》游戏实现(八)人机对战
要想实现人机对战,就必须让电脑自动下棋,而且要知道自动去查找对方的棋子,看看有没有可以挑一对的,有没有可以夹一个的,这样下起来才有意思. 当电脑用户下完棋后,电脑应立即搜索用户的棋子,然后如果没有被吃 ...
- js实现五子棋人机对战源码
indexhtml <!DOCTYPE html> <html lang="en"> <head> <meta charset=" ...
- Pyhton实践项目之(一)五子棋人机对战
1 """五子棋之人机对战""" 2 3 import random 4 import sys 5 6 import pygame 7 im ...
- 在VS2012中实现Ext JS的智能提示太简单了
Visual Studio 2012太强大了,居然能自己会去提取Ext JS的类的属性和方法,从而实现只能提示.下面就来介绍一下实现这个功能. 在Visual Studio 2012中随便创建一个We ...
- java 五子棋之人机对战思路详解
最近做了五子棋,记录下自己完成五子棋的人机对战的思路. 首先,思路是这样的:每当人手动下一颗棋子(黑子)的时候,应当遍历它周围棋子的情况,并赋予周围棋子一定的权值,当在机器要下棋子(白子)守护之前,会 ...
- std::hash实现太简单分布不匀
std::hash实现太简单分布不匀(金庆的专栏 2017.5)#include <iostream>#include <functional>using namespace ...
随机推荐
- 4、Nginx安装与配置
一.简介 Nginx官网:http://nginx.org/ Nginx(发音同engine x)是一个异步框架的 Web服务器,也可以用作反向代理,负载平衡器 和 HTTP缓存.该软件由 Igor ...
- nltk 词性解析
转载链接: https://blog.csdn.net/pengjian444/article/details/81143983
- Alpha冲刺——代码规范、冲刺任务与计划
代码规范 作业描述 课程 软件工程1916|W(福州大学) 团队名称 修!咻咻! 作业要求 项目Alpha冲刺(团队) 团队目标 切实可行的计算机协会维修预约平台 开发工具 Eclipse 团队信息 ...
- Mac下brew安装JDK的教程
---恢复内容开始--- 安装命令: brew cask install java 默认应该会下载jdk7 也可以指定下载版本brew cask install java6 注意: brew inst ...
- mac 启动php-fpm报错 failed to open configuration file '/private/etc/php-fpm.conf': No such file or direc
直接运行,有报错找不到配置文件. $ php-fpm [11-Jan-2014 16:03:03] ERROR: failed to open configuration file '/private ...
- ajax 文件下载
作为一个后端开发人员,使用java 生成文件,提供前端下载,这个问题倒不大,可是让我们自己去下载文件的时候,这个问题就大了,对不起,我只对前端一知半解,并不精通,谢谢!! 需求如下:前端检索数据,后台 ...
- MyBatis(九) 使用association定义单个对象的封装规则
(1)接口中编写方法 public Emp getEmpandDept(); (2)编写Mapper文件 <resultMap type="com.eu.bean.Emp" ...
- Java 跨平台原理
Java的跨平台基于编译器和虚拟机.其中,CPU处理器和操作系统的整体称为平台.编译器把源文件编译成与平台无关的基于Unicode的字节码class文件,虚拟机把该文件解释成与平台有关的机器码指令,可 ...
- 百度语音合成AI
注意:不要使用Dw编辑PHP代码,会因为编码问题出错!!<?php require_once 'AipSpeech.php'; // 你的 APPID AK SK const APP_ID = ...
- 快速幂 ,快速幂优化,矩形快速幂(java)
快速幂形式 public static int f(int a,int b,int c){ int ans =1; int base=a; while(b!=0){ if((b&1)!=0) ...