P4
在我们所研究的模型中,决策主体往往要在不确定条件下进行决策。参与人可能:

  • 不能确定环境的客观因素;
  • 对博弈中发生的事件不很清楚;
  • 不能确定别的不确定参与人的行动;
  • 不能确定别的参与人的推理。
    为了对不确定情形下的决策建模,几乎所有的博弈论都是用了von Neuman和Morgenstern(1994)及Savage(1972)的理论。也就是,如果结果函数是随机的并被决策主体已知(即,对每一个\(a \in A\), 结果\(g(a)\)是集合\(C\)上的一个不确定事件(概率分布),那么决策主体就被认为是为了最大化一个函数期望值(v-N-M效用)去行动,这个函数给每个结果赋一个值。如果行动与结果间的随机联系未给定,这个决策主体就被认为是按他心中的一个(主观的)概率分布去行动,这个分布决定了任何行动的结果。在这种情形下决策主体被认为将这种行动,即他心中有一个“状态空间”\(\Omega\), 一个\(\Omega\)上的一个概率测度,一个函数\(g : A \times \Omega \to C\), 和一个效用函数\(u : C \to \mathbb{R}\); 他被认为考虑到概率测度去选择一个行动\(a\)来最大化期望值\(u(g(a, \omega))\).--
    P6 : 术语与标记--
    如果对所有\(x \in \mathbb{R}, x^' \in \mathbb{R}\)及\(a \in [0, 1], f(ax + (1 - a)x^') \geq af(x) + (1 - a)f(x^')\), 则函数\(f : \mathbb{R} \to \mathbb{R}\)为一个凹函数。给定一个函数\(f : X \to \mathbb{R}\), 我们用\(arg max_{x \in X}f(x)\)表示\(f\)的最大值集合,对任何\(Y \subseteq X\), 用\(f(Y)表示集合{f(x) : x \in Y}. 我们用N表示参与人集合。将某个变量的值的集合(每个参与人都对应一个)作为一个*组合*(profile), 用\)(x_i){i \in N)\(表示。或者,假定两次“\)i \in N\(”是确定的,则简单几位\)(x_i)\(. 给定列表\)x{-i} = (x_j){j \in N \diagdown {i}}\(和一个元素\)x_i\(, 我们用\)(x{-i}, x_i)\(表示组合\)(x_i){i \in N}\(. 如果对每个\)i \in N, \textbf{X}i\(是一个集合, 则我们用\)\textbf{X}{-i}\(表示集合\)\times{i \in N \diagdown {i}}\textbf{X}_j$.

博弈论教程(A Course in Game Theory)摘录的更多相关文章

  1. 如何搭建一个独立博客——简明Github Pages与Hexo教程

    摘要:这是一篇很详尽的独立博客搭建教程,里面介绍了域名注册.DNS设置.github和Hexo设置等过程,这是我写得最长的一篇教程.我想将我搭建独立博客的过程在一篇文章中尽可能详细地写出来,希望能给后 ...

  2. 【深度学习Deep Learning】资料大全

    最近在学深度学习相关的东西,在网上搜集到了一些不错的资料,现在汇总一下: Free Online Books  by Yoshua Bengio, Ian Goodfellow and Aaron C ...

  3. 机器学习(Machine Learning)&深度学习(Deep Learning)资料(Chapter 2)

    ##机器学习(Machine Learning)&深度学习(Deep Learning)资料(Chapter 2)---#####注:机器学习资料[篇目一](https://github.co ...

  4. Linux C 收藏

    某招聘要求:熟悉高性能分布式网络服务端设计开发,熟悉epoll.多线程.异步IO.事件驱动等服务端技术: <UNIX环境高级编程(第3版)>apue.h等源码文件的编译安装 <UNI ...

  5. 博弈论揭示了深度学习的未来(译自:Game Theory Reveals the Future of Deep Learning)

    Game Theory Reveals the Future of Deep Learning Carlos E. Perez Deep Learning Patterns, Methodology ...

  6. ArcGIS学习推荐基础教程摘录

    ###########-------------------摘录一--------------------------########### ***************************** ...

  7. 博弈论(Game Theory) - 04 - 纳什均衡

    博弈论(Game Theory) - 04 - 纳什均衡 开始 纳什均衡和最大最小定理是博弈论的两大基石. 博弈不仅仅是对抗,也包括合作和迁就,纳什均衡能够解决这些问题,提供了在数学上一个完美的理论. ...

  8. 博弈论(Game Theory) - 01 - 前传之占优战略均衡

    博弈论(Game Theory) - 01 - 前传之占优战略均衡 开始 我们现在准备攀爬博弈论的几座高峰. 我们先看看在纳什均衡产生之前,博弈论的发展情况. 我们的第一座高峰是占优战略均衡. 囚徒困 ...

  9. 博弈论(Game Theory) - 02 - 前传之重复剔除严格劣战略的占优战略均衡

    博弈论(Game Theory) - 02 - 前传之重复剔除严格劣战略的占优战略均衡 开始 "重复剔除劣战略的严格占优战略均衡"(iterated dominance equil ...

随机推荐

  1. 少一些套路,多一些真诚 ——groovy消灭表现层套路

      初次认识groovy是在2009年,当时看了Manning出版的<Groovy in Action 1st Edition>,对groovy这个语言的交互性shell,以及灵活的语法留 ...

  2. 801. Minimum Swaps To Make Sequences Increasing 为使两个数组严格递增,所需要的最小交换次数

    [抄题]: We have two integer sequences A and B of the same non-zero length. We are allowed to swap elem ...

  3. 电商项目面试题 及mysql面试题 太难没啥用

    需要按照功能点把系统拆分,拆分成独立的功能.单独为某一个节点添加服务器.需要系统之间配合才能完成整个业务逻辑.叫做分布式.集群:同一个工程部署到多台服务器上.优点:1.把模块拆分,使用接口通信,降低模 ...

  4. PythonQt第一例

    pythonQt第一例源码如下,主要介绍了简单的使用方式,需要注意的是应用程序的debug版本和release版本必须使用同类型的PythonQt库不可交叉使用. 源码地址:http://files. ...

  5. [C++] Sign and magnitude,Ones' complement and Two's complement

    Sign and magnitude,Ones' complement and Two's complement

  6. nltk 之 snowball 提取词干-乾颐堂

    机器学习中很重要的应用场景就是机器自动分类,而分类的关键是词干提取.所以我们要用到snowball.下面说一下snowball 提取词干的两种方法. 两种方法: 方法一: >>> f ...

  7. 32 取一个整数a从右端开始的4-7位

    题目:取一个整数a从右端开始的4-7位 public class _032FetchDigit { public static void main(String[] args) { fetchDigi ...

  8. Ubuntu下安装配置android sdk及其环境变量

    同理,这里介绍的是手动安装方法~ *系统;Ubuntu 16.4 1.下载Android sdk,直接在系统自带的firefox浏览器输入 http://tools.android-studio.or ...

  9. WSAStartup函数

    函数WSAStartup 一.WSAStartup函数                 int WSAStartup                       (                   ...

  10. 3、Semantic-UI之定义容器

    3.1 定义容器   在主流的前端框架中都会有容器的概念,但是在Semantic-UI中,如果要定义容器需要通过class="ui container",定义容器后,浏览器会根据不 ...