博弈解释结构模型——GISM


论文写作或者计算需要帮助可发邮件到 hwstu # sohu.com 把 #替换成@,请说清来意,不必拐弯抹角,浪费相互之间的时间。

返回首页


  所有的解释结构模型都是博弈解释结构模型,没有例外。


博弈论


  博弈论(Game Theory)直译为游戏论,在中国可能是由于传统观念里,认为游戏是下九流的东西,对游戏特别排斥,在博弈论火爆的90年代,电子游戏还称为电子海洛因。博弈论中的博弈又跟赌博联系在一起。因此很多书籍或者文章连博弈论都不叫了,把博弈论称为对策论。

  博弈论是一种系统科学方法,也是现代数学崛起的一个新分支,同时也是运筹学的一个重要学科。

  博弈论思想自古有之,比如打架、打仗、赌博、游戏都是博弈论的范畴,都是在特定条件或者规则下进行的对抗。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,并没有向理论化发展。而博弈论中的博弈即英文Game,跟奥林匹克运动会(Olympic Games)中的Game是同源,同一个意思,即是游戏的意思,也有竞技的意思,也有比赛的意思。

  最早的博弈论研究的是零和博弈,这类博弈就是有你没我,有我没有你;赢者通吃的规则,比如棋类游戏,博弈论考虑游戏中的个体的预测行为和实际行为,研究它们的优化策略。

  在博弈论发展的历史当中,有两个里程碑式的人物:冯·诺依曼(von Neumann)与约翰·纳什(John Nash )。

  1928年,冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。1944年,冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统地应用于经济领域,从而奠定了这一学科的基础和理论体系。冯·诺依曼是匈牙利的犹太人,后来到了美国,并成为了美国人。本科学的是化学,然后转为纯数学研究。冯·诺伊曼对世界上第一台电子计算机ENIAC(电子数字积分计算机)的设计提出过建议。后续的计算机都是基于他的建议设计并进行各种扩充,乃至,直到现在,计算机还有一个别名——冯·诺依曼机。鉴于冯·诺依曼在发明电子计算机中所起到关键性作用,他被誉为“计算机之父”。由于冯·诺依曼在计算机界的影响太过耀眼,以至于他的另外一个头衔“博弈论之父”则显得相对暗淡一点。

  在博弈论领域与冯·诺依曼比肩齐名的是约翰·纳什(John Nash )。而在其它领域诸如经济学、社会学、娱乐圈等等领域,纳什名气要大得多。纳什被人熟知在于其本人的故事性与他提出的博弈论框架可以用一个特别通俗易懂的故事来解释——囚徒困境

  在2001年,迎着911恐袭的浪潮,《美丽心灵》抚慰了一大拨人的内心世界。《美丽心灵》是当年奥斯卡的最大赢家。一举拿下了四座份量最重的小金人。该电影讲的就是1994年诺贝尔奖得主纳什的故事。随着电影的播出,各种好的坏的关于纳什的故事接踵而来。比如纳什患的精神类疾病是CIA下药后得的。而CIA下药是因为纳什是一个双性恋者。此外也有人抨击包括诺贝尔奖在内的一堆著名奖项的颁发规则。为什么不能颁发给当时看着有点不正常的精神疾病患者。他们的突出贡献不应该受到当时状态的影响。

  纳什不是一个著作等身的学者。在学术刊物中他的著作就寥寥几篇。这些论文都是及其精悍,比如纳什22岁完成的博士论文加上封面,引用文献等才27页而且还是英文写的,翻译成中文,去掉综述与文献剩下的干货就10来页。纳什根据其博士论文的发表了四篇小论文,其最出名的两篇论文为:

  第一篇、是纳什的开创性论文,叫EquilibriumPoints in N-person Games 《N人博弈的均衡点》(1950),该文翻译成中文,去掉文献引用等,一页纸都不到。正是这篇论文为博弈论的一般化奠定了坚实的基础。

  第二篇、Non-cooperative Games《非合作博弈》(1951),这篇论文也不长,它给出了纳什均衡的概念和均衡存在定理。

  纳什是搞数学出来的,数学底子不好的人看纳什的论文跟看天书没有区别。

  数学底子差的读者,适合看看《XXX从入门到精通》《XXX傻瓜丛书》之类的书,笔者推荐A Course in Game Theory ( by Martin Osborne and Ariel Rubinstein).

  此书的深度,广度,视角,表述,例题等等都很好,非常适合循序渐进的自学。更关键的是,英文版虽然卖得贵,但是它提供了免费下载,而且有中文版本的下载(吐槽一下,翻译真心不咋地),该书的习题也很不错,更关键的是有答案。当然这本书对于博弈论中的各个子问题都没有深入,甚至连不完全信息博弈(game of incomplete information)这种基本情况都没有单独列出来来讲。 如果需要进一步研究,还是去啃纳什的博士论文。


  博弈论两个大佬之间的小故事

  两个大佬之间有三个个巧合:

  冯·诺依曼创立博弈论的1928年,恰好是纳什出生之时。

  纳什最早学的专业跟冯·诺伊曼一样,纳什开始是学化学工程专业,也许讨厌做实验,转去搞数学了。

  同时两人都在普林斯顿大学。

  冯·诺伊曼是个全才。可以说他的全面性完全盖过了同为在普林斯顿大学的爱因斯坦。冯诺依曼除了被称为博弈论之父跟计算机之父外:
  他在纯数学(集合论/算子论/测度论等),
  理论物理(数学严格化/量子逻辑等),
  应用物理(流体力学/激波理论等),
  控制论(协助维纳创立控制论),
  气象学(带领团队做出首个天气预报),
  生物学(与乌拉姆创立元胞自动机理论/为DNA的发现打下基础,计算机领域的遗传算法就跟他有关),
  经济学(与摩根斯坦恩创立博弈论/数理经济学奠基人)
  战争威慑论(战争数学化/迫使苏联放弃斯大林主义)
  ……

  冯·诺依曼在上面的任何一个领域的成就,都是让人仰望的!

  年轻的且内向,行为在一般人眼里有点古怪的纳什找到冯·诺依曼探讨他的博弈论,也许是纳什表达的问题,也许是冯·诺依曼觉得纳什的东西在数学上没有啥突破,冯·诺依曼对纳什的博弈论并不感冒,只是淡淡的说了一句:“不过是另一个不动点定理。”

  冯·诺依曼有资格讲这个话,因为他的数学牛得要死。但是在其他人眼里,比如搞经济的,搞政治的,或者其它学科人眼里,纳什这套是开创性的,纳什运用到了拓扑学的不动点定理。而在此之前,人们根本不知道拓扑学里的拓扑不动点有什么实际用途,只是搞数学的那帮人创造出来的不明觉厉的思维游戏而已。

  纳什跟爱因斯坦有见过面,但是爱因斯坦对纳什这套反应冷淡,也许是两人没有get到对方的点上。最近有人传出,纳什在去世前,还念叨着,他可以用一个新的数学表达来解释相对论。也有人为此发出感慨,纳什更象是魔鬼之子,纳什的研究触碰到了上帝的底线,如果任由他研究下去,上帝将无处容身,所以上帝只好让他精神失常,无法继续研究,当纳什领取诺贝尔奖,又要继续研究,上帝害怕了,就把他召唤走了。


囚徒困境的解释结构模型表达


  囚徒困境是一个流传及广的例子。有讲博弈论的书籍,一定会提到囚徒困境,博弈论被大众接受,并激发起对博弈论研究的热情,囚徒困境这个形象故事功不可没。从某种意义上来说,正是由于纳什本人的故事,跟囚徒困境的故事,才使得博弈论走出了数学那高冷的圈子。

  囚徒困境是博弈论中非零和博弈的代表性的例子,反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质,但现实中囚徒困境的例子屡见不鲜。 “囚徒困境”是1950年美国兰德公司的梅里尔·弗勒德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问艾伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。两个共谋犯罪的人被关入监狱,不能互相沟通情况。如果两个人都不揭发对方,则由于证据不确定,每个人都坐牢一年;若一人揭发,而另一人沉默,则揭发者因为立功而立即获释,沉默者因不合作而入狱十年;若互相揭发,则因证据确实,二者都判刑八年。由于囚徒无法信任对方,因此倾向于互相揭发,而不是同守沉默。最终导致纳什均衡仅落在非合作点上的博弈模型。

  同样是囚徒困境:一些书籍的描述稍微有点变化。如:

  两个被指共同犯法的人被警察分别关押。两人都被告之

  1、如果一个人坦白,将会从宽处理,而另一个人不招供顽抗到底,将会从严处理,坦白的人放了,抗拒的坐3年牢。

  2、如果两个人都坦白,每个人坐牢1年。

  2、如果两个人都不交代问题,每个人坐牢2年。

囚徒困境中的要素分析


  对于ISM方法来说,最核心的、最根本的步骤是建立邻接矩阵。后续的过程只是一个数理逻辑的演算。而建立邻接布尔矩阵,首先要根据合理的逻辑确定要素。

  囚徒困境中的场景,可以描述为:警察在游戏规则内对嫌犯A、嫌犯B、施加相同的影响。嫌犯A、嫌犯B、在接收影响后会根据其自身的判断,选择招供还是不招供。最终由招供不招供的组合情况,确定对嫌犯的惩罚。

  因此整个系统的核心要素如下:

$$ \begin{array} {c|c|c|c|c|c|c|c} {序号} &{ 要素名称} \\ \hline 1 &\color{blue}{警察} \\ \hline 2 &\color{red}{嫌犯A} \\ \hline 3 &\color{red}{嫌犯B} \\ \hline 4 &{招供并接受惩罚} \\ \hline \end{array} $$  

不确定邻接矩阵的建立


  在系统中存在着四个要素。现在对要素两两比较之间的直接关系的情况。

  警察对嫌犯A、嫌犯B是施加了直接影响,同时在给定的条件中嫌犯并没有对警察施加影响。警察并没有跟招供并接受惩罚这个目标要素有直接的关系,只是一个间接的因果关系。

  嫌犯A跟嫌犯B是分开关押并审问的,所以两嫌犯之间并无直接关系。嫌犯是否交代来自于嫌犯本身的判断下做出的决定,而每个嫌犯都可能做出招供与不招供两种情况,因此嫌犯是否招供为不确定值。

$$ U-Matrix= \begin{array} {c|c|c|c|c|c|c|c} {M_{4 \times4}} &\fbox{警察} &\fbox{嫌犯A} &\fbox{嫌犯B} &\fbox{招供情况做出惩罚}\\ \hline \fbox{警察} &0 &1 &1 &0 \\ \hline \fbox{嫌犯A} &0 &0 &0 &\color{red}{Un} \\ \hline \fbox{嫌犯B } &0 &0 &0 &\color{red}{Un} \\ \hline \fbox{招供情况做出惩罚} &0 &0 &0 &0 \\ \hline \end{array} $$  

不确定ISM的求解


  不确定矩阵$U-Matrix$可以得到4子矩阵

$$ \begin{array} {c|c|c|c|c|c|c|c} {Son1} &\fbox{警察} &\fbox{嫌犯A} &\fbox{嫌犯B} &\fbox{招供}\\ \hline \fbox{警察} &0 &1 &1 &0 \\ \hline \fbox{嫌犯A} &0 &0 &0 &\color{red}{1} \\ \hline \fbox{嫌犯B } &0 &0 &0 &\color{red}{1} \\ \hline \fbox{招供} &0 &0 &0 &0 \\ \hline \end{array} \leftrightsquigarrow \begin{array} {c|c|c|c|c|c|c|c} {Son2} &\fbox{警察} &\fbox{嫌犯A} &\fbox{嫌犯B} &\fbox{招供}\\ \hline \fbox{警察} &0 &1 &1 &0 \\ \hline \fbox{嫌犯A} &0 &0 &0 &\color{red}{0} \\ \hline \fbox{嫌犯B } &0 &0 &0 &\color{red}{1} \\ \hline \fbox{招供} &0 &0 &0 &0 \\ \hline \end{array} $$  

$$ \begin{array} {c|c|c|c|c|c|c|c} {Son3} &\fbox{警察} &\fbox{嫌犯A} &\fbox{嫌犯B} &\fbox{招供}\\ \hline \fbox{警察} &0 &1 &1 &0 \\ \hline \fbox{嫌犯A} &0 &0 &0 &\color{red}{1} \\ \hline \fbox{嫌犯B } &0 &0 &0 &\color{red}{0} \\ \hline \fbox{招供} &0 &0 &0 &0 \\ \hline \end{array} \leftrightsquigarrow \begin{array} {c|c|c|c|c|c|c|c} {Son4} &\fbox{警察} &\fbox{嫌犯A} &\fbox{嫌犯B} &\fbox{招供}\\ \hline \fbox{警察} &0 &1 &1 &0 \\ \hline \fbox{嫌犯A} &0 &0 &0 &\color{red}{0} \\ \hline \fbox{嫌犯B } &0 &0 &0 &\color{red}{0} \\ \hline \fbox{招供} &0 &0 &0 &0 \\ \hline \end{array} $$  

  对上面四个矩阵求解得到如下层级图:

 认罪领罚
 嫌疑犯A
 嫌疑犯B
  警察
 认罪领罚
 嫌疑犯A
 嫌疑犯B
  警察
 认罪领罚
 嫌疑犯A
 嫌疑犯B
  警察
 认罪领罚
 嫌疑犯A
 嫌疑犯B
  警察

  上述是通过不确定性解释结构模型得出的四种异构体也是机械的程序性的解法。

  这种求解最大问题是,把系统中的两个要素:$嫌疑犯A,嫌疑犯B$当成了木头,无任何思考能力的机械的物体。从仿真的角度考虑,需要关注,嫌疑犯是如何面对警察的审讯,是如何思考并应对的。

  从嫌犯的角度来考察最终的结果会是怎么样的呢?

  首先观察整个囚徒困境的前提:

  第一、嫌疑犯A、嫌疑犯B是分开审讯的,这样做的目的是防止两人串供,防止两人存在着有效的,真实的信息沟通。

  第二、嫌疑犯不是木头,而是理性的,所谓的理性指的是精致的利己主义者,是趋利避害的。

  第三、嫌疑犯的选择是有限的,在例子中的嫌疑犯手中只有一张牌可以打,就是招供出同伙。也就是对于任意一个嫌疑犯来说他只有招供或者不招供两种选择。

  因此嫌疑犯A就会想,他招供了,会判几年?他不供出同伙会判几年?

$$   第一个囚徒困境中的分段函数 f(n) = \begin{cases} 判入狱{\color{blue}0年}或者{\color{blue}8年}, & \text{如果供出同伙} \\[2ex] 判入狱{\color{red}1年}或者{\color{red}{10}年}, & \text{如果不供出同伙} \end{cases} $$

$$   第二个囚徒困境中的分段函数 f(n) = \begin{cases} 判入狱{\color{blue}0年}或者{\color{blue}1年}, & \text{如果供出同伙} \\[2ex] 判入狱{\color{red}2年}或者{\color{red}3年}, & \text{如果不供出同伙} \end{cases} $$

  很显然不论是嫌疑犯A还是嫌疑犯B都会倾向于选择供出同伙。

  以第二个囚徒困境的例子来说,供出同伙他可能不坐牢,或者坐1年的牢。这个选择要好过于硬抗到底的选择。

  同时,嫌疑犯A选定了招供,不论嫌疑犯做出什么选择,嫌疑犯A是最划算的,它最多就坐1年牢。最好的情况是不用坐牢。

  因此最终观测到的ISM层级结构是嫌疑犯A,嫌疑犯B都选择招供这样一个结果。即上图中第一个异构体的结构。

  同时可以看到对于每个个体来说,他们的最佳选择,反而是整体的最差结果。

  比如囚徒困境的第一个例子,结构一:两者受的惩罚总共是16年牢狱之灾;结构二、结构三、两者受到的惩罚总共是10年的牢狱之灾;结构四、两者受到的惩罚是2年的牢狱之灾。

  

纳什关于博弈论框架的定义


  纳什在EquilibriumPoints in N-person Games 《N人博弈的均衡点》定义了博弈论的一般范式。

  任意一个复杂的博弈$G$有下面几个方面组成:

  $G={P,A,S,I,U}$

  P:即博弈的参与者也叫局中人(player),在囚徒困境中的局中人指的嫌疑犯A与嫌疑犯B。而在广义一点的局中人包括警察与嫌疑人。

  A:为各局中人的所有可能的策略或行动的集合(strategy set)。根据该集合是有限还是无限,可分为有限博弈和无限博弈,后者表现为连续对策、重复博弈和微分对策等。通常用Si表示局中人i可以选择的所有策略的集合,即纯策略空间。其中任一特定策略用$s_i$表示。即$s_i∈S_i, S_i ={s_i}$,表示策略$s_i$是策略集$S_i$中的元素。若n个局中人,每人选择一个策略,n维向量$s = (s_1,s_2,……,s_n)$,称为一个策略组合,其中$s_i$表示局中人i的策略选择。策略空间可以是连续的,也可以是离散的,而在囚徒困境中是离散的,且只有一个选项的两个情况——招供还是不招供。

  S:博弈的进程,也是博弈进行的次序(sequence)。局中人同时行动的一次性决策的博弈,称为静态博弈;局中人行动有先后次序,称为动态博弈。在囚徒困境中两个囚犯是分隔开的,他们啥时候招供对对方的招供不产生任意影响,由于两个嫌疑犯之间的招供次序对最终结果不构成影响。因此该情境为静态博弈。

  I:信息(information),能够影响最后博弈结局的所有局中人的情报。信息在博弈中占重要的地位,博弈的赢得很大程度上依赖于信息的准确度与多寡。得益信息是博弈中的重要信息,如果博弈各方对各种局势下所有局中人的得益状况完全清楚,称之为完全信息博弈。反之为不完全信息博弈。在动态博弈中还有一类信息:轮到行动的博弈方是否完全了解此前对方的行动。如果完全了解则称之为“具有完美信息”的博弈。反之称为“不完美信息的动态博弈”。由于信息不完美,博弈的结果只能是概率期望,而不能像完美信息博弈那样有确定的结果。

  U:为局中人期望获得利益(utilize)也叫支付函数(pay off),也是博弈各方追求的最终目标,。根据各方得益的不同情况,分为零和博弈和变和博弈。零和博弈中各方利益之间是完全对立的。变和博弈有可能存在合作关系,争取双赢的局面。通常用ui表示局中人i的支付函数,$u = (u_1,u_2,……,u_n)$为n个局中人的支付组合。博弈的基本特征就是任一局中人的支付不仅取决于自己的策略选择,而是取决于所有局中人的共同选择。

  以上是一个博弈中的5个基本要素,其中策略集合和支付函数是最为关键的研究对象。

  

  纳什均衡(Nash equilibrium)

  纳什均衡的定义:在博弈$G=\{S_1,…,S_n; u_1,…,u_n\}$中,如果由各个博弈方的各一个策略组成的某个策略组合$(s_1^*,…,s_n^*)$中,任一博弈方i的策略${s_i^* }$,都是对其余博弈方策略的组合$(s_1^*,…s_{(i-1)}^*,s_{(i+1)}^*,…,s_n^*)$的最佳对策。

  即$ui(s_1^*,…s_{(i-1)}^*,s_i^*,s_{(i+1)}^*,…,s_n^*)≥ui(s_1^*,…s_{(i-1)}^*,s_{(ij)}^*,s_{(i+1)}^*,…,s_n^*)$对任意$ s_{(ij)}∈S_i$都成立,则称(s1*,…,sn*)为G的一个纳什均衡。

博弈解释结构模型的定义与几个实例


  什么叫博弈解释结构模型?可以从下面几个地方来定义:

  第一种:有向图的拓扑不动点分析

  至于什么是拓扑不动点之类的就不要问我了,这种定义拿去装逼很管用。同时一定要坚信这句话肯定没有错,冯·诺依曼就是这么评价纳什的博弈论的。

  第二种:不确定性解释结构模型的场景分析

   第三种:不确定性解释结构模型的博弈分析并给出最可几的层级结构图

   第四种:控制论视野下的层次化的菊花链

   上述表述是等价的,同样涉及到了几个新的名词: 场景 最可几 控制论。

   最可几很好理解,就是最可能的意思。是概率论里常见的名词。

   场景在GISM中有两个方面,第一、整个系统所处的游戏规则;第二、参与博弈的要素(局中人)所处的状态以及对应的决策策略

   控制论是系统科学的重要组成。自从1948 年诺伯特·维纳发表了著名的《控制论——关于在动物和机器中控制和通讯的科学》一书以来,控制论的思想和方法已经渗透到了几乎所有的自然科学和社会科学领域。维纳把控制论看作是一门研究机器、生命社会中控制和通讯的一般规律的科学,更具体他说,是研究动态系统在变化的环境条件下如何保持平衡状态或稳定状态的科学。他特意创造“Cybernetics”这个英语新词来命名这门科学。“控制论”一同最初来源希腊文“mberuhhtz”,原意为“操舵术”,就是掌舵的方法和技术的意思。在柏拉图(古希腊哲学家)的著作中,经常用它来表示管理人的艺术。

  在GISM可以简化成:根本原因要素,在游戏规则的前提下,对中间层要素发出作用。中间层要素根据自身的情境,做出对于自身有利的响应,这种响应最终得到的结构,可以是一个或者多个层次化的菊花链来表示。从推理的过程来看它是从根本原因要素开始,因此在控制论的视野下,GISM用原因优先的抽取规则更符合分析的流程。

  从 游戏规则角度考虑囚徒困境故事1跟囚徒困境2两个例子的异同

  从惩恶扬善的角度考虑,制定的游戏规则是希望嫌疑犯受到的处罚是最大化的。

  囚徒困境例子1中

   $$ \begin{array} {c|c|c|c|c|c|c|c} {异构体} &son1 &son2 &son3 &son4 \\ \hline 嫌疑犯A的惩罚 &{\bbox[#ff1011,2pt] { 入狱\color{blue}8 }} & {\bbox[#ff1011,2pt] { 入狱\color{blue}{10} }}&{\bbox[#ff1011,2pt] { 0 }} &{\bbox[#ff1011,2pt] { 入狱\color{blue}1 }} \\ \hline 嫌疑犯B的惩罚 & {\bbox[#DD80FF,2pt] { 入狱\color{blue}8 }}& {\bbox[#DD80FF,2pt] { 0 }} &{\bbox[#DD80FF,2pt] { 入狱\color{blue}{10}}} &{\bbox[#DD80FF,2pt] { 入狱\color{blue}1 }} \\ \hline 总惩罚 & {\bbox[#00FFAA ,2pt] { 入狱16年} }&{\bbox[#00FFAA ,2pt] { 入狱10年} } &{\bbox[#00FFAA ,2pt] { 入狱10年} } & {\bbox[#00FFAA ,2pt] { 入狱2年} }\\ \hline \end{array} $$

  囚徒困境例子2中

   $$ \begin{array} {c|c|c|c|c|c|c|c} {异构体} &son1 &son2 &son3 &son4 \\ \hline 嫌疑犯A的惩罚 &{\bbox[#ff1011,2pt] { 入狱\color{blue}1 }} & {\bbox[#ff1011,2pt] { 入狱\color{blue}{3} }}&{\bbox[#ff1011,2pt] { 0 }} &{\bbox[#ff1011,2pt] { 入狱\color{blue}2 }} \\ \hline 嫌疑犯B的惩罚 & {\bbox[#DD80FF,2pt] { 入狱\color{blue}1}}& {\bbox[#DD80FF,2pt] { 0 }} &{\bbox[#DD80FF,2pt] { 入狱\color{blue}{3}}} &{\bbox[#DD80FF,2pt] { 入狱\color{blue}2 }} \\ \hline 总惩罚 & {\bbox[#00FFAA ,2pt] { 入狱2年} }&{\bbox[#00FFAA ,2pt] { 入狱3年} } &{\bbox[#00FFAA ,2pt] { 入狱3年} } & {\bbox[#00FFAA ,2pt] { 入狱4年} }\\ \hline \end{array} $$

  由于son1 是最可几的结构,因此从最终的结果上看,在囚徒困境例子2中的游戏规则并没有使得嫌疑人,获得最大的惩罚。

  因此,囚徒困境例子2中的游戏规则更改为:两人都招供,每个人判罚入狱2年;两个人都不招供每个人判罚1年。

  中间层要素自身的情境极为重要,不同的场景下,可能存在着相反的均衡结构,也可能存在着一致均衡结构。

  美国作家欧·亨利写了一篇著名的短篇小说《警察与赞美诗》,该小说的主人公一直想去坐牢。假设嫌疑犯A由于贫穷或者其它因素,因此对于嫌疑犯A这个要素来说,它面对选择:

$$   第二个囚徒困境中的分段函数 f(n) = \begin{cases} 判入狱{\color{blue}0年}或者{\color{blue}1年}, & \text{如果供出同伙} \\[2ex] 判入狱{\color{red}2年}或者{\color{red}3年}, & \text{如果不供出同伙} \end{cases} $$

  因此嫌疑犯A的选择是不供出同伙,所有的问题自己扛。如果嫌疑犯B的场景跟原来保持一致,其最优策略依然供出同伙,最可几的结果如下。

$$ Game=\begin{array} {c|c|c|c|c|c|c|c}{M_{6 \times6}} & \fbox{警察} &\fbox{嫌犯A} &\fbox{嫌犯B} &\fbox{供出同伙} &\fbox{不供出同伙 } & \fbox{惩罚}\\ \hline \fbox{警察} & &1 &1 & & & \\ \hline \fbox{嫌犯A} & & & & {\bbox[#ff1011,2pt] { \color{blue}0}} &{\bbox[#ff1011,2pt] { \color{blue}1}} & \\ \hline \fbox{嫌犯B} & & & &{\bbox[#00FFAA ,2pt] { 1} } & {\bbox[#00FFAA ,2pt] { 0} } & \\ \hline \fbox{供出同伙} & & & & & &1\\ \hline \fbox{不供出同伙} & & & & & &1\\ \hline \fbox{惩罚} & & & & & &\\ \hline \end{array} $$

 

  在控制论的视野下,即原因优先的抽取规则进行层级划分,得到的层次化菊花链如下。

警察
嫌犯A
嫌犯B
供出同伙
不供出同伙
惩罚

  从上面的例子可以看到,嫌烦A对于要素供出同伙,不供出同伙,两者只能选择一个。在控制的角度看,也就是两条有向边只能取一条,从流程图的角度考虑,它就是一个判断语句的分支结构。GISM很关注大的场景,以及细节的场景。大的场景可以归结为游戏规则,小的场景主要是基于博弈中的局中人的分析。

  对于涉及到人为主体的局中人,场景一词还跟心理学紧密相关。也就是所谓的完全理性的人是不存在的。具体的个人都有其独特的心理期望值。

  比如,我们把囚徒困境中的处罚条件改夸张点,看看它可能的结果是怎么样。

  两个都招供,每个人都判100年徒刑;一个招供,一个不招供,招供的判40年徒刑,不招供的判150年徒刑;两个都不招供,每个人判41年徒刑。

  如果是上面的游戏规则,那各种情况都可能出现。因为招供跟不招供都差不多的结果。跟无期徒刑没啥区别。上面的例子说明具体到个人,对数字并非有一个清晰的界限,它是一种模糊数

  同样,在例子2中的嫌疑犯,存在着嫌疑犯之间的信任问题,以及在犯罪团伙中的地位问题等,有着各种具体的场景,要具体分析,概括的说,就是每个人都有自己的心理账户只有洞悉人性的心理账户才能更准确的探讨博弈的结果。



如需用到其它方法如:
模糊解释结构模型即FISM的建模过程,包括FISM中的模糊算子的选择、诸如查徳算子、有界算子、爱因斯坦算子等等计算结果以及解释。
解释结构模型与DEMATEL:( Decision Making Trial and Evaluation Laboratory,决策试验和评价实验室 )联合使用。
解释结构模型与AHP/ANP 即层次分析法/网络分析法 联用。
解释结构模型与灰色系统 联用。
与自组织结构模型 SOM 。
与机器学习包括BP网络
与博弈论
与深度学习等等
欢迎来邮件探讨,亦可开发相关内容。
无毛定理有理解的尤其受欢迎
解释结构模型的高级运用,分子受力实时分析