关灯
《文稿,还能这样写》作者雄文《笔杆子碎语》作者王一端《机关文稿写作入门》作者杨新宇《机关文字工作五十讲》作者何新国
最新《公文写作培训课程》直播间《公文写作百法例讲》作者房立洲老秘网站长、《老秘笔记》作者老猫《公文高手的自我修养》作者胡森林
开启左侧

人生有许多无耐

[复制链接]
lzqggg 发表于 2015-12-31 11:31:17 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
 
公文写作培训班
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 0 h2 r3 }1 S: C
* H- ~+ d8 |$ B: E( G  j* r: ^
严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);2 u% ?, b( G. ^4 ^3 m' a1 ?0 b
  以下三个定义:
* V# Q3 g% Q+ }( ~$ R+ _- x- G9 f! s' u  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
3 r: v. ]8 y$ v  c, f  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
- Q9 r1 q& R; [- I  W  所谓的双方优势策略则是指双方利益总和最大的策略。  1 v- v1 F7 m2 t) q% I
[编辑本段]严格优势策略举例分析
6 e/ _+ y# _- k4 p, h  一、经典的囚徒困境 : I3 T) H/ B" R6 c# O! k* c
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: / z2 e, U/ c, K* x  d/ [3 V
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
# g5 F. y" ^! P, B5 G6 h, a  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
; j7 M7 n  c. _' D  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
2 r1 Z6 v  r* D$ ^  若二人都互相检举(互相“背叛”),则二人同样判监2年。
1 p' C8 K$ T# ]0 }5 _+ x$ X  
* x9 W! h# u1 M  ~+ m- [. f0 M用表格概述如下:! G' U* T# K, p3 R& L# O

5 h; C3 f. I5 t4 o2 m% L) R    甲沉默(合作)  甲认罪(背叛)  # ~8 T' ?9 \' z. \
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
' d: O" c3 w" g2 J乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
3 p* R2 F& Q8 |( }+ K- I' U# ?, w# e7 r) b/ G; U+ P: b) J
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 $ ?4 G6 p: Z& K/ m5 D
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
" k, ~8 M4 |+ S& t+ Y, ^  若对方沉默、背叛会让我获释,所以会选择背叛。
' m6 {% ]) l8 o) b' T5 c3 z8 M# `  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
+ j$ {( ?% m' v. Y0 J6 `  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
! e5 w1 F0 }; K0 M. z  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
( O( _6 l# E1 B  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
1 T+ F! o1 q2 O* c# u2 ~[编辑本段]二、智猪博弈理论; I! R4 W; Q# k' [2 w2 Y0 R
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
) v$ c. R- S- V7 F  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
9 O# p; w( z) r% V  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。   X) L' E5 ]: v( o( n
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 8 n7 l" i% C0 x6 ?6 L0 i+ U3 O
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
: T/ T6 Q7 L2 W% l! @3 g, d- Z  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
% x8 o, Z" F  N3 G; H" D  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。7 t+ F1 p! k; O" y5 J; d
  
3 ]4 F7 d3 w! P- A0 i% v1 i三、关于企业价格策略
6 {' q1 f, ]' \9 N5 O  ~' L5 ?$ ~8 O6 H9 ]0 \
  3 @) E' u: b7 D: R+ J
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? . w+ ?- h# o5 b, F
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
% Z5 f8 B" {. W0 R1 p  以下三个定义:; N: L* P4 @+ }) L8 m
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 % M$ i) \/ p5 ~' U1 I1 G; V
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
9 t# n9 K  v& [+ h  所谓的双方优势策略则是指双方利益总和最大的策略。  1 b, h9 w) X2 y% L
[编辑本段]严格优势策略举例分析5 g, @  I$ a) l# z. U( H
  一、经典的囚徒困境 , i$ E' B) Z7 U9 a; ~
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: $ z7 n' y) D3 W/ e
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:   z" F1 Q7 Z; q( M3 j
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 . Z; t1 i  i9 Q% T3 g- X& V- z
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
( w8 I7 q* I" H1 I  若二人都互相检举(互相“背叛”),则二人同样判监2年。
5 G% L- g+ a4 {# ]  1 a  {0 {* t0 o6 i8 X6 m
用表格概述如下:
, f" J* ^- d2 r" i0 x* J3 ]" O* d: r
    甲沉默(合作)  甲认罪(背叛)  3 u: G+ g( s# ~. C
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
4 s) S& a) y4 f8 t% _5 _; ]乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
! ]. N  e/ s% d# V
" e3 [) ^' E; z$ i/ @6 w  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 # K; P. K3 `, T0 _& Z4 b
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: + m( b" N% ~3 \
  若对方沉默、背叛会让我获释,所以会选择背叛。 5 o6 n" a/ n! t8 b8 Z0 Y
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 ; g* L2 |7 W8 G7 U5 C
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 4 r( {" I2 W, z
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
: s  G9 c/ s+ w/ f1 o& R: u1 j  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。! U5 U6 u3 y% q; k
[编辑本段]二、智猪博弈理论3 c+ W( F3 @+ A% y9 s
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
3 u/ U# ^6 F, N7 S  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
9 X8 g9 b" V% F' F2 a- w" O2 p  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 ' m  I. Q" f; K' Z0 Y" L+ w/ z) Y
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 - H- y  w/ I2 `9 X6 D( I4 }0 z
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
1 N! a& m. A, B7 d( |  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
8 k* q2 G0 D; U2 r  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。/ Z: E2 I; A% k
  
! b: N/ k- |4 l4 g: s三、关于企业价格策略  c0 ]' g( {. G8 Y

! v7 M; e9 P. L+ u+ `+ ]  . O- i$ V- i9 o9 |: [" \
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? * d! d& Q( w6 s' A& z7 ]
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
" W1 \% X" Y' x- f1 a  以下三个定义:
8 p/ i) n3 O: o% a+ v! C  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
( x, a* |* h2 e0 N6 ]; E  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 2 r" r; c3 g: P, e
  所谓的双方优势策略则是指双方利益总和最大的策略。  
2 n( \. F, G5 a! i9 Y( q0 r8 g[编辑本段]严格优势策略举例分析, E# Z+ l8 `6 |" H3 L
  一、经典的囚徒困境 2 b; {- N1 N$ }% M: Y
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 4 J  ?0 G* ~7 `
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
8 c: r% ~) Y, ]" W/ M  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
$ `! X; B: K5 d" d% N% x% v  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
+ r  J# O  [0 U: F8 l6 _6 w  若二人都互相检举(互相“背叛”),则二人同样判监2年。
4 U. [+ Y/ X$ t) h, A6 q% H% k  
8 Z8 t) i& P- e$ r# q5 T用表格概述如下:
% w4 J! A! l- E( U  t% [0 D7 K+ Q4 u. a  U/ ^
    甲沉默(合作)  甲认罪(背叛)  
3 K1 @2 b, ]+ X" I3 I/ r乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
& a- W7 s; N1 y& r8 `: `3 e. d- }乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  7 Z! z4 n" E! H
  s  N" U, k& v5 f! ]
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
; @* T) k$ a4 h! J7 s5 a  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: " ^7 `0 f/ j- k
  若对方沉默、背叛会让我获释,所以会选择背叛。
! _  s+ G8 w/ |- W  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 ; u4 f, y8 D- x9 j1 {
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
, p6 H1 J, ^/ [) x+ t/ p2 p8 _9 \. x  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 % q2 u* m6 ~# G9 T
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。% g2 P+ S4 y- o! b" x  m
[编辑本段]二、智猪博弈理论6 {0 }% `$ X+ Y2 G  m, A
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 4 X* w% n" c  t
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
5 b( T! l6 f7 m6 B) S" G  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 6 q6 c/ g1 z6 z9 i0 m- L( P" ^, W) f
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 4 h0 C) w0 @. n  Z* D
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 * S3 `: E; o) f, F$ c
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
* i- Q. s0 y4 w% O& H7 W  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。, U1 G% v4 N$ C4 e
  
# N9 W  u1 d7 {, `$ k# {三、关于企业价格策略3 P; X* Z3 @8 u3 V8 h
9 W+ {" B  H' B  z
  
$ B+ {- n- ]# ]' {) `% q. f9 r  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 6 a" T1 u# I- v9 g# N
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
( ^- ], o  ?% D6 C, Z) z  以下三个定义:
9 [0 n9 d# F: M! k& ?  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
& t5 Z- O0 P* J% I5 n  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
- u/ C: v5 ~" c5 k9 h( l3 h! M  所谓的双方优势策略则是指双方利益总和最大的策略。  7 U% a9 ?# m7 F. |+ q
[编辑本段]严格优势策略举例分析
0 w! K# \, @) Y! E( D. S+ i  一、经典的囚徒困境 ; L7 b1 _! h- l7 |6 X& R6 n5 w9 \
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: * ~7 \! r' }( ^% ?+ i
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
2 D  z' Q" n, T8 n  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ) @) P3 m; k) v
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
. W! c& r5 Z6 J1 `& z7 N/ f/ j) v  若二人都互相检举(互相“背叛”),则二人同样判监2年。' G" ?# F) S$ a& O) z0 e
  
& r* p$ A* E5 Y$ p用表格概述如下:
  R! E2 }7 r& N' i3 e/ W$ M3 _" r0 N( D/ A4 [
    甲沉默(合作)  甲认罪(背叛)  8 y! ^$ r7 M. G1 k9 e
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  / r7 k( b; M) P7 ?# M
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  2 h7 Z8 i4 g6 W+ d0 U' h/ Z

! m6 ]0 f1 i. L4 K( s  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ) z& ~6 ^6 q/ r$ {
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
3 E( Y' o8 Z) o3 t* Q% ~+ k  若对方沉默、背叛会让我获释,所以会选择背叛。 5 V2 U9 R" V$ m. R/ ^9 @
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
+ F& L3 P, H! q- E* p. h/ y$ t  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
- ^( N! {  M! T  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
4 y/ d+ ~! s3 @8 X# S& ]9 J* Q1 b  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。- m5 C( g3 N9 M* z! f0 {4 x# v
[编辑本段]二、智猪博弈理论6 R/ W' e( X! H1 A5 U& n: T
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
/ G& K$ P3 e1 s. f5 T- P- f  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 - M4 D3 ]: c+ n1 B) N4 u! v- i
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 # j, E! G) e+ Z4 W' S7 |
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 , j9 d, v' |9 U4 f% k& }
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
8 C; {- ]5 C3 o9 `6 V2 _, n' |  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 & }& Z! }- b$ R0 N5 g' q/ b* I
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。- o, ]+ Z! k7 ^2 x$ G( `% h
  + E6 H# M5 T; Z# b
三、关于企业价格策略
* h) u$ W1 t1 T7 {" \6 z
% E5 k, p6 f: {. F" p) F3 y  
6 P- ]1 ]( w( |% O! A- B0 l& m  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
+ v) r, z5 N: {3 t# t' O  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


0关注

14粉丝

9帖子

排行榜
作者专栏

关注我们:微信订阅号

官方微信公众号

客服个人微信号

全国服务热线:

0595-22880819

公司地址:泉州秘途文化传媒有限公司

运营中心:福建省泉州市

Email:506070961#qq.com

Copyright   ©2015-2025  老秘网 责任编辑:释然Powered by©Discuz!技术支持:秘途文化  备案号   ( 闽ICP备19022590号-1 闽公网安备35050302000919号 )