本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
" F* l" z3 P, ] d/ [" c F2 }: A# x
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
* m4 h8 E$ p2 G! ~1 L: P 以下三个定义:' Z3 f/ u" P2 ~ k0 p4 q w4 Q/ O
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
( L7 Y6 f" H9 j 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
L; y; d W3 P+ l- T# j 所谓的双方优势策略则是指双方利益总和最大的策略。 / R0 @+ n5 x2 @- G* i
[编辑本段]严格优势策略举例分析
% h! Y! j7 X6 @ 一、经典的囚徒困境
+ h" ~- O: ~1 H& G# D L) O4 K 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
' E$ \3 n; }% B% H" ^& Y. G7 O/ R 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ( a1 M/ d6 V' G( v9 [8 ~
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 : w. J* B& b9 Y7 X7 {" n2 L
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
3 _, L* z. I( L 若二人都互相检举(互相“背叛”),则二人同样判监2年。6 P+ Z; e5 n! S p( k" ^, F- L
: O4 s$ R" r& K2 J
用表格概述如下:
, p1 G$ v. Y! ]( b, P: y' k: }! q# D! z2 A% B+ h( b( p* m8 `
甲沉默(合作) 甲认罪(背叛)
% p0 v8 f# o) K6 P8 J乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
5 T0 q0 ]; J1 I8 P& U6 X乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 + Z2 V. P1 l- h+ b; `
0 ^8 n) D0 d, `& l7 w" Z 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
9 ~: |2 \8 Y+ Z- E) ^% Q9 ~ 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
- M4 l5 I+ v9 S, g T+ x3 O 若对方沉默、背叛会让我获释,所以会选择背叛。
0 o# C7 \) j7 N1 t( ^ 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
- g9 T" `( X2 |0 P 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 + E8 O. e* b2 w- z: p
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
( M/ r4 w, E) A( ^, ] 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
" x, w8 I$ n" L, p( ~- G[编辑本段]二、智猪博弈理论
& c# \3 O t- I# f: n1 @ 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 8 }! @1 `4 z. x4 b9 Q/ ? T; K
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ; i4 n: d" @# Y5 L" t" E
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
9 R+ n: v/ ? f# r- V0 H6 ~& o 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
( v% ] C6 E$ F/ M/ y+ E3 D7 z “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 # W+ r3 r8 V s6 z: e1 S) W: G5 @
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
, W5 _% v9 F7 \4 W; r' Y \ 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
" m* w: p2 ]" S8 V
9 y- E8 P$ E* l8 C, c三、关于企业价格策略
3 ]4 m& \! P" e6 U$ ] Q1 h) [7 K
, D4 o6 ^$ f# Q " e2 @, \# w; _, t! G
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? / r4 e* \& p; a5 V1 d7 y) h x) g' m
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
% W& |- _8 F& z 以下三个定义:0 z- X* v. l. K4 F; h
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
5 N) t: O9 q7 O 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
4 O% k: S' v9 C" } 所谓的双方优势策略则是指双方利益总和最大的策略。 2 R5 s1 a1 }6 e' y6 u
[编辑本段]严格优势策略举例分析, e' N. V7 b2 D! j. A* |4 b" N: }
一、经典的囚徒困境
o; V* L) r# T$ m; c! m7 Y 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: , N n0 g5 g0 f+ i h4 B* v
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
1 F' R7 k, p2 Y2 _0 j' p# k 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
% g* d3 M* ^) ]; h5 l 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 : l0 c6 r$ b% _2 P( r; O
若二人都互相检举(互相“背叛”),则二人同样判监2年。
! R, [/ E% E. J/ f+ B , ~; O" g! b& g" u
用表格概述如下:
8 W" ]+ |* W+ w( L& O2 c
' t( r2 `; O2 ~: n2 \, J2 [ 甲沉默(合作) 甲认罪(背叛) 1 f! K. v6 c( z( c
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
) {% C, |. L* S" ~/ a乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 3 [# l% \0 U. o8 g( W+ V6 v" |
3 A/ \4 }- g0 }0 F7 o 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 . y- g9 n7 `& e) ~2 j
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 5 l9 i; n) w3 t8 U2 [8 e+ V
若对方沉默、背叛会让我获释,所以会选择背叛。 1 o6 ~! U( w; {) }) Z" W. i
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
+ L: y+ Z; o( ^; f, m- l. ?! { 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 / y: v; G9 }9 X; }) p
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
9 w- C( l( J8 i2 I( r 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
( {" q3 T# ]0 K' F[编辑本段]二、智猪博弈理论
( ^: n7 D: o- n' F) ]5 j 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 ) W- E1 X) g5 y3 M: x3 k$ c
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 $ U* V5 C/ e% k7 w& ?1 b
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
+ Y% b8 r$ X1 o4 U 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
$ r) ~4 ~! o1 V9 s/ _7 {# \+ H “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 * v, ]4 {* F# Z( @+ Y$ c" @
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 : ?4 P; e! X! V, q# H7 n
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。8 _9 F* j. I- y6 b3 |
) q( M0 o# @- w0 g3 p, C三、关于企业价格策略) ]' h4 x) O; ]8 U0 j! c# d4 _
& G1 L& `9 D1 D# h" j) W) I8 Q
8 \3 D$ r5 i: T6 p* G$ k1 A 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
* }; F0 m' @' { l% h1 u6 c 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
: w5 n7 w5 r* e% M2 w" ^ 以下三个定义:
' e9 q. ?8 y+ H 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
$ l* |( A9 ~% G0 l' e 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
+ E8 \. k" \# b/ P3 u 所谓的双方优势策略则是指双方利益总和最大的策略。 + Y# f% O, |, l
[编辑本段]严格优势策略举例分析+ F' b2 e1 [9 Q
一、经典的囚徒困境 - D* l, T" j4 t
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
; P0 L3 G ?' i/ {7 P+ E3 q 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: " d2 b2 W0 `* y" \
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 [, r3 m2 ^2 j4 @7 X- F3 A! E
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ! h& |4 F1 f! `: m4 p \
若二人都互相检举(互相“背叛”),则二人同样判监2年。& Z& }- d: S( N7 L1 i( y. e
' y% i7 O$ \. c4 }用表格概述如下:+ M$ g M! H% Q0 | }2 r
8 r/ ^ q- a* Q+ V
甲沉默(合作) 甲认罪(背叛)
U# ]0 ?+ n5 e乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
9 i6 A" P# A, k2 e) o) X/ A2 ^乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
. n" U! g- j. t @3 t& p- W5 S* a3 e) p3 L: e
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 % z6 d3 L5 s5 d
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: # n; T0 G/ L) f5 K, h7 \- k, q
若对方沉默、背叛会让我获释,所以会选择背叛。 ( D' M4 r) ^1 V5 u9 B/ _
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 ! J6 Q* \5 b5 w H5 b
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 & y! I8 y( @. }( a8 J9 h
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 9 U1 }* h- r* k8 U7 l* ]9 C/ n8 E7 W7 _
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
( D- b( p1 v& ], ~" y! b7 e! U! G[编辑本段]二、智猪博弈理论/ N0 R6 Y0 M) t
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 + y3 b/ i) m j [' o& i- G( Z
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 4 c+ ^7 \5 L, @2 {
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 8 \. }6 q: p) b o+ t
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 ; L- K' F0 w+ S X; `
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
" k" m* c, Y: L+ W2 L: | 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 6 x4 Y9 Q) U, K( T6 m
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
! j0 Z; ~( ~' G% i5 k
; `) n* j t7 l: Z( `/ v0 j4 P三、关于企业价格策略
+ ?# v% j" F3 A; W" C6 m- K- c
9 Q; }8 _# Z) X* L% d/ H3 {
3 d: ?0 ~# ? B! O5 X. F6 G% I 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
0 B3 e. S4 z6 s% B9 P 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
: B% Z! I$ V& P: o! O7 V 以下三个定义:
# h* r8 T! C# Z. J1 @$ @* m 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 9 J8 i; j$ D+ L' X! I
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
5 F5 Y! V, \* [8 | 所谓的双方优势策略则是指双方利益总和最大的策略。 0 i( y0 u) D" i# f& N
[编辑本段]严格优势策略举例分析6 p& Z0 Y: ^- H& }, P) r
一、经典的囚徒困境 - j1 h: s3 f* F( F
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 1 P5 m: O9 s& A2 h% `
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
* e) D* B* Q9 F/ G, T5 F$ N M 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 5 P8 f C* c$ z& V7 |' I
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 , q- j" M7 J0 g# p0 u. C6 T
若二人都互相检举(互相“背叛”),则二人同样判监2年。6 ~3 f( C3 F- i
2 M- E/ n' C5 y用表格概述如下:
( D; K" u! l2 s/ R L
4 ^2 x, ^! X4 C 甲沉默(合作) 甲认罪(背叛)
: C( X9 @! D- g乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
E) r: P) s9 K# E3 J9 w2 h. P乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
* I* t0 K( Q; |" O" T4 Y: V7 `2 N9 {% H
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
# Y+ t' Z# T& ^ 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
_; D4 f* @$ b0 c+ z5 I 若对方沉默、背叛会让我获释,所以会选择背叛。 # Q# ~5 j2 s' Y2 o: Q
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
- i, }8 { t3 L 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 % m- W* n- _. b" @6 {5 u, L
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
3 [) Y# l4 e# ]' q9 Q7 J 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
, q, m+ ~$ h0 ~7 G* x[编辑本段]二、智猪博弈理论% H6 x; E. o o. O4 a- |) q
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
& x; C( U1 h' A8 r 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
/ h9 D! b4 c& D( ?9 C 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 ]9 o4 a! A5 k8 n' Y
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 5 v, C0 F S7 C' \* E, c
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 % F7 E8 K3 f- P- Y
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 6 x; v- O5 U) \" p0 V3 |
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
6 c, ]3 [& \, e" r4 P3 S% O
3 M5 P$ h$ h, B* R7 H7 u# H3 H5 ?三、关于企业价格策略
. X* R* h1 a8 }8 f0 @( B3 c7 t" g% E- f% l ~, Y% ^ z* _# A
- V F3 E; M, m) s. y# {8 c 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? * t! i" t5 ^0 p# P0 \
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |