本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 h0 h. ` F4 c1 @* o
- ?' j; ]& r; k
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);2 n/ @2 }& O, T% \
以下三个定义:
3 q2 U& }) j0 d 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 z4 ?- s; Y- F# W+ S! N
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 " y" P. g2 `8 K+ K5 @- Q3 `" I% f
所谓的双方优势策略则是指双方利益总和最大的策略。 * q2 M2 G3 C" t! `
[编辑本段]严格优势策略举例分析8 @6 S# Z! W; x, b q& {
一、经典的囚徒困境
1 E) z9 Z8 n) V+ {, D 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
- ~- Z+ m: r P a, w8 U 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
) M* c. C7 V& f/ ?/ }7 T( {/ O 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 & s3 w _! |5 t5 {8 N
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 7 z" `0 T; l3 C" C- P+ T8 c: V: L
若二人都互相检举(互相“背叛”),则二人同样判监2年。
+ b8 g/ R7 n5 y) D0 i/ \( R
; i- Q3 r8 B$ `: t2 X/ b5 z用表格概述如下:6 }. C% a# I/ T& F
3 ?" b; w1 j. `
甲沉默(合作) 甲认罪(背叛) 5 _) ]) M2 z3 c
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
/ r0 }) r* F! i乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 * z: Y( |% l6 b, J- P, ]1 t
4 C, i( X) K: \8 L7 @+ Q 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 % L6 d, @8 F- o2 l; C5 N
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
+ a, n. E6 Q) P7 S' G3 C5 N1 [ 若对方沉默、背叛会让我获释,所以会选择背叛。
' B$ S5 d: {* q# [ 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
& \0 O" `! `5 d' f6 C 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
7 z w" x/ i+ n 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
& E2 y/ p1 t4 j+ Z; T 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
z/ ?/ T, b' {5 b7 o9 ^0 T[编辑本段]二、智猪博弈理论
& n, T- y: m- f7 H6 M2 k 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
# d9 ]8 N9 l* ~ 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
; M. g( O/ d; h$ t 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 4 H1 H& O4 I6 H& i2 ]( ?
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 0 s0 Z& Q* ]7 u8 M8 Y4 o
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ! o/ o0 Q/ O; J. q. m
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 0 O j- k' P) `. G
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
% m5 D% r0 R) X$ q7 t6 d
& i6 I) W" V" u. n, l三、关于企业价格策略
2 B! Y9 H' `0 K/ _' B
( @) ^4 z% ^" p$ _8 {
2 M1 J# X; J/ u% y9 x! I, r* y 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
! q: G2 Q( b( B q) [ 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
) J Y; ~9 q7 c, l9 H 以下三个定义:: T) _2 l3 u4 G }5 q# S" a
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
' j/ }& q# j' h) Z1 c 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 1 \+ \ v9 {* c/ e( L+ Q
所谓的双方优势策略则是指双方利益总和最大的策略。
j2 X% y7 A' I[编辑本段]严格优势策略举例分析; m/ Z4 o3 C2 d7 {; O* ]: e
一、经典的囚徒困境
9 J% Y4 j, G/ q; s9 Q* F' A 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: " y- |$ ~* r T7 E' W& w, J1 L
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 1 v7 x u3 b6 R4 H
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 % a$ x3 a5 O4 @- O
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
O! V: l/ Q+ V6 r! N! s9 c 若二人都互相检举(互相“背叛”),则二人同样判监2年。
6 A5 R' W$ z' ?+ ?: c
) Q- F; h4 w+ v! s用表格概述如下:) \4 G% i5 X4 o2 O4 K$ a+ _
) `2 Z: K: s0 Y) B- W7 A
甲沉默(合作) 甲认罪(背叛)
! O0 P+ e/ k+ y$ a乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
- Q8 z6 j# q( D& I" E6 j乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
: D6 y3 u8 q- M# |+ ^+ `( |' M1 Q* q& j
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ; N# V4 }# N+ P
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 7 w2 }2 Q8 m5 K& O8 k) E
若对方沉默、背叛会让我获释,所以会选择背叛。 4 X4 K; `1 S+ ~
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
7 A# |. Z- v0 Z. G+ ^& P 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
# g6 O6 c5 a# k/ Z- Z 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
5 u5 i& @& f4 @! k 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
) W9 h8 x, q+ M* M' Z) c3 I! s+ Z[编辑本段]二、智猪博弈理论# ]8 \" V& ^! [: i5 L
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
' v& g" b J `0 x& B 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
3 W' l# G1 m- D9 [5 z 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
/ j. b* P5 y5 b 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
8 Q( X P) u# G, ]2 x) V “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 8 W* W" g0 c9 [6 S0 r$ P( a
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
; k- y; K5 q* P- Y 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。 E" B' g+ f( w( F6 C% j6 R7 v) @) H
2 J. d! h+ B3 z4 |1 P. u" c1 f! q三、关于企业价格策略
: a5 F' Y# C3 a2 R2 _' q+ v: c# m, U" B* A% ]* L
- }# v+ Q5 K" g# r, h 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? " x- n3 t: `/ V* F% [2 L
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
; B7 [/ M' Q% s a9 I! `$ V- K$ _ 以下三个定义:
v1 E! n' f! U$ W 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
( k2 L! X: u1 S6 ^7 C1 h 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
5 q9 m" v; ^1 J 所谓的双方优势策略则是指双方利益总和最大的策略。 # ]$ ~+ e% O6 a' ]/ w
[编辑本段]严格优势策略举例分析+ X, k7 `% W' n q
一、经典的囚徒困境 7 @( `, O9 p) }) {0 d5 d, s: }
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
6 a3 [: \$ @' f3 _ 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
2 I& y! E4 }* e# K3 h7 ` 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ' G5 V' l2 U- s" P5 X# k
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
+ W- c3 f3 @, x% Y6 G1 f% x2 p( H 若二人都互相检举(互相“背叛”),则二人同样判监2年。- U1 `5 C- R& S7 q9 a: q7 o
: b7 E' f* N6 T* H" c用表格概述如下:( Z; F( `: o* o
' F6 H5 J) | J9 v/ L
甲沉默(合作) 甲认罪(背叛)
! ]( y6 Y7 e. D" H+ K乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
; N; T! e( E2 @" Y+ H. y乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
: ~. |( l: Q Y" S) o) c S" f: X6 k: ?# ]6 O
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
' l; P: a7 O: H# u* m 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
2 G& [$ J, S# A5 X: Z) n 若对方沉默、背叛会让我获释,所以会选择背叛。 - R0 j0 ~5 E5 ~9 p8 d
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 + D6 |: z; H; v! T7 U- \: E
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
4 G& K4 X6 s* J2 H 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ) u5 c( |# _7 L% Z, N
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
5 O, c- p: W+ x# F: W: x/ t[编辑本段]二、智猪博弈理论
: f1 q7 J3 }# H' A8 k J7 x 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
: g% B* V% k4 y+ b& }; O& o" s 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 1 Z! A8 P7 j3 V0 J& I) `
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
) d/ Z1 I" }8 k) x6 V d 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
6 L0 ]5 \, i7 X5 S7 ~, F! {3 o “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
4 y0 B% b8 l! z9 l- I& ^5 @ 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 4 C4 j$ Z6 E1 w" k$ q
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
% G/ C8 Q1 M: d 8 |1 _2 ?+ L7 f7 N! L W
三、关于企业价格策略
/ Z* i& @% I% q4 F. K2 R5 M& j
% ^1 `: }9 O5 D) R" O3 ~
) L2 e6 E. h) v5 q9 Q4 b! q$ b( U 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
" W- o7 y1 {) Y! X+ k 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);8 s; U1 M* C4 y4 j7 l3 l, `* u0 Q
以下三个定义:
% C' R/ o' S) f, a 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
& W% s9 ^) w/ C% Y5 E, }3 d 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 4 o4 d$ c" Q/ l6 l) C; ]& h
所谓的双方优势策略则是指双方利益总和最大的策略。
6 F5 ^ w3 w% E: s$ \: g[编辑本段]严格优势策略举例分析
" [; Q E: @9 ?2 c% T3 _+ g 一、经典的囚徒困境
% |% j* M' u; S: }: r# U 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 5 }" T* o/ [) N" W
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
, q' g, X+ w" p+ i" y 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 : y( _8 V5 l$ x- S4 w4 B8 [1 O8 J
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
5 V' R1 n V* [- M 若二人都互相检举(互相“背叛”),则二人同样判监2年。
/ I& J# R6 t5 V" n0 s. A( \7 o
3 Z; v2 P0 y* o3 r用表格概述如下:3 }# R3 ]/ W/ }& e1 }3 V, \6 b k' m7 R
5 z, z9 E6 r" y8 F
甲沉默(合作) 甲认罪(背叛) 0 @- g. E: w7 z( L2 D
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 . P! d) p" u' w( V( e; A
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
V; M4 q- b7 U0 f
% ~. c9 [- N- C2 E- ~ 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
4 c! w4 w! D( {( d5 \ c 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 6 `! y; G, r b1 k1 U9 ^$ @5 }
若对方沉默、背叛会让我获释,所以会选择背叛。
* J9 `) D. K6 U( s! L 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
$ D1 ~ z: Z6 _/ |* [$ f 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
' Q' L b2 q$ f/ X5 S2 I 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
+ w$ ]% ~5 F- b" k6 b* P" b6 n 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
b: c4 J9 s# v) v7 |) ][编辑本段]二、智猪博弈理论
" e& n0 o* B2 O' D 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
& x' P1 v+ T' `- F8 Z4 r- H, g 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
* R; `+ |1 \, S& z# ` 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 ' S. E4 V: W1 }8 ]8 e r, ^
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 ^' E& Z2 ~' U: F% Z% p
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ! M p" h6 z2 y0 L, ?3 s
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
* B# a+ J# p9 s9 e 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。! T) Q. Y# w2 |+ n% c+ r
5 M V2 C0 L6 o5 a
三、关于企业价格策略
! i. V& Y+ m; T+ _2 |
2 S# u/ Z5 H' C+ a, d! j - K% d3 [, f# O5 h2 g, U
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? , r7 ^7 \5 n# e. r1 |+ U
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |