关灯
《文稿,还能这样写》作者雄文《笔杆子碎语》作者王一端《机关文稿写作入门》作者杨新宇《机关文字工作五十讲》作者何新国
最新《公文写作培训课程》直播间《公文写作百法例讲》作者房立洲老秘网站长、《老秘笔记》作者老猫《公文高手的自我修养》作者胡森林
开启左侧

人生有许多无耐

[复制链接]
lzqggg 发表于 2015-12-31 11:31:17 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
 
公文写作培训班
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑   h0 h. `  F4 c1 @* o
- ?' j; ]& r; k
严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);2 n/ @2 }& O, T% \
  以下三个定义:
3 q2 U& }) j0 d  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。   z4 ?- s; Y- F# W+ S! N
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 " y" P. g2 `8 K+ K5 @- Q3 `" I% f
  所谓的双方优势策略则是指双方利益总和最大的策略。  * q2 M2 G3 C" t! `
[编辑本段]严格优势策略举例分析8 @6 S# Z! W; x, b  q& {
  一、经典的囚徒困境
1 E) z9 Z8 n) V+ {, D  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
- ~- Z+ m: r  P  a, w8 U  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
) M* c. C7 V& f/ ?/ }7 T( {/ O  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 & s3 w  _! |5 t5 {8 N
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 7 z" `0 T; l3 C" C- P+ T8 c: V: L
  若二人都互相检举(互相“背叛”),则二人同样判监2年。
+ b8 g/ R7 n5 y) D0 i/ \( R  
; i- Q3 r8 B$ `: t2 X/ b5 z用表格概述如下:6 }. C% a# I/ T& F
3 ?" b; w1 j. `
    甲沉默(合作)  甲认罪(背叛)  5 _) ]) M2 z3 c
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
/ r0 }) r* F! i乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  * z: Y( |% l6 b, J- P, ]1 t

4 C, i( X) K: \8 L7 @+ Q  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 % L6 d, @8 F- o2 l; C5 N
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
+ a, n. E6 Q) P7 S' G3 C5 N1 [  若对方沉默、背叛会让我获释,所以会选择背叛。
' B$ S5 d: {* q# [  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
& \0 O" `! `5 d' f6 C  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
7 z  w" x/ i+ n  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
& E2 y/ p1 t4 j+ Z; T  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
  z/ ?/ T, b' {5 b7 o9 ^0 T[编辑本段]二、智猪博弈理论
& n, T- y: m- f7 H6 M2 k  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
# d9 ]8 N9 l* ~  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
; M. g( O/ d; h$ t  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 4 H1 H& O4 I6 H& i2 ]( ?
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 0 s0 Z& Q* ]7 u8 M8 Y4 o
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ! o/ o0 Q/ O; J. q. m
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 0 O  j- k' P) `. G
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
% m5 D% r0 R) X$ q7 t6 d  
& i6 I) W" V" u. n, l三、关于企业价格策略
2 B! Y9 H' `0 K/ _' B
( @) ^4 z% ^" p$ _8 {  
2 M1 J# X; J/ u% y9 x! I, r* y  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
! q: G2 Q( b( B  q) [  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
) J  Y; ~9 q7 c, l9 H  以下三个定义:: T) _2 l3 u4 G  }5 q# S" a
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
' j/ }& q# j' h) Z1 c  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 1 \+ \  v9 {* c/ e( L+ Q
  所谓的双方优势策略则是指双方利益总和最大的策略。  
  j2 X% y7 A' I[编辑本段]严格优势策略举例分析; m/ Z4 o3 C2 d7 {; O* ]: e
  一、经典的囚徒困境
9 J% Y4 j, G/ q; s9 Q* F' A  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: " y- |$ ~* r  T7 E' W& w, J1 L
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 1 v7 x  u3 b6 R4 H
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 % a$ x3 a5 O4 @- O
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
  O! V: l/ Q+ V6 r! N! s9 c  若二人都互相检举(互相“背叛”),则二人同样判监2年。
6 A5 R' W$ z' ?+ ?: c  
) Q- F; h4 w+ v! s用表格概述如下:) \4 G% i5 X4 o2 O4 K$ a+ _
) `2 Z: K: s0 Y) B- W7 A
    甲沉默(合作)  甲认罪(背叛)  
! O0 P+ e/ k+ y$ a乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
- Q8 z6 j# q( D& I" E6 j乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
: D6 y3 u8 q- M# |+ ^+ `( |' M1 Q* q& j
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ; N# V4 }# N+ P
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 7 w2 }2 Q8 m5 K& O8 k) E
  若对方沉默、背叛会让我获释,所以会选择背叛。 4 X4 K; `1 S+ ~
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
7 A# |. Z- v0 Z. G+ ^& P  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
# g6 O6 c5 a# k/ Z- Z  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
5 u5 i& @& f4 @! k  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
) W9 h8 x, q+ M* M' Z) c3 I! s+ Z[编辑本段]二、智猪博弈理论# ]8 \" V& ^! [: i5 L
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
' v& g" b  J  `0 x& B  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
3 W' l# G1 m- D9 [5 z  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
/ j. b* P5 y5 b  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
8 Q( X  P) u# G, ]2 x) V  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 8 W* W" g0 c9 [6 S0 r$ P( a
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
; k- y; K5 q* P- Y  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。  E" B' g+ f( w( F6 C% j6 R7 v) @) H
  
2 J. d! h+ B3 z4 |1 P. u" c1 f! q三、关于企业价格策略
: a5 F' Y# C3 a2 R2 _' q+ v: c# m, U" B* A% ]* L
  
- }# v+ Q5 K" g# r, h  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? " x- n3 t: `/ V* F% [2 L
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
; B7 [/ M' Q% s  a9 I! `$ V- K$ _  以下三个定义:
  v1 E! n' f! U$ W  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
( k2 L! X: u1 S6 ^7 C1 h  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
5 q9 m" v; ^1 J  所谓的双方优势策略则是指双方利益总和最大的策略。  # ]$ ~+ e% O6 a' ]/ w
[编辑本段]严格优势策略举例分析+ X, k7 `% W' n  q
  一、经典的囚徒困境 7 @( `, O9 p) }) {0 d5 d, s: }
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
6 a3 [: \$ @' f3 _  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
2 I& y! E4 }* e# K3 h7 `  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ' G5 V' l2 U- s" P5 X# k
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
+ W- c3 f3 @, x% Y6 G1 f% x2 p( H  若二人都互相检举(互相“背叛”),则二人同样判监2年。- U1 `5 C- R& S7 q9 a: q7 o
  
: b7 E' f* N6 T* H" c用表格概述如下:( Z; F( `: o* o
' F6 H5 J) |  J9 v/ L
    甲沉默(合作)  甲认罪(背叛)  
! ]( y6 Y7 e. D" H+ K乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
; N; T! e( E2 @" Y+ H. y乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
: ~. |( l: Q  Y" S) o) c  S" f: X6 k: ?# ]6 O
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
' l; P: a7 O: H# u* m  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
2 G& [$ J, S# A5 X: Z) n  若对方沉默、背叛会让我获释,所以会选择背叛。 - R0 j0 ~5 E5 ~9 p8 d
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 + D6 |: z; H; v! T7 U- \: E
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
4 G& K4 X6 s* J2 H  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ) u5 c( |# _7 L% Z, N
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
5 O, c- p: W+ x# F: W: x/ t[编辑本段]二、智猪博弈理论
: f1 q7 J3 }# H' A8 k  J7 x  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
: g% B* V% k4 y+ b& }; O& o" s  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 1 Z! A8 P7 j3 V0 J& I) `
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
) d/ Z1 I" }8 k) x6 V  d  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
6 L0 ]5 \, i7 X5 S7 ~, F! {3 o  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
4 y0 B% b8 l! z9 l- I& ^5 @  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 4 C4 j$ Z6 E1 w" k$ q
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
% G/ C8 Q1 M: d  8 |1 _2 ?+ L7 f7 N! L  W
三、关于企业价格策略
/ Z* i& @% I% q4 F. K2 R5 M& j
% ^1 `: }9 O5 D) R" O3 ~  
) L2 e6 E. h) v5 q9 Q4 b! q$ b( U  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
" W- o7 y1 {) Y! X+ k  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);8 s; U1 M* C4 y4 j7 l3 l, `* u0 Q
  以下三个定义:
% C' R/ o' S) f, a  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
& W% s9 ^) w/ C% Y5 E, }3 d  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 4 o4 d$ c" Q/ l6 l) C; ]& h
  所谓的双方优势策略则是指双方利益总和最大的策略。  
6 F5 ^  w3 w% E: s$ \: g[编辑本段]严格优势策略举例分析
" [; Q  E: @9 ?2 c% T3 _+ g  一、经典的囚徒困境
% |% j* M' u; S: }: r# U  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 5 }" T* o/ [) N" W
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
, q' g, X+ w" p+ i" y  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 : y( _8 V5 l$ x- S4 w4 B8 [1 O8 J
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
5 V' R1 n  V* [- M  若二人都互相检举(互相“背叛”),则二人同样判监2年。
/ I& J# R6 t5 V" n0 s. A( \7 o  
3 Z; v2 P0 y* o3 r用表格概述如下:3 }# R3 ]/ W/ }& e1 }3 V, \6 b  k' m7 R
5 z, z9 E6 r" y8 F
    甲沉默(合作)  甲认罪(背叛)  0 @- g. E: w7 z( L2 D
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  . P! d) p" u' w( V( e; A
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
  V; M4 q- b7 U0 f
% ~. c9 [- N- C2 E- ~  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
4 c! w4 w! D( {( d5 \  c  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 6 `! y; G, r  b1 k1 U9 ^$ @5 }
  若对方沉默、背叛会让我获释,所以会选择背叛。
* J9 `) D. K6 U( s! L  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
$ D1 ~  z: Z6 _/ |* [$ f  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
' Q' L  b2 q$ f/ X5 S2 I  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
+ w$ ]% ~5 F- b" k6 b* P" b6 n  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
  b: c4 J9 s# v) v7 |) ][编辑本段]二、智猪博弈理论
" e& n0 o* B2 O' D  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
& x' P1 v+ T' `- F8 Z4 r- H, g  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
* R; `+ |1 \, S& z# `  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 ' S. E4 V: W1 }8 ]8 e  r, ^
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。   ^' E& Z2 ~' U: F% Z% p
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ! M  p" h6 z2 y0 L, ?3 s
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
* B# a+ J# p9 s9 e  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。! T) Q. Y# w2 |+ n% c+ r
  5 M  V2 C0 L6 o5 a
三、关于企业价格策略
! i. V& Y+ m; T+ _2 |
2 S# u/ Z5 H' C+ a, d! j  - K% d3 [, f# O5 h2 g, U
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? , r7 ^7 \5 n# e. r1 |+ U
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


0关注

14粉丝

9帖子

排行榜
作者专栏

关注我们:微信订阅号

官方微信公众号

客服个人微信号

全国服务热线:

0595-22880819

公司地址:泉州秘途文化传媒有限公司

运营中心:福建省泉州市

Email:506070961#qq.com

Copyright   ©2015-2025  老秘网 责任编辑:释然Powered by©Discuz!技术支持:秘途文化  备案号   ( 闽ICP备19022590号-1 闽公网安备35050302000919号 )