本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 + w& @$ ` ~% S/ R& M
% A( P; D( G. Q
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);' H- Z( a5 R& S
以下三个定义:- F$ t: x1 u5 ?3 E) D
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 5 E! E) T& F8 F. J: b* G8 D% t" l
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
' X5 t7 s% V/ `3 Y 所谓的双方优势策略则是指双方利益总和最大的策略。
: Q4 \1 W8 D, u ^7 b. s6 n0 Q[编辑本段]严格优势策略举例分析
, b% X. U" O4 V3 G 一、经典的囚徒困境 5 B' G% u- `1 `0 w; u9 D6 {/ f& M
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
' H+ i" ]- \# t4 h 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: . l* z; }/ \& n# z/ _1 z; A
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
: U3 ]& Z0 k; A 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 3 X9 F, l) q: U( a6 Z* r" y
若二人都互相检举(互相“背叛”),则二人同样判监2年。
5 V* C- G$ O3 X- d : T; j& i- r7 W- N1 r4 s
用表格概述如下:' w x5 U! c$ D: V, v
$ d6 H0 w$ Q$ w% i _7 Q( ]- w
甲沉默(合作) 甲认罪(背叛) ( x, g. {! Z% [' q+ L/ b) E2 N+ t
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 : j! Y" q7 S" ?5 x$ q$ D; _
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 $ y @) ?$ G8 b' }1 T
. Y* O. M" C6 }
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 . y" L r" c& Z% k: b
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
" C' E" [2 ~& M- s+ ?7 h 若对方沉默、背叛会让我获释,所以会选择背叛。 ( h! m3 D" X9 q* f. ^2 O4 y, ^
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
+ n9 K3 D( `2 Q: y$ g 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 ; ^6 N) J# y& \' `# Z3 k
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 . ]& j. g8 L7 ~
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
( h. U, b0 @! j! R' [- h[编辑本段]二、智猪博弈理论' E: f( r# c9 m2 i7 A4 F0 u" I) y2 r
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
2 M) F3 U$ O I9 X5 g; d( Y 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
3 U5 R' u# _3 x' P# [( C6 C 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
+ h' v! j( L8 l3 Z5 X9 z6 _ 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 % x/ w/ ^7 f. g
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 9 M3 L3 z. y8 f& f4 ^
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 0 s2 {7 h5 z2 ?. ? p. ? v
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
: b0 r' a8 V' c
* n R) d9 v$ P/ b三、关于企业价格策略
, Y" F/ s& _% ?( Y5 n) S8 H. Q& h+ Z
2 E: P7 s! g& d5 ~7 ^ 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ; c5 a, F9 X" t& b6 j0 @
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
% I- z: x2 }; ?) y1 I* p$ B 以下三个定义:
# d( z9 |/ M' r* q$ [ 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
/ F2 Q& G7 s( F" _) Q: @ 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
8 Y: h' ^ F# B3 D$ d 所谓的双方优势策略则是指双方利益总和最大的策略。 # _% v4 I N4 W( p4 W
[编辑本段]严格优势策略举例分析, G- }+ |# Y% x: o7 e7 y ]
一、经典的囚徒困境
0 J0 u8 ^/ h1 Y+ K4 P 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
5 X0 C) g9 z, B2 p" l7 ?! q 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
& }5 y* f2 n7 M/ O$ [8 f 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 9 k' l9 `9 `1 N7 I/ e) ?
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 * R4 h! a& O4 J1 i
若二人都互相检举(互相“背叛”),则二人同样判监2年。
4 w$ D. V* T3 M1 C2 [; N ) l# ?7 ~0 k! [! J
用表格概述如下:/ S z+ w/ I; U# p9 a) j
, I0 Q8 `8 t, {- F& ]9 `7 {
甲沉默(合作) 甲认罪(背叛) 8 v( g2 V0 K5 s) E4 T2 L( w9 a
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 ) H% ~( I7 {! I! d- J3 M3 R
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 $ a1 m( R9 b2 B. M' C& o2 p
0 I4 w* t! |) C, h: N
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
& L+ a2 J" Y1 k2 C4 p5 } 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
6 K j7 O( n' d0 u 若对方沉默、背叛会让我获释,所以会选择背叛。 " O( x' M$ h4 v9 g
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
) ?, C+ @+ Q, G( F$ C0 i 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 ' t! V3 m$ W3 U$ }2 Z
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
! F3 v$ r [; [! q; m1 I 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。2 y1 R4 M7 t3 V
[编辑本段]二、智猪博弈理论 c6 t4 N+ G5 ?0 b
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 1 D1 T! @6 Y2 H9 q3 L5 P8 V
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 9 A- ^: E- P8 W! [- \
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
! Y1 u1 z+ e4 r2 A9 o( B 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 8 d' P; G- E( u/ } h+ t
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 6 t% _4 e) {0 e1 Z$ F: N* m
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
/ T& e( X+ Q: o# ] 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。0 d. j5 C% I# O6 \ ~4 |
! T; \8 |" U$ t V) B7 m# Q$ x
三、关于企业价格策略- f( h+ Q( P0 I, }
+ `4 \4 p. E( W* z* z( }% O9 ^
0 N. s( M0 P) d5 m) _3 M 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
, |* s3 ?- M' X$ u; c$ h. Y 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);" ~ B4 m) u {% e( B" f* Q1 s7 v
以下三个定义:
) G% B" b/ O1 [' {- N 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
% \6 V$ \) k5 C0 Y. B2 p( b 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 ' K7 J+ ~4 q1 B( B+ x
所谓的双方优势策略则是指双方利益总和最大的策略。
8 i& W8 h. A1 T' w3 i[编辑本段]严格优势策略举例分析
5 h0 M A& I3 l 一、经典的囚徒困境
* T" l1 o E9 k. e2 L3 F 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 4 w; g* B5 |5 T* M
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
4 R' O9 \2 i+ t& B5 A* M4 f% } 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 : L) m* o! m* l& h8 r0 n- |6 Z
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
8 t& y; i' ]) ^# G+ v( {) a+ M 若二人都互相检举(互相“背叛”),则二人同样判监2年。$ D8 c7 g/ n, G* C4 G0 ` q+ X) d1 n7 }
0 u2 T9 L( ?7 P$ k# G
用表格概述如下:
* A( p# `3 g7 O& A8 H) c
: `9 s! m w# n 甲沉默(合作) 甲认罪(背叛)
7 G% v. Y& z2 G. Y$ Q) b: s乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
4 C9 S4 f7 V* F9 r, Y: y7 u: y$ j4 V乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
- e* j, | O# \- `8 w- K |/ [$ S9 J
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
9 E! n' C" l9 J+ k6 H( L: g 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
9 l; n8 U- G* G5 ]2 o& { 若对方沉默、背叛会让我获释,所以会选择背叛。 8 E4 x: J; u* j- s' D
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
$ e4 S. b3 R6 V% l/ x 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
7 `4 }" F0 r& I: ~ 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 2 c& A8 Y9 A+ P9 g- l5 x
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
* S; ~" @! D* _/ b8 \[编辑本段]二、智猪博弈理论0 ^" C$ K. V( f+ P
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
& b b0 v7 s, a) E 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ' ?' F& x K4 o
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
3 W# ]6 p8 O' s 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 + p- r. ^. w' O+ g( h6 j
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 + s. ^7 Q% e% |% q l
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 2 K* L5 h2 j' l# k
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。; @/ X9 m9 b/ P n/ i8 d8 Y) T
& v6 a m. w2 C1 c1 l! {三、关于企业价格策略
( @* B% m6 ?" \$ A6 J) D# H6 S" n) I8 y% }/ L, ^
4 X/ x* b. I5 g2 |1 J
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? , `6 Q. Q: ?& I, y' R# B$ L, V
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);8 L" P4 | o, h1 r6 _% m3 w4 |
以下三个定义:
* L* I0 ?7 f* n8 V9 H. { 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 + _% N4 B3 V& T- D7 r& @/ X# z
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 8 p, J% B% r% q/ H
所谓的双方优势策略则是指双方利益总和最大的策略。 " g5 z% K# j$ j5 v; @ _2 ]1 ~$ E
[编辑本段]严格优势策略举例分析" i, v0 c& |0 S* @! n/ v3 t8 `! j+ f2 @
一、经典的囚徒困境
% s! s" W q \9 B% I 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
7 O* m+ k1 T4 c- O; y+ z 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: , K; {- Y$ `1 n/ Z9 H0 X, h5 [
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 6 c3 h5 q* \5 r- E) s' |1 n
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
; z+ z* r7 W4 r5 W) O 若二人都互相检举(互相“背叛”),则二人同样判监2年。
! d' z: l: M- h& n$ N6 k
, w F2 T" d0 j1 e+ |0 o6 E5 a用表格概述如下:+ k4 e, y! M- [+ X( N
2 y8 G( b0 }( ] j" w
甲沉默(合作) 甲认罪(背叛)
# d3 t: ?# e* b, x1 ` Q) w7 C0 C乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
. V7 Q: _8 J# U乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
& e# K: z0 A( j" b6 v2 C; T
4 ~" f, N# O: {/ ]8 M* Z. D 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
% y l2 {2 D( o1 E+ Q0 o8 S 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
4 t; E; B' I5 @" M/ h( @ 若对方沉默、背叛会让我获释,所以会选择背叛。 ) x( K$ x9 X' f
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
3 V9 X1 Q) _# X8 C" K! W 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
6 P+ f' m9 h6 G: _7 h 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 9 r4 E' T. h5 `; E
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
K# P- B: [+ i; E7 @2 e8 X[编辑本段]二、智猪博弈理论$ o9 ^5 M* t; C
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
# j9 K* y5 Z- o: Z) v$ s 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
% Z- P4 u0 V2 @3 G 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
. k* W! }% l9 b 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
7 Q/ s9 i8 m: d! _. {" N “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
# Z; r: s$ N6 e" M. F 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 " j \# c" J' z0 v3 }$ ~
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
; f3 P! ~; @ r3 |/ T: F1 R! [+ F t2 g! a1 N o
三、关于企业价格策略
: k# e% F! C- O" [2 V5 a
% t1 J3 ?. o- v5 r! w# s 4 o# j. ]$ f# z) l2 q" C
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 6 f- u( T. t/ `" N9 |6 T1 c
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |