当前位置:首页 >> 管理学 >>

Games2-How to Find Optimal Strategies


Games and Strategies

? Professor Ho-Mou Wu

Games

Spring 2009

2-0

寻找最佳策略 How to Find Optimal Strategies?
例1:回到电影“美丽心灵”中在酒吧的情景:酒吧中有 一位金发美女与四位褐发美女,John Nash与三个男 同学,想找金发美女搭讪。Nash说如果大家都围向 金发美女,她无法接受任何一位男士,而其它女士 也再也不理会这群研究生 (“cancel one another out”)。 因此,什么是你的最佳策略?

? Professor Ho-Mou Wu

Games

Spring 2009

2-1

抽离与分析
Real World
抽离

Model
假设

A

解释 预测

B
结论

成 ﹁ 若 A 则 B ﹂ 的 命 题
Spring 2009

? Professor Ho-Mou Wu

Games

2-2

John Nash’s Blonde Problem
抽离简化情况成John Nash与另一个同学Lloyd Shapley,而酒吧中有二位褐发美女与一位金 发美女,可如何表为博弈型式?如何找寻最佳 策略?
Shapley 金发 Nash
? Professor Ho-Mou Wu

褐发 10, 5 5, 5
Spring 2009

金发 褐发

0, 0 5, 10
Games

2-3

Simultaneous Moves and Confrontation
例2:1944年盟军选择登陆诺曼底或加莱 (Calais),诺曼 底离核心城市较远,但相对而言登陆失败的损失 较小,盟军的成功就是德军的失败,作为双方统 帅的艾森豪威尔与隆美尔该如何部署主要军力?
德军布署 诺曼底 加莱 美军 诺曼底 加莱 盟军很差报酬 盟军次佳报酬 盟军最佳报酬 盟军最差报酬

? Professor Ho-Mou Wu

Games

Spring 2009

2-4

Simultaneous Moves and Confrontation
例2:将对峙以博弈策略型式 (三要素,抽离的功夫) 表示 如下,如何寻找最佳策略?

德军 诺曼底 美军 诺曼底 加莱 -4, 4 10, -10 加莱 8, -8 -6, 6

? Professor Ho-Mou Wu

Games

Spring 2009

2-5

Capacity and Competitive Strategies
例 3:产能与寡占竞争 1972年美国玉米加工业看到HFCS (High Fructose Corn Syrup) 可用来代替糖,但比糖便宜甚多。预期 未来对HFCS需求大增,十一家主要厂商都打算增 加产能 (capacity),在此寡占产业中如何寻找最适产 能决策?作决定过程中需要考虑那些因素? M. Porter and M. Spence (in The Economics of Information and Uncertainty ed. By J. McCall, 1982, NBER) 应用博弈理论来分析此产业。
2-6

? Professor Ho-Mou Wu

Games

Spring 2009

Capacity and Competitive Strategies
例3:分析架构 (A) 产业的产能 扩充途径 个别厂商的 产能決策 随机需求 与糖价
模型決定价格 利润及产能使用率

各个产能决 策带来的现 金流入
厂商偏好

(B)

道出整个产业的 产能扩充途径
Games

选择最适 产能
Spring 2009

当(A)=(B)时才达到均衡
? Professor Ho-Mou Wu

2-7

Capacity and Competitive Strategies
例 3 寡占产业中厂商决策的分析过程: (1) 找出需求与糖价的各种变化情况 (Scenarios) ; (2) 预期竞争对手的产能决策 (对手产能加总即可) 情 况; (3) 找出厂商本身产能选择的几种方案; (4) 对以上各种变化情况赋予合理的概率; (5) 找出对各种产能方案的报酬,决定本身的最适产 能规模; (6) 取得各厂商的产能决策,再验证是否与(2)的假设 相符合,预期被验证时才达到“均衡”。
? Professor Ho-Mou Wu Games Spring 2009

2-8

Capacity and Competitive Strategies
例 3:Porter and Spence预测结果: 1973 1974 1975 1976 实际产能 预测产能 0.6 0.6 1.0 1.5 1.4 3.5 2.2 3.5 1976 产能总增量 之后 4 9.2(billions of lb.) 0 9.1

实际的调节较慢,但产能总增量还是很接近的。Porter and Spence说明了 Cournot-Model 和纳什均衡在实用上也有相当 价值。
? Professor Ho-Mou Wu Games Spring 2009

2-9

Sales Strategies
例4:1988年三大百货公司 Sears, Kmart 与 WalMart 竞争激烈。Sears 举行多次大减价, 但成效不佳;至1989年 Sears 宣布采用新 的定价策略:“每天都低价”(Everyday Low Prices) 。换言之,Sears 决定维持 稳定价格,价格虽然合理,但比以前 稳定价格 大减价的价格要来得高,请问 Sears 的决 大减价 策是否明智?它的对手又应采何种策略?
2-10

? Professor Ho-Mou Wu

Games

Spring 2009

Sales Strategies
例4:考虑 Sears 与 Wal-Mart 二家百货公司,对同一商品的成 本均为450元,稳定价格600元,大减价时500元。另观察 到每月无信息的消费者有100人,不看报纸不查价格,选 百货公司也完全随机,所以二家可各分得一半。另外, 有信息的120人是会去二家比较价格或等待减价广告,等 到大减价才购买。放入博弈架构可表示如下:

Wal-Mart
稳定价格 稳定价格 7500, 7500 8500, 7500
Games

大减价 7500, 8500 5500, 5500
Spring 2009

Sears
? Professor Ho-Mou Wu

大减价

2-11

Sales Strategies
例4:上图计算背景:
Sears 与对手均采稳定价格,各得50位消费者,二者 均可赚 (600-450) ×50=7500。 任一家大减价而对手未减价可赚 (500-450) ×(50+ 120)=8500,未减价的一家公司仍可赚 (600 – 450) × 50 =7500。 两家都大减价:各賺 (500-450) ×(50+60) =5500。

把这二家对垒的四种情况表示出来就是一个博弈: 有 参赛者,有策略,有报酬。

此时,由矩阵可否找到最适策略?
? Professor Ho-Mou Wu Games Spring 2009

2-12

Simultaneous Moves
例5:棒球赛投手可投快速球与变化球,打击者可以早些 挥棒或慢些挥棒,报酬如下。 什么是各自的最适策略?均衡为何? 投手 快速球 q 早挥棒 p 慢挥棒 1-p 7, -7 -5, 5
Games

变化球 1-q -5, 5 3, -3
Spring 2009

打击者

? Professor Ho-Mou Wu

2-13

博弈形态 博弈形态
完全信息 静态 动态 NE 不完全信息 BNE

SPNE

PBNE

多次重复 Folk Theorem1 Folk Theorem2

? Professor Ho-Mou Wu

Games

Spring 2009

2-14

Noncooperative Games 不合作博弈
NE: Nash Equilibrium (Nash) SPNE: Subgame Perfect NE (Selten) 1994 Nobel Prize BNE: Bayesian NE (Harsanyi) PBNE: Perfect Bayesian NE or Sequential Equilibrium: (Kreps, Wilson, Milgrom, Fudenberg, Tirole, Maskin 等人) 1994: 不合作博弈的架构与均衡观念 2005: 重复的不合作博弈:冲突与合作导向
2-15

? Professor Ho-Mou Wu

Games

Spring 2009

Nobel Prizes
2005 Thomas C. Schelling and Robert Aumann 无名氏定理” “无名氏定理”(Folk Theorem): : 在一定条件下,在多次重复的不合作博弈中,经 由动态奖惩策略的使用,参赛者可能达到双赢 的“合作解”。 T.C. Schelling: Strategic Moves, Credible Threat, Brinkmanship, Focal Point, Strategic Arms Limitation Treaty (SALT). R. Aumann: Folk Theorem with Incomplete Information, Dynamic Arms Control Negotiation, Cooperative Games, Common Knowledge. (赛局高手:P.37, P.126, P.189.)
? Professor Ho-Mou Wu Games Spring 2009

2-16

Nobel Prizes
不完全讯息赛局的应用: 1996 W. Vickrey: 拍卖 (Auctions) J. Mirrlees: 道德风险与诱因(激励)机制 (Moral Hazards and Incentives) 2001 G. Akerlof: 逆向选择 (Adverse Selection) M. Spence: 传递讯号 (Signaling) J. Stiglitz: 信息经济学 (Information Efficiency)
? Professor Ho-Mou Wu Games Spring 2009

2-17

静态完全信息博弈
博弈理论 (Game Theory): 分为策略形式 (Strategic Form) 与扩展形式 (Extensive Form) 两种。 策略形式 (Strategic Form) 包含三要素: 1. 参赛者 i = 1, 2, …,n; 2. 每个参赛者可用的策略(strategy) i = 1, 2, …,n 3. 对应任一参赛者的策略组合 (strategy profile) s = (s1, …, sn) , 各个参赛者所能得到的报酬 (payoffs)。 策略形式表示参赛者同时出招 (Simultaneous Moves) 的竞争形态。 若为两人博弈时 (n = 2),以 (u1, u2) 表示在某一策略组合下两人 (i =1, 2) 之报酬。 参赛者 2 可以矩阵表示之: 策略 A 策略 B 策略 C

参赛者 1
? Professor Ho-Mou Wu

策略 a 策略 b

u1 , u 2
Games Spring 2009

2-18

The Brandenburg-Nalebuff Value Net
Supplier Supplier

Competitor

Firm

Complementor

Customer

Customer (McAfee, Ch.2)

? Professor Ho-Mou Wu

Games

Spring 2009

2-19

Industry Analysis
Six Forces (Brandenberger and Nalebuff) 1. New entrants, 2. Buyer bargaining power, 3. Supplier bargaining power, 4. Substitute products, 5. Rivalry, 6. Complements. Since each strategic decision may involve different elements, we have to reject a one-size-fits-all way of thinking about business strategy and apply the gametheoretic reasoning to each decision.
? Professor Ho-Mou Wu Games Spring 2009

2-20

寻找最佳策略
产 业 环 境
判断博弈 型态 显性合作 合作博弈 隐性合作
瓜分市场: 是否违反“反 托拉斯”法? 达成隐性合作 的条件

阻绝策略 竞争策略 占有率竞争
? Professor Ho-Mou Wu Games

价格 产能 产品线 品牌等

Spring 2009

2-21

Some of the Strategic Variables Chosen by Firms
Product Features and Quality Target of Customers Technological Leadership Research and Development Product Marketing and Positioning Provision of Complementary Goods Brand Identification Geographic Markets Distribution Channels Product Pricing Vertical Integration Cost Reduction Focus Government Relations (McAfee, Ch.1)
? Professor Ho-Mou Wu Games Spring 2009

2-22

策略形式博弈的解法:
1.优势策略均衡 (Dominant Strategy Equilibrium, DSE) 优势策略均衡 优势策略 (dominant strategy) ? is the best response against any action the other player might take. “承认”是囚犯的优势策略 ? 不管对手所采策略为“承认” 或“否认”,任一囚犯承认都可获得较高的报酬。 重复 优 势解法 (Iterated Dominance) ? 逐次删去 劣势策略 (dominated strategy),但对两性战争、钱币配对和飚车问题, 就无法解出。

U D
? Professor Ho-Mou Wu

L 2, 3 1, 1
Games

M 0, 2 2, 7

R 3, 4 4, 5
Spring 2009

2-23

纳什均衡
2. 纳什均衡(Nash Equilibrium, NE) 纳什均衡 ?达到均衡后,任一参赛者均无诱因偏离此一均衡。
(John Nash, 1950) ?另一种解释:当 S1*是对 S2*的最适反应, S2*是对 S1*的最适 反应 (best response) 时, ( S1* , S2* )即为纳什均衡 )即为纳什均衡。
在囚犯困境中,(承认,承认) 也是纳什均衡策略:当对手“承 认”时,自己无任何诱因偏离“承认”之策略。

DSE: I am doing the best I can no matter what you do. You are doing the best you can no matter what I do. NE: I am doing the best I can given what you are doing. You are doing the best you can given what I am doing.
? Professor Ho-Mou Wu Games Spring 2009

2-24

纳什均衡
囚犯困境: 否认 否认 承认 -1, -1 0, -9 承认 -9, 0 -6, -6*

两性战争(Battle of Sexes): 女 球赛 音乐会 球赛 男 音乐会 2,1 0,0 0,0 1,2

DSE=NE 飚车族: 对开 对开 -1 , -1
偏离 0,2

偏离 2,0 1,1

例4
7500 , 7500 7500 , 8500 8500 , 7500 5500 , 5500

? Professor Ho-Mou Wu

Games

Spring 2009

2-25

混合策略纳什均衡
以上考虑的是纯粹策略 (Pure Strategy), 但有些博弈并不具有纯粹策 略均衡。允许混合策略 (Mixed Strategy) 后, 『钱币配对』和『猜拳 博弈』 (如下) 才有解。

q 正面 p 1-p 正面 反面 1 , -1 -1 , 1

1-q 反面 -1 , 1 1 , -1

剪刀 石头 布

剪刀 0,0 1, -1 -1 , 1

石头 -1 , 1 0,0 1 , -1

布 1 , -1 -1 , 1 0,0

混合策略:选取 q 使甲的两种策略的报酬相等:q-(1- q) = - q+(1- q) 同理, Nash定理 (1953) : 若允许混合策略, 而且只考虑参赛者与策略数目均 为有限的博弈, 则任何策略形式博弈必定有一纳什均衡存在。
? Professor Ho-Mou Wu Games Spring 2009

2-26

Sales Strategies
例4:Sears“每天都低价”策略
Wal-Mart 稳定价格 q 大减价 1-q
稳定价格
存在二个纯粹策略纳什均衡,高价低 价并存,但哪一个均衡会发生?

7500, 7500 7500, 8500 ?Sears采稳定价,对手采大减价,对手 p 成长,Sears是否会满意?双方都想 Sears 大减价 找最有利的结果 (8500) ,若Sears更 8500, 7500 5500, 5500 1-p 动策略,可否达成另一均衡?

Wal-Mart ?若Sears长久维持稳定价,待全部人 稳定价格 q 大减价 1-q (包含无信息的100人) 都知道后,这
稳定价格

Sears

p

7500, 7500 0, 11000 11000, 0 5500, 5500

大减价 1-p

样的价格差异是否可以维持下去? 如果消费者都去Wal-Mart,利润下 降到零,像是第二图的报酬,成 “囚犯困境”。
Games Spring 2009

? Professor Ho-Mou Wu

2-27

Sales Strategies
例4:Everyday Low Prices vs. Random Sales 考虑混合策略均衡 Sears 使对手从二种策略所得报酬相等 p × 7500+(1-p)×7500=p ×8500+(1-p)×5500

2 q = ,双方利润均为7500 3 1 此纳什均衡中,Sears 与 Wal-Mart 都采 机会大减价 (1年中共有 3 4个月时间定价500元,其它时间600元):“随机而且出人意料的
大减价”比“每日都低价”固定为600元来得好和稳定,Sears强 调每日都有稳定价格反而放弃了公司可采混合策略 (有时减价) 的 弹性。
? Professor Ho-Mou Wu Games Spring 2009

2 ?P = ,同理 3

2-28

Sales Strategies
例4:(Continued) ? Sears 1998年的失败可能是大减价太过频繁,未采用一适当 的大减价概率。1989至1990年中采一稳定价格(减价频率 又太低)也未增进业绩,于1990年末重回有时减价的策略

?pricing cycles.
? 混合策略均衡利于造成百货业对消费者的“差别取 价”(price discrimination):不查报纸的消费者永远不知哪家 1 当时是最低价,有 机会到一家不减价的百货公司,他们 2 必须付出高价,支持了此种混合策略均衡。
(参见 H.Varian, “A Model of Sales,” American Economic Review, 1980)
? Professor Ho-Mou Wu Games Spring 2009

2-29

理论重点
参考 Osborne Ch.4

? Professor Ho-Mou Wu

Games

Spring 2009

2-30

混合策略 (Mixed Strategies)
? 定义:混合策略 (Mixed Strategy) 混合策略
– 策略形式博弈中,一个参赛者的混合策略 混合策略指赋在 混合策略 该参赛者所有策略行动上的一个概率分布。 – 一般地,用 σ 表示一组混合策略:σ i (ai )表示参与 者 i 的混合策略 σ i 中赋给策略行动 ai 的概率。类 似地,一个参与者的混合策略需要指明对其每个 策略行动赋加的概率 (即随机选择出该策略的概 率)。 – 记参赛者 i 可以取的所有混合策略的集合为 Σi

? 一个混合策略也可能是赋给某个特定策略行动概率1 而其他行动都为 0,此时称这个混合策略为纯策略 纯策略。 纯策略
? Professor Ho-Mou Wu Games Spring 2009

2-31

混合策略纳什均衡 (Mixed Strategy Nash Equilibrium)
? 混合策略纳什均衡的意涵与纯策略纳什均衡相 混合策略纳什均衡 似,只是,在其他人策略下,“采用某策略的 收益”改变为“采用此混合策略下的期望收 益”。
仍然可用两种方式给出定义: –给定一组混合策略,任一参赛者无动机单独偏离
? ? U i (σ i? , σ ? i ) ≥ U i (σ i , σ ?i ) for all σ i ∈ Σi

–任一参赛者的混合策略均是对于其他人混合策略 ? 的最优反应 σ i? ∈ Bi (σ ?i ) for all i
? Professor Ho-Mou Wu Games Spring 2009

2-32

Mixed Strategy Nash Equilibrium: Characterization

? 混合策略可以看成是纯策略行动的线性组合; 而采用策略后的收益也可以类似地考虑:
采用一个混合策略后,该参赛者的期望收益为以 策略中那组概率分布为权值向(在给定其他人的混 合策略下)采取相应(纯)策略行动时的期望回报作 加权平均。 即:
U i (σ ) =
ai ∈Ai

∑ σ (a ) ? E (a , σ
i i i i

?i

)

? Professor Ho-Mou Wu

Games

Spring 2009

2-33

Mixed Strategy Nash Equilibrium: Characterization
? 前面的考虑方法可以给我们带来判断和寻找混合策 略纳什均衡的如下方法: 一个混合策略组合 σ ? 是纳什均衡的充要条件为:
? – 给定σ ?i ,采用 σ i? 中任何的为正的概率项所对应的策略行 动,参与者 i 期望收益均相同; ? – 给定 σ ?i ,采用 σ i? 中任何的为零的概率项所对应的策略行 动,参与者 i 不能有更多的期望收益 (不多于正概率项对 应策略的期望收益)。

而在均衡下每个参与者的收益,就等于他在其均衡策略 中任一正概率项对应的策略行动中能够得到的期望收益。
? Professor Ho-Mou Wu Games Spring 2009

2-34


相关文章:
更多相关标签: