会员书架
首页 > 游戏竞技 > 博弈的策略式表述 > 第3部分

第3部分(第1/4 页)

目录
最新游戏竞技小说: 刚穿越就被四百斤的女人退婚王者:救命!是谁教他打王者的!正经在人间打酱油上古卷轴:永恒之神第二世界的我们接手湖人从老詹4万分开始穿越兽世后凭借医术躺赢了我在游戏里出不去了王者:我的中路爆杀全场冷青衫新书妖魔降临?龙国十亿玩家夹道欢迎CSGO教练我想学白给我就不是主教练那个料NBA:板凳皇帝网游之无敌盾战网游:武林巅峰之路游戏降临,首杀公告刷屏全网!网游之统一全球异界领主:从建筑奇迹开始全民求生:我是地窟第一猛男

你会说,这个拍卖的规则不合理,纯粹是博弈论专家的构想,在实际中这样的拍卖不会出现。然而,它尽管只是一个模型,在实际中我们经常会看到此模型的博弈案例。3

在冷战期间,美苏为争夺霸权拼命发展武器,无论是原子弹、氢弹等核武器的研制,还是如隐形战斗机这样的常规武器的研制,双方均不甘落后。20世纪80年代,里根在位时准备启动“星球大战”计划,此举意味着两个超级大国的武器竞赛将进一步升级。美苏之间的武器竞赛就相当于这个骑虎难下博弈中双方轮番出价,双方均不断出更高的价,如果一方没有出最高的价钱,退了下来,即没有继续竞赛下去,那么意味着它在军备上的前期投入没有效果,打了水漂,而对方将赢得整个局面。但如果继续竞赛下去,一旦支撑不住,损失也就更大。

1991年苏联的垮台在一定程度上是军备竞赛的结果。苏联将整个力量放在军备竞赛上,而民用建设无法跟上,国力不济,最终退下阵来。里根的“星球大战”计划其目的就是要拖垮苏联。一旦进入骑虎难下的博弈,及早退出是明智之举,然而当局者往往做不到,这就是所谓当局者迷。这种骑虎难下的博弈经常出现在国家之间,也出现在企业或组织之间,当然个人之间也经常碰到。20世纪60年代,美国介入越南就是一个骑虎难下博弈。赌红了眼的赌徒输了钱还要继续赌下去以希望返本,也是骑虎难下博弈,其实,赌徒进入赌场开始赌博时,他已经进入了骑虎难下的状态,因为,赌场从概率上讲必定赢。4

博弈论专家将这里的骑虎难下博弈称为协和谬误。20世纪60年代,英国和法国政府联合投资开发大型超音速客机,即协和飞机。该种飞机机身大、设计豪华并且速度快。但是,英法政府发现:若继续投资开发这样的机型,花费会急剧增加,并且还不清楚这样的设计定位能否适应市场;而若停止研制,以前的投资将付诸东流。随着研制工作的深入,他们更是无法作出停止研制工作的决定。协和飞机最终研制成功,但因飞机的缺陷(如耗油大、噪音大、污染严重等等),它不适合市场,最终被市场淘汰,英法政府为此蒙受很大的损失。在这个研制过程中,如果英法政府能及早放弃飞机的开发工作,会使损失减少,但他们没能做到。

4.警察与小偷的故事——混合策略问题

纳什在《n人博弈的均衡点》这篇论文中,给出了均衡存在的简单证明,纳什说,在n个人的博弈中至少存在一个均衡,在这点上双方均不愿意先改变策略。这里的均衡点有可能是混合策略点。人们称它为纳什定理。

什么是混合策略?

我们来看一个混合策略的例子。警察部门负责一城市中某一区的治安。警察要对该区的A、B两地进行巡逻。假定该区有一群小偷,要实施偷盗。警察要防止这些小偷的偷盗,但因为设备有限,只有一部警车,警察只能一次在一个地方巡逻。而对于小偷而言,他们也只能去一个地方。假定A地需要保护的财产价值为2万元,B地的财产价值为1万元。若警察在某地进行巡逻,而小偷也选择了去该地,因警察在场,小偷无法偷盗该地的财物;若警察没有去某地巡逻而小偷选择了去该地,则小偷偷盗成功。警察怎么巡逻才能使效果最好?

一个明显的做法是,警察对A地进行巡逻,小偷去B地,这样,警察可以保住2万元的财产不被偷窃,而小偷的稳定收益为1万元。但是这种做法是警察的最好做法吗?警察有没有比这种策略更好的策略?

我们可以将警察与小偷之间的这个支付写成如下的支付矩阵。警察巡逻某地,偷盗者在该地无法实施偷盗,假定此时小偷的得益为0(没有收益),此时警察的得益为3(保住3万元)。

这个博弈也是常和博弈,它没有纯策略纳什均衡点,而有混合策略均衡点。这个混合策略均衡点下的策略选择是每个参与人的最优(混合)策略选择。

小偷(1)

警察

袭击A地

袭击B地

巡逻A地

3,0

2,1

巡逻B地

1,2

3,0 对于这个例子,警察的一个更好的策略是,警察用掷骰子的方法决定去A地还是B地。假定警察规定掷到1—4点去A地,掷到5、6两点去B地,这样警察有2/3的机会去A地进行巡逻,1/3的机会去B地。

而小偷的最优选择是:以同样掷骰子的办法决定去A地还是去B地偷盗

目录
任是无情也有情极品坏公子古玉重生异族入侵,作为食材居然还打人了擂战抢了男主的爽文剧本
返回顶部